Koreanisch-Genom-Projekt-Daten für die öffentliche Nutzung freigegeben

Ein team von Forschern mit angeschlossenen Mitglieder mit einer großen Anzahl von Institutionen in Korea, zwei in den USA und eine in Großbritannien veröffentlicht Daten aus der ersten phase der koreanischen Genom-Projekt (Korea1K). In Ihrem Papier veröffentlicht in der Zeitschrift Science die Fortschritte, die die Gruppe stellt fest, dass die Daten enthalten Informationen zur Beschreibung 1,094 ganze Genome zusammen mit 79 quantitative klinische Merkmale.

Korea1K ist die größte Genom-Sequenzierung-Projekt durchgeführt, bislang in Süd-Korea—es begann im Jahr 2006, und wurde unterstützt von einer Reihe von Quellen da, die Zeit. Ihr Ziel ist, zu sammeln, zu analysieren und zu verteilen koreanischen Genom-Informationen für den Einsatz in klinischen und ethnographische Studien. Eine der wichtigsten Verwendungen der Daten wird erwartet, dass im Bereich der Krebsforschung.

In der ersten Phase des Projektes, 1,094 ganze Genome wurden sequenziert, mit einer durchschnittlichen Tiefe von 31x. Die Daten für die einzelnen sequenzierten Genoms wurde gepaart mit 79 assoziierte Eigenschaften von der person, deren Genom komplett sequenziert wurde. In Ihrem Papier, das team highlights Bemerkenswerte details der Daten.

Einige Beispiele von bemerkenswerten details: Dreißig-neun Millionen Einzel-Nukleotid-Varianten und indels identifiziert wurden, von denen die Hälfte waren doubletons oder singletons. Die Forscher fanden auch, dass es besser war imputation Genauigkeit mit Korea1K als es hatte schon mit dem 1000-Genome-Bedienfeld, um ein herausfiltern der Krebs Proben effektiver. Sie bemerken auch, dass 1,007 der Genome sequenziert, die als Teil des Projekts wurden neu generiert und diese Informationen in den Daten enthalten Charakterisierungen von indels, SNVs, transponierbaren element-Insertionen, copy number-Varianten und des humanen-Leukozyten-antigen-Typen, die bereits im Vergleich mit Daten aus anderen Populationen.