Der erste Entwurf des menschlichen Genoms war vor genau 20 Jahren veröffentlicht. Die Fertigstellung dauerte fast drei Jahre und kostete fast eine Milliarde Dollar. Das Projekt Menschliche DNA es hat es Wissenschaftlern ermöglicht, die 3 Milliarden Basenpaare der DNA (oder "Buchstaben"), die einen Menschen biologisch definieren, fast von einem Ende zum anderen zu lesen.
Es war ein epochales Unterfangen. Dieses Projekt ermöglichte es einer neuen Generation von Forschern, sich zu identifizieren neue Ziele für die Krebsbehandlungentwickelt Mäuse mit menschlichem Immunsystem und sogar einen bauen Webseite Hier können Sie durch das gesamte menschliche Genom navigieren, als wäre es Google Maps.
Das erste vollständige menschliche Genom wurde aus einer Handvoll anonymer Spender generiert. Ziel war es, ein Referenzgenom zu produzieren, das mehr als ein einzelnes Individuum repräsentiert. Wie erwartet war es nicht genug zu verstehen die große Vielfalt menschlicher Populationen auf der ganzen Welt. Keine zwei Menschen sind gleich und keine zwei Genome sind gleich. Wenn Forscher die Menschheit in ihrer ganzen Vielfalt genauer verstehen wollten, würde ein einziges menschliches Genom nicht ausreichen.
Tausende oder Millionen von ihnen müssten sequenziert werden: und genau das ist der Zweck eines derzeit laufenden Projekts.
Genetische Vielfalt verstehen

Der Reichtum an genetischer Vielfalt unter Menschen macht jeden Menschen einzigartig. Genetische Veränderungen verursachen aber auch viele Krankheiten und machen einige Gruppen von Menschen anfälliger für bestimmte Krankheiten als andere.
Zum Zeitpunkt des Humangenomprojekts sequenzierten die Forscher auch das gesamte Genom einfacher Organismen wie z Mäuse , Fruchtfliegen , Hefe e einige Pflanzen . Die enormen Anstrengungen, die unternommen wurden, um diese ersten Genome zu erzeugen, haben zu einer Revolution in der Technologie geführt, die zum Lesen von Genomen erforderlich ist. Eine Technologie, die so weit fortgeschritten ist, dass es heute nicht Jahre und Millionen von Euro dauert, ein gesamtes menschliches Genom zu sequenzieren. Jetzt dauert es ein paar Tage und kostet weniger als tausend Euro.
Tausende von Genomen
Fortschritte in der Technologie haben es Wissenschaftlern ermöglicht, das gesamte Genom von Tausenden von Individuen aus der ganzen Welt zu sequenzieren. Initiativen wie die Genomaggregationskonsortien Sie unternehmen große Anstrengungen, um diese verstreuten Daten zu sammeln und zu organisieren. Bisher konnte diese Gruppe fast 150.000 Genome sammeln. In diesem Datensatz fanden die Forscher mehr als 241 Millionen Unterschiede in den Genomen von Menschen, mit durchschnittlich einer Variante alle acht Basenpaare .
Die meisten dieser Variationen sind sehr selten und haben keine Auswirkungen auf eine Person. Darunter verbergen sich jedoch Varianten mit wichtigen physiologischen und medizinischen Konsequenzen. Beispielsweise prädisponieren einige Varianten des BRCA1-Gens bestimmte Gruppen von Frauen, wie z. B. aschkenasische Juden. zu Krebs zu Eierstöcke und Brüste. Andere Varianten in diesem Gen tragen einige Nigerianische Frauen erfahren eine höhere Sterblichkeit als normal für Brustkrebs.
Wie können diese Varianten des menschlichen Genoms identifiziert werden?
Der beste Weg, wie Forscher diese Arten von Varianten auf Bevölkerungsebene identifizieren können, sind Studien, die die Genome großer Gruppen von Menschen mit einer Kontrollgruppe vergleichen. Aber die Krankheiten sind kompliziert. Der Lebensstil, die Symptome und die Zeit bis zum Einsetzen einer Person können sehr unterschiedlich sein, und die Wirkung der Genetik auf viele Krankheiten ist schwer zu unterscheiden. Die Vorhersagekraft der aktuellen Genomforschung ist zu gering, um viele dieser Effekte auszuschließen, weil Es gibt nicht genügend Genomdaten .
Das Verständnis der Genetik komplexer Krankheiten, insbesondere derjenigen, die mit genetischen Unterschieden zwischen ethnischen Gruppen zusammenhängen, ist im Wesentlichen ein Big-Data-Problem. Und Forscher brauchen mehr Daten. Viel mehr Daten.
1.000.000 Genome

Um dem Bedarf an mehr Daten gerecht zu werden, haben die National Institutes of Health ein Programm namens aufgerufen All of Us . Das Projekt zielt darauf ab, genetische Informationen, Krankenakten und Gesundheitsgewohnheiten aus Umfragen und tragbaren Geräten zu sammeln von über einer Million Menschen in den Vereinigten Staaten im Laufe von 10 Jahren. Es wurde 2018 für die Öffentlichkeit geöffnet und seitdem haben mehr als 270.000 Menschen Proben beigesteuert.
Das große Potenzial dieses Projekts liegt in der Möglichkeit, Forschung zu betreiben, indem die unterschiedlichsten Daten gekreuzt werden. Ein Neurowissenschaftler könnte nach genetischen Variationen suchen, die mit Depressionen verbunden sind, indem er beispielsweise das Trainingsniveau berücksichtigt. Ein Onkologe könnte aufgrund ethnischer Unterschiede nach Varianten suchen, die mit dem Hautkrebsrisiko zusammenhängen.
Mit einer Million menschlicher Genome werden wir über eine außergewöhnliche Fülle von Daten verfügen, um die Auswirkungen der genetischen Variation auf Krankheiten zu entdecken, nicht nur für Einzelpersonen, sondern auch innerhalb verschiedener Gruppen von Menschen.
Der dunkle Wald des menschlichen Genoms

Ein weiterer Vorteil dieses Projekts besteht darin, dass Wissenschaftler Teile des menschlichen Genoms kennenlernen können, die derzeit nur sehr schwer zu untersuchen sind. Der größte Teil der genetischen Forschung befasste sich mit den Teilen des Genoms, die für Proteine kodieren. Diese repräsentieren jedoch nur die1,5% des menschlichen Genoms.
Eine vielversprechende Forschungsarbeit konzentriert sich auf RNA, ein Molekül, das die in der DNA einer Person kodierten Botschaften in Proteine umwandelt. RNAs, die aus 98,5% des nicht proteinproduzierenden menschlichen Genoms stammen, haben jedoch eine Vielzahl anderer Funktionen. Einige dieser ANNs sind an Prozessen wie dem beteiligt Weg in welcher Krebs verbreitet sich , embryonale Entwicklung oder Kontrolle des X-Chromosoms bei Frauen. Da das All-of-Us-Projekt alle kodierenden und nicht-kodierenden Teile des Genoms umfasst, wird es bei weitem der größte verfügbare Datensatz sein, um Licht in diese mysteriösen RNAs zu bringen.