Die DNA ist wie eine Perlenkette auf kleinstem Raum. Seit Jahrzehnten erforschen wir die Abfolge dieser Perlen: die Basen A, T, C und G, die den genetischen Code bilden. Entscheidend ist jedoch, wie sich diese Kette faltet. Die Schleifen, Faltungen und dreidimensionalen Strukturen bestimmen, welche Gene aktiv sind und welche inaktiv bleiben. MIX-HIC è das erste multimodale Modell der künstlichen Intelligenz Das kann diese verborgene Architektur lesen. Ja, genau, das 3D-Genom. Es tut dies durch die Integration zweier Arten von Informationen: Karten, die zeigen, welche DNA-Abschnitte räumlich aneinandergrenzen (Hi-C genannt), und chemische Signale, die anzeigen, wo die DNA zugänglich ist (epigenomische Signaturen). Was bedeutet das? Schauen wir uns das gemeinsam in Ruhe an.
Das 3D-Genom ist kein Detail, sondern der Mechanismus.
Eine Leberzelle und ein Neuron besitzen die gleiche DNA. Dennoch erfüllen sie völlig unterschiedliche Funktionen. Das Geheimnis liegt nicht in der Reihenfolge. aber in der Form. Wenn DNA eine ChromatinschleifeChromatinschleifen bringen weit voneinander entfernte Genombereiche einander näher. Sie fungieren wie eine molekulare Brücke zwischen einem Schalter und dem Gen, das sie steuern sollen. Die Form der Schleife ist der Schalter. Bildet sich die Schleife nicht, bleibt das Gen inaktiv. Bildet sie sich an der falschen Stelle, wird es aktiviert, obwohl es nicht aktiv sein sollte.
Die Erforschung des 3D-Genoms glich bisher dem Zusammensetzen eines Puzzles aus Teilen verschiedener Kisten. Wissenschaftler hatten die Kontaktkarten von DNA, die zeigt, welche Regionen sich im Raum berühren. Sie hatten auch die epigenomische SpurenDiese Daten zeigen, wo die DNA „offen“ ist und gelesen werden kann. Sie wurden jedoch separat mit Methoden analysiert, die auf spezifische Aufgaben spezialisiert waren. Dadurch ging das Gesamtbild verloren.

MIX-HIC lernt zwei Sprachen und die Nuancen beider.
Das Team vonHongkong Universität für Wissenschaft und Technologie hat ein System entwickelt, das den Ansatz grundlegend verändert. MIX-HIC wurde an über 1,2 Millionen gepaarte Proben Hi-C-Karten und epigenomische Signaturen: der größte jemals für die 3D-Genomforschung erstellte Datensatz. Die Architektur ist raffiniert: Das System führt die verschiedenen Datentypen nicht einfach zusammen. Es lernt, sowohl die gemeinsamen Merkmale beider Modalitäten als auch die jeweils einzigartigen Merkmale zu erkennen. Es ist wie ein Übersetzer, der nicht nur zwei Sprachen beherrscht, sondern auch kulturelle Nuancen versteht.
In Tests übertraf MIX-HIC alle bestehenden Methoden in drei Schlüsselaufgaben. zuerst: Vorhersagen, wie sich die DNA in verschiedenen Zelltypen dreidimensional organisiert, mit Verbesserungen bis zu 9,3% im Vergleich zu den besten Vorgängersystemen. An zweiter Stelle: Chromatinschleifen mit beispielloser Präzision identifizieren. Drittens: Vorhersage der Genaktivität – eine wichtige Information zum Verständnis der Zellfunktion.
Wenn Daten fehlen, stellen Sie sich vor
Hi-C-Daten sind teuer und schwer zu beschaffen. Oft fehlen sie. MIX-HIC löst auch dieses Problem: Dank seines umfassenden Trainings kann das System sich vorstellen, wie das 3D-Genom organisiert wäre, selbst wenn nur epigenomische Spuren vorliegen. Es ist wie ein Detektiv, der einen Tatort mit wenigen Anhaltspunkten rekonstruiert und dabei auf Tausende von Fällen zurückgreift. Dieser Ansatz der „einheitlichen Semantik“ ermöglicht es dem System, Lücken in den experimentellen Daten zu schließen und gleichzeitig die Genauigkeit seiner Vorhersagen zu gewährleisten. Natürlich ist menschliche Überwachung erforderlich – es ist kein Orakel von Delphi –, aber die Zeitersparnis ist enorm.
Krankheiten sind nicht einfach nur fehlerhafte Sequenzen.
Viele Krankheiten (von Krebs bis hin zu seltenen genetischen Störungen) werden nicht durch einfache Fehler in der DNA-Sequenz verursacht, sondern durch Probleme in der Organisation des dreidimensionalen Genoms. Ein für die Tumorsuppression wichtiges Gen kann beispielsweise „abgeschaltet“ sein, weil die dreidimensionale Struktur den Zugang regulatorischer Faktoren zu ihm verhindert. Oder eine Mutation verändert nicht direkt ein Gen, sondern vielmehr eine Chromatinschleife, die es indirekt steuert.
Mit MIX-HIC können Forscher nun das 3D-Genom bestimmter Patienten analysieren, um diese strukturellen Probleme zu identifizieren. Dies ebnet den Weg für präzisere Diagnosen: Genau zu verstehen, was mit der DNA-Organisation eines Patienten nicht stimmt. Und gezielte Therapien, die nicht nur berücksichtigen, welche Gene mutiert sind, sondern wie die gesamte genomische Architektur verändert ist. Wie es bereits bei der personalisierten Ernährung der Fall ist., wo Genomik und KI die Art und Weise, wie wir uns um unsere Gesundheit kümmern, revolutionieren.

3D-Genom: Verstärkt Fähigkeiten, ersetzt sie nicht
Das System beschleunigt die Grundlagenforschung: Anstatt für jeden Zelltyp aufwendige und kostspielige Experimente durchzuführen, können Forschende mit MIX-HIC Tausende von Szenarien virtuell erkunden und die vielversprechendsten für Labortests identifizieren. Es ist ein Werkzeug, das den Zugang zur Präzisionsgenomik demokratisiert und sie schneller und kostengünstiger macht. Die zur Modellierung dieser schwachen Signale entwickelten Methoden lassen sich auch in der Astronomie, der planetaren Verteidigung und der Überwachung der Auswirkungen menschlicher Technologie auf unsere Weltraumumgebung einsetzen.
MIX-HIC ist ein Beispiel dafür, wie künstliche Intelligenz die menschlichen Fähigkeiten in der wissenschaftlichen Forschung erweitern kann. Sie ersetzt Wissenschaftler nicht, sondern bietet ihnen ein Werkzeug, um eines der komplexesten Rätsel der Biologie zu entschlüsseln: wie die dreidimensionale Struktur unseres Genoms die Symphonie des zellulären Lebens orchestriert.
Und wenn die Musik verstimmt ist, kann er uns vielleicht sagen, was wir tun können, um sie wieder in Harmonie zu bringen.
