Ein Deep-Learning-Modell der künstlichen Intelligenz (KI) kann fehlende Wörter, Fragmente und Sätze von bis zu 4500 Jahre alten Keilschrifttafeln vorhersagen.
Mit Keilschrifttext in akkadischer Sprache beschriftete Tontafeln sind wichtige Werkzeuge zum Verständnis der Kulturen, die in Mesopotamien (ungefähr dem Gebiet des heutigen Irak) zwischen 2500 v. Chr. und 100 n. Chr. existierten. Viele dieser Tafeln sind es angesichts ihres Alters Beschädigte und fehlende Schlüsselstellen des Textes. Der Informatiker Gabriel Stanowski Die Hebrew University of Jerusalem und Kollegen aus verschiedenen Abteilungen haben zusammengearbeitet, um künstliche Intelligenz zu nutzen und die Geheimnisse dieser Platten zu lüften, indem sie den fehlenden Keilschrifttext vervollständigten.
Was ist Keilschrift?
Keilschrift ist ein Schriftsystem, das im alten Mesopotamien verwendet wurde. Sie gilt als die älteste Schriftform der Welt und wird seit über 3.000 Jahren verwendet. Die Keilschrift besteht aus kleinen keilförmigen Zeichen, die auf nasse Tontafeln geschrieben wurden.
Tabellen in Keilschrift kodieren
In der Vergangenheit hat die Forschung bereits alte Dokumente "gelesen" (Briefe der Renaissanceoder Rollen von Herculaneum), aber niemals mit dieser Art der Herangehensweise an die Schriften der sumerischen Zivilisation.
Das Team verwendete ein Deep-Learning-KI-Modell, das bereits in 104 verschiedenen Sprachen trainiert wurde. Dazu gehören einige semitische Sprachen wie das Hebräische, das Ähnlichkeiten mit dem Akkadischen aufweist. Anschließend trainierten sie den Algorithmus, indem sie 10.000 Tafeln in Keilschrift transkribierten. Das KI-Modell war in der Lage, kontextbezogene Wörter und Sätze vorzuschlagen, um die Lücken zu füllen. Nehmen Sie es als eine Art T9, aber mit dem Mesopotamien.
Woher wissen wir, dass die Vorschläge relevant sind? Die Forscher testeten KI auch an bereits bekannten Teilen der Tablets, und auch dort war die Fertigstellung hervorragend. Die künstliche Intelligenz hat die Sätze in Keilschrift rekonstruiert mit einer erstaunlichen Genauigkeit von 89 %, teilweise sogar die Interpretationsmöglichkeiten der Texte erweitern.
Die Bedeutung von Sprachenkenntnissen
"Das wichtigste Ergebnis dieser Studie", sagt Stanovsky, "ist, dass die Verwendung anderer Sprachen wirklich geholfen hat, Akkadisch zu codieren." Ohne das Modell vorab an diesen 104 verschiedenen Sprachen zu trainieren, die Ablesegenauigkeit der Keilschrifttafeln war fast 30 Prozentpunkte geringer.
Es ist ein Werkzeug, das in den nächsten Jahren sicher ein enormes Potenzial für die Entschlüsselung wichtiger historischer Dokumente freisetzen wird.
Referenzen: arxiv.org/abs/2109.04513