Ein futuristisches Institut zielt darauf ab, die Stimmen der Menschen mithilfe künstlicher Intelligenz zu bewahren (und neu zu erschaffen).
Forscher, die an der Initiative „Voice Bank“ beteiligt sind, hoffen, das Leben aller Menschen zu verändern, die aufgrund von Krankheit oder Unfällen ihre Stimme verlieren. Das Verlieren Ihrer Stimme ist nicht wirklich so, als würde man den Klang vorübergehend leiser oder heiser. Der Verlust der Stimme ist teilweise der Verlust der Identität.
Alles begann mit einer Zusammenarbeit zwischen der Northeastern University of Boston und der Vokale D.. Es ist wichtig, denjenigen, die den Sprachgebrauch verlieren, die Möglichkeit zu geben, nach Kehlkopfkrebs oder degenerativen Erkrankungen ein Gefühl für ihre Identität zu bewahren. Dieses Projekt ermöglicht es ihnen, mit einer synthetischen Form zu "sprechen", die ihrer eigenen Stimme sehr ähnlich ist.
Es ist das erste Zentrum dieser Art und wird von prof. Rupal Patel, Gründer und CEO von VocaliD.
Das Unternehmen bietet bereits einen solchen Service für Einzelpersonen an, sagt Patel, aber viele Menschen verfügen nicht über Geräte von ausreichender Qualität, um den Gesang korrekt abzutasten. Durch den Aufbau einer "Sprachbank" können zukünftige Patienten ihre Stimme behalten, wenn sie noch die Chance haben.
"Patienten kommen oft im letzten Moment zu uns" sagt. „Sie haben nicht genug Zeit, um ihre Stimme zu behalten, weil sie Krankheiten, Operationen und vielem mehr ausgeliefert sind. Und es ist sehr frustrierend. “
Die Sprachbank
Das Ergebnis war die Zusammenarbeit mit Northeastern, um die Technologie der Öffentlichkeit zugänglich zu machen. Das Herzstück des Projekts ist die Voice Preservation Clinic, ein Zentrum, in dem Patienten, bei denen das Risiko besteht, dass sie ihre Stimme verlieren, diese registrieren können, um sie zu schützen.
Der Ansatz ist viel komplizierter als bei herkömmlichen Sprachsynthesen: Ein Algorithmus für maschinelles Lernen rekonstruiert Ligaturen, Phoneme und sogar den Rhythmus in Bezug auf die Atmung. In einem speziellen Stand werden kleine Geschichten, Gedichte oder Gespräche zu verschiedenen Themen aufgezeichnet. Jemand scherzte sogar darüber, dass er seine Stimme verloren hatte, eine selbstironische Art, mit großer Angst umzugehen.
„Es dauert ungefähr zwei oder drei Stunden. Aus diesen Aufnahmen kann unsere künstliche Intelligenz eine Sprachmaschine erzeugen, die den gleichen Klang hat. Es ist, als würde man die Stimme denen zurückgeben, die sie verloren haben. “
Die regenerierte Stimme kann als Sprachsynthese zum Sprechen verwendet werden, indem geschriebene Texte konvertiert werden, und kann morgen integriert werden mit Software, die Wörter, Bilder oder Handlungen aus mentalen Pfaden generiert.
Eine sehr schnelle Verbesserung
Laut Patel verbessert sich die Technologie schnell und wird bald in der Lage sein, Sprache zu reproduzieren, die nicht von menschlicher Sprache zu unterscheiden ist.
Das Team wird auch in der Lage sein, die Stimme zu "altern", um sie an das Alter der Person anzupassen, während es noch nicht möglich ist, die Stimme eines Jungen zu "wachsen", indem man sie in einen Erwachsenen verwandelt.