Ein futuristisches Institut zielt darauf ab, die Stimmen der Menschen mithilfe künstlicher Intelligenz zu bewahren (und neu zu erschaffen).
Die Forscher der Initiative „Voice Bank“ hoffen, dass sie das Leben aller Menschen verändern können, die durch Krankheit oder Unfall ihre Stimme verlieren. Der Verlust Ihrer Stimme ist nicht wirklich wie eine vorübergehende Senkung des Tons oder eine Heiserkeit. Der Verlust der Stimme ist teilweise der Verlust der Identität.
Alles begann mit einer Zusammenarbeit zwischen der Northeastern University of Boston und der Vokale D.. Es ist wichtig, denjenigen, die die Sprache verlieren, eine Möglichkeit zu bieten, nach Kehlkopfkrebs oder degenerativen Erkrankungen ein Gefühl für ihre Identität zu bewahren. Dieses Projekt wird es ihnen ermöglichen, mit einer synthetischen Form zu „sprechen“, die ihrer eigenen Stimme sehr ähnlich ist.
Es ist das erste Zentrum dieser Art und wird von prof. Rupal Patel, Gründer und CEO von VocaliD.
Das Unternehmen bietet bereits einen solchen Service für Einzelpersonen an, sagt Patel, aber vielen Menschen fehlt es an Geräten mit ausreichender Qualität, um Vocals richtig zu sampeln. Der Aufbau einer „Sprachbank“ ermöglicht es zukünftigen Patienten, ihre Stimme zu behalten, wenn sie noch die Möglichkeit dazu haben.
„Oft kommen Patienten im letzten Moment zu uns“ sagt. „Sie haben nicht genug Zeit, um ihre Stimme zu behalten, weil sie Krankheiten, Operationen und mehr ausgeliefert sind. Und es ist sehr frustrierend."
Die Sprachbank
Das Ergebnis war die Zusammenarbeit mit Northeastern, um die Technologie der Öffentlichkeit zugänglich zu machen. Das Herzstück des Projekts ist die Voice Preservation Clinic, ein Zentrum, in dem Patienten, bei denen das Risiko besteht, dass sie ihre Stimme verlieren, diese registrieren können, um sie zu schützen.
Der Ansatz ist viel komplizierter als der auf traditionellen Sprachsynthesen basierende: Ein Algorithmus für maschinelles Lernen rekonstruiert Ligaturen, Phoneme und sogar den Rhythmus in Bezug auf die Atmung. In einem speziellen Stand werden kleine Geschichten, Gedichte oder Gespräche zu verschiedenen Themen aufgezeichnet. Jemand scherzte sogar darüber, dass er seine Stimme verloren hatte, eine selbstironische Art, mit großer Angst umzugehen.
„Was es braucht, sind ungefähr zwei oder drei Stunden Sprechen. Aus diesen Aufnahmen ist unsere künstliche Intelligenz in der Lage, eine Voice Engine zu generieren, die den gleichen Sound hat. Es ist, als würde man denen die Stimme zurückgeben, die sie verloren haben“.
Die regenerierte Stimme kann als Sprachsynthese zum Sprechen verwendet werden, indem geschriebene Texte konvertiert werden, und kann morgen integriert werden mit Software, die Wörter, Bilder oder Handlungen aus mentalen Pfaden generiert.
Eine sehr schnelle Verbesserung
Laut Patel verbessert sich die Technologie schnell und wird bald in der Lage sein, Sprache zu reproduzieren, die nicht von menschlicher Sprache zu unterscheiden ist.
Das Team wird auch in der Lage sein, die Stimme zu "altern", um sie an das Alter der Person anzupassen, während es noch nicht möglich ist, die Stimme eines Jungen zu "wachsen", indem man sie in eine Erwachsene verwandelt.