Schauen Sie, was mir durch den Kopf geht: eine KI, die Gedanken in HQ-Videos umwandelt

28. Mai 2023

Technologie

Ein Forscherteam hat ein KI-Modell entwickelt, das HD-Videos direkt aus der Gehirnaktivität nachbilden kann: Wir lesen fast Gedanken.

Es scheint eine Zukunft zu geben, in der Gedanken nicht länger nur flüchtige Bilder in unserem Kopf sind, sondern zu erstklassigen Videos werden können. Und es scheint eine Zukunft zu sein, die der Realität immer näher kommt. Eine Gruppe erfahrener Forscher hat gerade die Büchse der Pandora auf dem Gebiet der Neurowissenschaften geöffnet. Um ihm zu helfen, eine gute Portion KI.

Das „Projektor“-Gehirn

Jiaxin Qing, Zijiao Chen e Juan Helen Zhou, von der National University of Singapore und der Chinese University of Hong Kong, präsentierte einige recht interessante Forschungsarbeiten. Das Team kombinierte Daten aus der funktionellen Magnetresonanztomographie (fMRT) mit generativer künstlicher Intelligenz mit stabiler Diffusion, um zu erstellen MinD-Video, ein Modell, das HQ-Videos direkt aus Gehirnmessungen generieren kann.

Science-Fiction-Zeug könnte man sagen: aber nein, alles rigoros dokumentiert auf arXiv, z.B Das ist der Link.

Wie genau funktioniert MinD-Video?

MinD-Video ist kein einfacher Videogenerator, sondern ein ganzes System, das darauf ausgelegt ist, die von einer KI durchgeführte Dekodierung von Bildern mit der von einem Gehirn durchgeführten Dekodierung zu kommunizieren. Doch wie trainiert man ein solches System?

Die Forscher verwendeten einen öffentlichen Datensatz, der Videos und zugehörige fMRT-Messwerte von Probanden enthielt, die sie sahen. Und offenbar hat die Arbeit hervorragend geklappt.

Siehe Gedanken, wir haben es geschafft

Die von Wissenschaftlern veröffentlichten Videos zeigen wirklich faszinierende Ergebnisse. Nehmen Sie zum Beispiel ein Originalvideo mit Pferden auf einem Feld. MinD-Video hat es „neu aufgebaut“, indem es eine lebendigere Version der Pferde erstellt hat. In einem anderen Fall fährt ein Auto durch ein Waldgebiet und das rekonstruierte Video zeigt eine Fahrt aus der Ich-Perspektive entlang einer kurvenreichen Straße.

Den Forschern zufolge seien die rekonstruierten Videos von „hoher Qualität“, mit klar definierten Bewegungen und Szenendynamiken. Und die Präzision? 85 %, eine deutliche Verbesserung gegenüber dem bisherige Versuche.

Gedankenlesen und HQ-Video, was kommt als nächstes?

„Die Zukunft ist rosig und die potenziellen Anwendungen sind immens. Von der Neurowissenschaft bis Gehirn-Computer-Schnittstellen„Wir glauben, dass unsere Arbeit einen wichtigen Einfluss haben kann“, erklärten die Autoren. Und damit nicht genug: Ihre Arbeit verdeutlichte die dominierende Rolle des visuellen Kortex bei der visuellen Wahrnehmung und die Fähigkeit ihres Modells, während des Trainings immer anspruchsvollere Informationen zu lernen.

Das in dieser neuen Forschung verwendete Modell der stabilen Diffusion macht die Visualisierung präziser. „Ein entscheidender Vorteil unseres Modells gegenüber anderen generativen Modellen wie le GANist die Möglichkeit, Videos in höherer Qualität zu produzieren. „Es nutzt die vom fMRI-Encoder gelernten Darstellungen und nutzt seinen einzigartigen Diffusionsprozess, um HQ-Videos zu generieren, die besser mit den ursprünglichen neuronalen Aktivitäten übereinstimmen“, erklärten die Forscher.

Kurz gesagt, es scheint, dass wir wirklich in die Ära eingetreten sind Gedankenlesen durch künstliche Intelligenz. Ein Feld, das tausend Möglichkeiten bietet und dessen Grenzen nur die Vorstellungskraft zu sein scheint.

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Das Letzte

Schauen Sie, was mir durch den Kopf geht: eine KI, die Gedanken in HQ-Videos umwandelt

Technologie

Teilen

Das „Projektor“-Gehirn

Wie genau funktioniert MinD-Video?

Siehe Gedanken, wir haben es geschafft

Gedankenlesen und HQ-Video, was kommt als nächstes?

Orwell Supermarkt: Einkaufen mit Gesichtserkennung muss neu gedacht werden

VASA-1, die KI von Microsoft, erstellt aus nur einem Foto superrealistische Charaktere

Amodei, Anthropic: „KI wird bald in der Lage sein, sich autonom zu replizieren und zu überleben“

Overtourism: Ist der Eintrittspreis für Venedig die Zukunft der Kunststädte?

Batterierecycling 2.0, der Grabstein zum Thema „Elektroauto ja oder nein?“

Synthetisch, aber lebendig: Zellen, die die Grenze zwischen künstlich und biologisch herausfordern

Deutschland, vor einem Jahr haben wir uns von der Atomkraft verabschiedet: Warum sie nicht zurückkehren werden

Herculaneum enthüllt Platons Geheimnisse: Sein Ende wird rekonstruiert