Hier ist eine KI, die die nächsten 25 Bilder eines Films vorhersagen kann

8. November 2019

9111e53b 814e 4a68 8861 c83fb5141ae6 e1573163524251

Technologie

Eine künstliche Intelligenz kann ziemlich genau vorhersagen, wie die 25 zukünftigen Bilder dieses Films aussehen werden.

KI- und maschinelle Lernalgorithmen können Aktionen in Videos immer besser vorhersagen.

Die besten aktuellen Algorithmen können ziemlich genau vorhersagen, wohin ein Baseball gehen wird, nachdem er geworfen wurde, oder wie eine Straße in der kommenden Sequenz erscheint. Mit anderen Worten? Frames in der Zukunft eines Films vorhersagen.

Ein neuer Ansatz, der von Forschern von Google, der University of Michigan und Adobe vorgeschlagen wurde, erweitert den Stand der Technik um groß angelegte Modelle, die aus wenigen Bildern qualitativ hochwertige Videos erzeugen.

„Mit diesem Projekt wollen wir genaue Videovorhersagen erhalten. Wir werden die Fähigkeiten eines neuronalen Netzwerks optimieren ", Die Forscher schrieben in ein Dokument das beschreibt ihre Arbeit.

Das Teammodell

Das Kernmodell des Teams basiert auf einer stochastischen Videoerzeugungsarchitektur. mit einer Komponente, die die Vorhersagen der Frames nach den betrachteten verwaltet.

Das Team trainierte und testete verschiedene Versionen des Modells getrennt von benutzerdefinierten Datensätzen basierend auf drei Prognosekategorien: Interaktionen zwischen Objekten, strukturierte Bewegung und teilweise Beobachtbarkeit.

Für die erste Aufgabe (Interaktionen mit Objekten) Die Forscher wählten 256 Clips aus einem Videoblock aus, der einen Roboterarm bei der Interaktion mit Handtüchern zeigt.

Zum zweiten (strukturierte Bewegung) Sie bearbeiteten Clips aus Human 3.6M, einem Block mit Clips von Menschen, die Aktionen wie das Sitzen auf einem Stuhl ausführen.

Wie für den dritten (teilweise Beobachtbarkeitsaktivität), verwendete einen Open-Source-KITTI-Fahrdatensatz, der aus Filmmaterial von Kameras auf Auto-Armaturenbrettern zusammengestellt wurde.

Nach diesem "Training" erzeugte das KI-Modell in Zukunft bis zu 25 Frames.

Die Forscher berichten, dass "Vorhersagen" von den Bewertern in 90,2, 98,7% und 99,3% der Fälle den drei Arten von Videos vorgezogen wurden: Interaktionen zwischen Objekten, strukturierte Bewegung und teilweise Beobachtbarkeitsaufgaben. beziehungsweise.

Qualitativ stellt das Team fest, dass die KI menschliche Arme und Beine sauber darstellt und fertig ist "Sehr genaue Vorhersagen, die im Vergleich zu den im Video dargestellten Szenen realistisch erschienen" .

Das Modell der künstlichen Intelligenz bei gleichzeitiger Bereitstellung von Videodatenrahmen menschlicher Handlungen

Das Modell der künstlichen Intelligenz bei der Bereitstellung von Videodatenrahmen einer Autokamera.

"Wir haben festgestellt, dass die Maximierung der Kapazität solcher Modelle die Qualität der Videovorhersage verbessert." Mitautoren schreiben. Wir hoffen, dass unsere Arbeit das Feld ermutigen wird, sich in Zukunft in ähnliche Richtungen zu bewegen. Zum Beispiel, um zu sehen, wie weit wir gehen können. “

Wie viele Minuten der Zukunft können Sie sich vorstellen?

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Das Letzte

Hier ist eine KI, die die nächsten 25 Bilder eines Films vorhersagen kann

Technologie

Teilen

KI- und maschinelle Lernalgorithmen können Aktionen in Videos immer besser vorhersagen.

Das Teammodell

Wie viele Minuten der Zukunft können Sie sich vorstellen?

Die Neuigkeiten, die wir aus dem Jahr 2024 erwarten: Es wird ein Jahr, das Sie nicht glauben werden

Google Gemini kommt und es raubt einem den Atem: Aber wann kann es genutzt werden?

Ende der Menschheit, die 14 Fallen, denen sich niemand zu stellen wagt

Synthetisch, aber lebendig: Zellen, die die Grenze zwischen künstlich und biologisch herausfordern

Deutschland, vor einem Jahr haben wir uns von der Atomkraft verabschiedet: Warum sie nicht zurückkehren werden

Herculaneum enthüllt Platons Geheimnisse: Sein Ende wird rekonstruiert

Kunststoff endlos recyceln: neue fortschrittliche Recyclingtechnologien

Tesla, die Risse im Mythos: sinkende Umsätze, sinkendes Vertrauen, Musk im Fadenkreuz