Hier ist GPT-4, es wird „multimodal“ sein: Es wird auch Musik, Videos und Bilder verwalten

10. März 2023

POST FP 1200x675 1 2023 03 10T190702.918 1

Technologie

Microsoft kündigt den Start von GPT-4 an: KI wird es ermöglichen, Text in andere Medien, einschließlich Video, zu übersetzen.

Microsoft steht kurz vor der Einführung von GPT-4, dem KI-Update, das ChatGPT in die Lage versetzen könnte, Videos aus einfachen Textnachrichten zu erstellen. Andreas Braun, CTO von Microsoft Deutschland, angekündigt die Neuigkeiten während der Veranstaltung „KI im Fokus – Digitaler Kickoff“. GPT-4 wird „multimodal“ sein und es Intelligenz ermöglichen, Texte in andere Medientypen zu übersetzen. Braun erklärte, dass das neue Update „ganz andere Möglichkeiten, zum Beispiel Videos“ bieten werde. Ich erwarte ehrlich gesagt auch Bilder und Töne: wahrscheinlich sogar Musik.

Nicht die erste, aber die beste

Unter den Experimenten im Bereich der KI, die ins Rampenlicht gerückt sind, gibt es bereits zwei Systeme, die in der Lage sind, Videos ausgehend von Textanweisungen zu produzieren. Es geht um Mach ein Video, KI im Besitz von Facebook Meta (Wir haben darüber gesprochen) Und Dreamix, entwickelt von Google (Wir haben darüber gesprochen). Es scheint jedoch, dass die nächste Version von ChatGPT powered by GPT-4 mehr können wird.

Ein Anwendungsbeispiel lieferte Microsoft: Das Szenario sei das eines Callcenters. In dem von Braun dargestellten Modell wandelt KI Telefongespräche automatisch in Text um und spart so den Mitarbeitern Zeit und Mühe. Dies ist ein einfacher Vorgeschmack: Die Eigenschaften von GPT-4 müssen alle entdeckt und bewertet werden, und wir werden dies sehr bald tun. Wann? Ab nächster Woche, sagt der Redmonder Riese.

GPT-4, eine weitere Seite zum Umblättern

Auch wenn wir uns aufgrund der jüngsten Entwicklungen daran gewöhnen, Nachrichten relativ schnell zu erfassen, geht es immer schneller. GPT-4 steht vor der Tür und Weiterentwicklungen dieser Technologie sind bereits absehbar. KI wird natürliche Sprache mit einem noch höheren Maß an Komplexität und Raffinesse verstehen. Sie werden in der Lage sein, Informationen immer präziser und kontextbezogener zu verarbeiten und zu interpretieren und sich schnell an „dynamische“ Situationen anzupassen und darauf zu reagieren.

Vor allem wird es schneller lernen: Die Fähigkeit zur „Externalisierung“ durch eine komplexe Multimodalität wird der KI weitere „Sinne“ hinzufügen. Am Horizont steht die Integration dieser Systeme mit anderen fortschrittlichen Technologien wie künstlichem Sehen oder Robotik. Wir werden keine „fühlenden“ Roboter haben, aber sie werden (und das ist sicher) enorm fortschrittlicher sein als alle, die wir gesehen haben, seit die Robotik begonnen hat, Versuche zu unternehmen.

Was soll ich sagen: Ich kann es kaum erwarten, mich auch in GPT-4 einzuarbeiten. Und du?

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Das Letzte

Hier ist GPT-4, es wird „multimodal“ sein: Es wird auch Musik, Videos und Bilder verwalten

Technologie

Teilen

Nicht die erste, aber die beste

GPT-4, eine weitere Seite zum Umblättern

Ästhetik zu Soras Zeiten: Wie KI-Videos Kreativität und Gesellschaft verändern werden

Meine ersten 24 Stunden mit Google Gemini Ultra 1.0: einige Urteile

Google Gemini kommt und es raubt einem den Atem: Aber wann kann es genutzt werden?

Overtourism: Ist der Eintrittspreis für Venedig die Zukunft der Kunststädte?

Batterierecycling 2.0, der Grabstein zum Thema „Elektroauto ja oder nein?“

Synthetisch, aber lebendig: Zellen, die die Grenze zwischen künstlich und biologisch herausfordern

Deutschland, vor einem Jahr haben wir uns von der Atomkraft verabschiedet: Warum sie nicht zurückkehren werden

Herculaneum enthüllt Platons Geheimnisse: Sein Ende wird rekonstruiert