Microsoft steht kurz vor der Einführung von GPT-4, dem KI-Update, das ChatGPT in die Lage versetzen könnte, Videos aus einfachen Textnachrichten zu erstellen. Andreas Braun, CTO von Microsoft Deutschland, angekündigt die Neuigkeiten während der Veranstaltung „KI im Fokus – Digitaler Kickoff“. GPT-4 wird „multimodal“ sein und es Intelligenz ermöglichen, Texte in andere Medientypen zu übersetzen. Braun erklärte, dass das neue Update „ganz andere Möglichkeiten, zum Beispiel Videos“ bieten werde. Ich erwarte ehrlich gesagt auch Bilder und Töne: wahrscheinlich sogar Musik.
Nicht die erste, aber die beste
Unter den Experimenten im Bereich der KI, die ins Rampenlicht gerückt sind, gibt es bereits zwei Systeme, die in der Lage sind, Videos ausgehend von Textanweisungen zu produzieren. Es geht um Mach ein Video, KI im Besitz von Facebook Meta (Wir haben darüber gesprochen) Und Dreamix, entwickelt von Google (Wir haben darüber gesprochen). Es scheint jedoch, dass die nächste Version von ChatGPT powered by GPT-4 mehr können wird.
Ein Anwendungsbeispiel lieferte Microsoft: Das Szenario sei das eines Callcenters. In dem von Braun dargestellten Modell wandelt KI Telefongespräche automatisch in Text um und spart so den Mitarbeitern Zeit und Mühe. Dies ist ein einfacher Vorgeschmack: Die Eigenschaften von GPT-4 müssen alle entdeckt und bewertet werden, und wir werden dies sehr bald tun. Wann? Ab nächster Woche, sagt der Redmonder Riese.
GPT-4, eine weitere Seite zum Umblättern
Auch wenn wir uns aufgrund der jüngsten Entwicklungen daran gewöhnen, Nachrichten relativ schnell zu erfassen, geht es immer schneller. GPT-4 steht vor der Tür und Weiterentwicklungen dieser Technologie sind bereits absehbar. KI wird natürliche Sprache mit einem noch höheren Maß an Komplexität und Raffinesse verstehen. Sie werden in der Lage sein, Informationen immer präziser und kontextbezogener zu verarbeiten und zu interpretieren und sich schnell an „dynamische“ Situationen anzupassen und darauf zu reagieren.
Vor allem wird es schneller lernen: Die Fähigkeit zur „Externalisierung“ durch eine komplexe Multimodalität wird der KI weitere „Sinne“ hinzufügen. Am Horizont steht die Integration dieser Systeme mit anderen fortschrittlichen Technologien wie künstlichem Sehen oder Robotik. Wir werden keine „fühlenden“ Roboter haben, aber sie werden (und das ist sicher) enorm fortschrittlicher sein als alle, die wir gesehen haben, seit die Robotik begonnen hat, Versuche zu unternehmen.
Was soll ich sagen: Ich kann es kaum erwarten, mich auch in GPT-4 einzuarbeiten. Und du?