Microsoft steht kurz vor der Einführung von GPT-4, dem KI-Update, das ChatGPT in die Lage versetzen könnte, Videos aus einfachen Textnachrichten zu erstellen. Andreas Braun, CTO von Microsoft Deutschland, angekündigt die Neuigkeiten während der Veranstaltung "AI in Focus - Digital Kickoff". GPT-4 wird "Multimode" sein und es der Intelligenz ermöglichen, Text in andere Medientypen zu übersetzen. Braun erklärte, dass das neue Update "ganz andere Möglichkeiten, zum Beispiel Video" bieten werde. Ehrlich gesagt erwarte ich auch Bilder und Töne: wahrscheinlich auch Musik.
Nicht die erste, aber die beste
Unter den Experimenten im Bereich der KI, die ins Rampenlicht gerückt sind, gibt es bereits zwei Systeme, die in der Lage sind, ausgehend von Textanweisungen Videos zu produzieren. Es geht um Mach ein Video, KI im Besitz von Facebook Meta (Wir haben darüber gesprochen) Und Dreamix, entwickelt von Google (Wir haben darüber gesprochen). Es scheint jedoch, dass die nächste Version von ChatGPT powered by GPT-4 mehr können wird.
Microsoft hat ein Anwendungsbeispiel geliefert: Das Szenario ist das eines Callcenters. In dem von Braun illustrierten Modell wandelt die KI Telefongespräche automatisch in Text um, was den Mitarbeitern Zeit und Mühe spart. Es ist ein einfacher Vorgeschmack: Die Eigenschaften von GPT-4 müssen alle entdeckt und bewertet werden, und das werden wir sehr bald tun. Wenn? Bereits ab nächster Woche kündigt der Redmond-Koloss an.

GPT-4, eine weitere Seite zum Umblättern
Obwohl wir uns durch die jüngsten Entwicklungen daran gewöhnt haben, Nachrichten ziemlich schnell zu sammeln, werden die Dinge immer schneller. GPT-4 steht vor der Tür, und weitere Entwicklungen dieser Technologie sind bereits absehbar. KI wird natürliche Sprache mit noch größerer Komplexität und Ausgereiftheit verstehen. Sie werden in der Lage sein, Informationen zunehmend präziser und kontextbezogener zu verarbeiten und zu interpretieren, sich schnell anzupassen und auf „dynamische“ Situationen zu reagieren.
Am wichtigsten ist, dass es schneller lernt: Die Fähigkeit, über einen multimodalen Komplex „auszulagern“, wird der KI mehr „Sinne“ hinzufügen. Am Horizont ist die Integration dieser Systeme mit anderen fortschrittlichen Technologien wie Computer Vision oder der Robotik. Wir werden keine "empfindungsfähigen" Roboter haben, aber sie werden (und das ist sicher) weitaus fortschrittlicher sein als alle, die wir gesehen haben, seit die Robotik begonnen hat, am laufenden Band Versuche zu unternehmen.
Was soll ich sagen: Ich kann es kaum erwarten, mich auch an GPT-4 zu „beißen“. Und du?