Google hat gerade Zwillinge vorgestellt, seine neue Grenze in der künstlichen Intelligenz, mit einer Demonstration, die die Welt verblüffte. Ein auf YouTube veröffentlichtes Video zeigt die außergewöhnliche Fähigkeit der Zwillinge, visuelle und verbale Reize zu interpretieren und darauf zu reagieren.
Der scheinbar einfache Test verwandelt sich schnell in eine unglaubliche Demonstration der „fast menschlichen“ Fähigkeiten dieser KI, die Welt um sie herum zu verstehen und mit ihr zu interagieren.
Google Gemini: ein Quantensprung in der künstlichen Intelligenz
Die Entstehung von Google Gemini (über das wir letzten September berichtet haben). schon bei den allerersten Ankündigungen) markiert einen Wendepunkt in der Landschaft der künstlichen Intelligenz. Die Fähigkeit von Zwillingen, verschiedene visuelle und verbale Signale zu interpretieren und darauf zu reagieren, übertrifft alles, was wir bisher von KI-Technologien gesehen haben.
Dies ist nicht nur ein Durchbruch in der visuellen Erkennung oder im Verständnis natürlicher Sprache. Was Sie in der Demonstration sehen, ist eine äußerst nahtlose Integration beider Fähigkeiten – eine, die KI einem echten Verständnis des menschlichen Kontexts näher bringt.
Die Google Gemini-Demo: ein Fenster in die Zukunft
Erstens: Wenn Sie es verpasst haben, MÜSSEN Sie es sehen. Hier ist sie:
Die Demo beginnt damit, dass ein menschlicher Teilnehmer Gemini bittet, zu beschreiben, was er sieht. Die einfache Aktion, ein Post-it anzubringen und eine improvisierte Linie darauf zu zeichnen, wird von Zwillingen bereitwillig interpretiert. Aber erst die Fortsetzung des Tests offenbart die wahre Kraft der Zwillinge.
Während sich die Zeichnung zu einer erkennbaren Figur, einer Ente, entwickelt, identifiziert Gemini nicht nur das Objekt richtig, sondern liefert auch Details über die Umgebung und demonstriert so ein umfassendes Verständnis des visuellen Kontexts.
Unkenntlich: Interaktion und Übersetzung
Die Intelligenz von Google Gemini beschränkt sich nicht nur auf die bloße visuelle Interpretation. Wenn der Teilnehmer Spiele und Übersetzungswünsche vorstellt, reagiert Gemini präzise. Seine Fähigkeit, „Ente“ in verschiedene Sprachen zu übersetzen und einfache Spiele zu verstehen und daran teilzunehmen, unterstreicht ein Maß an Interaktivität und Vielseitigkeit, das bisher ausschließlich den Menschen vorbehalten schien.
Die praktische Anwendung einer Technologie wie Google Gemini? Äh. Es ist unmöglich, seine Grenzen zu definieren. Von der Chirurgie bis zur Ausbildung, von Heimanwendungen bis hin zur Kreativbranche scheinen die Möglichkeiten endlos zu sein. Zwillinge könnten die Art und Weise, wie wir mit Technologie interagieren, revolutionieren und die Mensch-Maschine-Schnittstelle intuitiver, natürlicher und effizienter machen.
Ja, aber wann können wir es nutzen?
Nach der aufrichtigen Bewunderung für das, was wir in der Demo gesehen haben, aufrichtiger Aufrichtigkeit, muss ich auch darauf hinweisen, dass das „Fett“, das von Google kommt, bisher gering war. Bard, in die Arena der Konfrontation hineingezogen ChatGPT des OpenAI e Claude von Anthropic wurde mit zu großen Erwartungen konfrontiert. Die Technologie „im Feld“ ist der der Konkurrenz unterlegen (beschränkt auf das Sprachmodell: andere KI wie die von Deepmind). Es kommen tolle Ergebnisse). Und die Tatsache, dass Google Gemini immer noch keinen offiziellen Starttermin hat, sorgt für einige Frustration.
Vielleicht scheint es „zu fortgeschritten, um wahr zu sein“, vielleicht liegt es daran, dass Sie es kaum erwarten können, sich damit auseinanderzusetzen, aber die Zeit der Demonstrationen ist vorbei. Die Google Gemini-Demo verspricht, die aktuellen Einschränkungen der KI-Technologien zu überwinden: Sehen wir uns das also in Aktion an.
Lassen Sie mich nicht vermuten, dass dies nur eine weitere Möglichkeit ist, Zeit zu gewinnen.
Bearbeiten 8: Hier sind Sie ja. Nicht einmal mit Absicht. Auf Drängen vieler Nutzer gibt Google zu, dass die eigentliche Gemini-Demo „unter Verwendung von Filmstills und Textnachrichten“ erstellt wurde, anstatt Gemini in Echtzeit auf eine Zeichnung oder eine Änderung von Objekten auf dem Tisch reagieren oder diese sogar vorhersagen zu lassen. Das ist viel weniger beeindruckend, als das Video vermuten lässt, und noch schlimmer: Das Fehlen einer Aussage über die tatsächliche Eingabemethode macht Geminis Bereitschaft eher fraglich, ebenso wie das Verhalten von Google.