Google Gemini kommt und es raubt einem den Atem: Aber wann kann es genutzt werden?

Gianluca Riccio

7. Dezember 2023

Ente Zwillinge JPG

Technologie

Die Gemini-Demo von Google zeigt hochentwickelte Erkennungs-, Übersetzungs- und spielerische Interaktionsfähigkeiten und übertrifft die aktuelle KI.

Teilen

Google hat gerade Zwillinge vorgestellt, seine neue Grenze in der künstlichen Intelligenz, mit einer Demonstration, die die Welt verblüffte. Ein auf YouTube veröffentlichtes Video zeigt die außergewöhnliche Fähigkeit der Zwillinge, visuelle und verbale Reize zu interpretieren und darauf zu reagieren.

Der scheinbar einfache Test verwandelt sich schnell in eine unglaubliche Demonstration der „fast menschlichen“ Fähigkeiten dieser KI, die Welt um sie herum zu verstehen und mit ihr zu interagieren.

Google Gemini: ein Quantensprung in der künstlichen Intelligenz

Die Entstehung von Google Gemini (über das wir letzten September berichtet haben). schon bei den allerersten Ankündigungen) markiert einen Wendepunkt in der Landschaft der künstlichen Intelligenz. Die Fähigkeit von Zwillingen, verschiedene visuelle und verbale Signale zu interpretieren und darauf zu reagieren, übertrifft alles, was wir bisher von KI-Technologien gesehen haben.

Dies ist nicht nur ein Durchbruch in der visuellen Erkennung oder im Verständnis natürlicher Sprache. Was Sie in der Demonstration sehen, ist eine äußerst nahtlose Integration beider Fähigkeiten – eine, die KI einem echten Verständnis des menschlichen Kontexts näher bringt.

Die Google Gemini-Demo: ein Fenster in die Zukunft

Erstens: Wenn Sie es verpasst haben, MÜSSEN Sie es sehen. Hier ist sie:

Die Demo beginnt damit, dass ein menschlicher Teilnehmer Gemini bittet, zu beschreiben, was er sieht. Die einfache Aktion, ein Post-it anzubringen und eine improvisierte Linie darauf zu zeichnen, wird von Zwillingen bereitwillig interpretiert. Aber erst die Fortsetzung des Tests offenbart die wahre Kraft der Zwillinge.

Während sich die Zeichnung zu einer erkennbaren Figur, einer Ente, entwickelt, identifiziert Gemini nicht nur das Objekt richtig, sondern liefert auch Details über die Umgebung und demonstriert so ein umfassendes Verständnis des visuellen Kontexts.

Unkenntlich: Interaktion und Übersetzung

Die Intelligenz von Google Gemini beschränkt sich nicht nur auf die bloße visuelle Interpretation. Wenn der Teilnehmer Spiele und Übersetzungswünsche vorstellt, reagiert Gemini präzise. Seine Fähigkeit, „Ente“ in verschiedene Sprachen zu übersetzen und einfache Spiele zu verstehen und daran teilzunehmen, unterstreicht ein Maß an Interaktivität und Vielseitigkeit, das bisher ausschließlich den Menschen vorbehalten schien.

Die praktische Anwendung einer Technologie wie Google Gemini? Äh. Es ist unmöglich, seine Grenzen zu definieren. Von der Chirurgie bis zur Ausbildung, von Heimanwendungen bis hin zur Kreativbranche scheinen die Möglichkeiten endlos zu sein. Zwillinge könnten die Art und Weise, wie wir mit Technologie interagieren, revolutionieren und die Mensch-Maschine-Schnittstelle intuitiver, natürlicher und effizienter machen.

Google Gemini

Ja, aber wann können wir es nutzen?

Nach der aufrichtigen Bewunderung für das, was wir in der Demo gesehen haben, aufrichtiger Aufrichtigkeit, muss ich auch darauf hinweisen, dass das „Fett“, das von Google kommt, bisher gering war. Bard, in die Arena der Konfrontation hineingezogen ChatGPT des OpenAI e Claude von Anthropic wurde mit zu großen Erwartungen konfrontiert. Die Technologie „im Feld“ ist der der Konkurrenz unterlegen (beschränkt auf das Sprachmodell: andere KI wie die von Deepmind). Es kommen tolle Ergebnisse). Und die Tatsache, dass Google Gemini immer noch keinen offiziellen Starttermin hat, sorgt für einige Frustration.

Vielleicht scheint es „zu fortgeschritten, um wahr zu sein“, vielleicht liegt es daran, dass Sie es kaum erwarten können, sich damit auseinanderzusetzen, aber die Zeit der Demonstrationen ist vorbei. Die Google Gemini-Demo verspricht, die aktuellen Einschränkungen der KI-Technologien zu überwinden: Sehen wir uns das also in Aktion an.

Lassen Sie mich nicht vermuten, dass dies nur eine weitere Möglichkeit ist, Zeit zu gewinnen.

Bearbeiten 8: Hier sind Sie ja. Nicht einmal mit Absicht. Auf Drängen vieler Nutzer gibt Google zu, dass die eigentliche Gemini-Demo „unter Verwendung von Filmstills und Textnachrichten“ erstellt wurde, anstatt Gemini in Echtzeit auf eine Zeichnung oder eine Änderung von Objekten auf dem Tisch reagieren oder diese sogar vorhersagen zu lassen. Das ist viel weniger beeindruckend, als das Video vermuten lässt, und noch schlimmer: Das Fehlen einer Aussage über die tatsächliche Eingabemethode macht Geminis Bereitschaft eher fraglich, ebenso wie das Verhalten von Google.

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

Robiati Riccio

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Orwell Supermarkt: Einkaufen mit Gesichtserkennung muss neu gedacht werden

22. April 2024

VASA-1, die KI von Microsoft, erstellt aus nur einem Foto superrealistische Charaktere

19. April 2024

Amodei, Anthropic: „KI wird bald in der Lage sein, sich autonom zu replizieren und zu überleben“

18. April 2024

archivieren

Das Letzte

Overtourism: Ist der Eintrittspreis für Venedig die Zukunft der Kunststädte?

25. April 2024

Batterierecycling 2.0, der Grabstein zum Thema „Elektroauto ja oder nein?“

25. April 2024

Synthetisch, aber lebendig: Zellen, die die Grenze zwischen künstlich und biologisch herausfordern

25. April 2024

Deutschland, vor einem Jahr haben wir uns von der Atomkraft verabschiedet: Warum sie nicht zurückkehren werden

25. April 2024

Herculaneum enthüllt Platons Geheimnisse: Sein Ende wird rekonstruiert

24. April 2024