Nahe Zukunft
Keine Ergebnisse
Alle Ergebnisse
20 September 2023
  • Home
  • Technik
  • Gesundheit
  • Umwelt
  • Energie
  • Transportmittel
  • Raum
  • AI
  • Konzepte
  • H+
Die Zukunft verstehen, antizipieren, verbessern.
CES2023 / Coronavirus / Russland-Ukraine
Nahe Zukunft
  • Home
  • Technik
  • Gesundheit
  • Umwelt
  • Energie
  • Transportmittel
  • Raum
  • AI
  • Konzepte
  • H+

Die Zukunft verstehen, antizipieren, verbessern.

Keine Ergebnisse
Alle Ergebnisse
Robotica, Technik

DeepMind präsentiert RT-2: Roboter, die sehen, lernen und handeln

Das von DeepMind entwickelte KI-Modell, das Sehen und Sprache zur Steuerung von Maschinen kombiniert, wird neue Horizonte in der Robotik eröffnen.

Juli 30 2023
Gianluca RiccioGianluca Riccio
⚪ 4 Minuten
TeilenPin1TweetAbsendenTeilenTeilenTeilen

EINLESEN:

In einer hellen Umgebung voller Monitore und technischer Ausrüstung steht ein Roboter als Protagonist. Seine Metallstruktur reflektiert das Licht, aber in seinen „Augen“ verbirgt sich die wahre Magie. Diese Augen, angetrieben durch das RT-2-Modell von DeepMind, sind in der Lage zu sehen, zu interpretieren und zu handeln.

Während sich der Roboter anmutig bewegt, prüfen die Wissenschaftler um ihn herum jede seiner Bewegungen. Es ist nicht nur ein Stück Metall und ein Schaltkreis, sondern die Verkörperung einer Intelligenz, die die weite Welt des Internets mit der greifbaren Realität verbindet.

Deepmind
Einer von 13 Robotern, die für das Modelltraining eingesetzt werden.

Die Entwicklung von RT-2

Die Robotik hat in den letzten Jahren große Fortschritte gemacht, aber DeepMind Es hat das Spiel einfach auf ein ganz neues Level gehoben. Illustriert in einem Papier Gerade veröffentlicht, ist es angekommen RT-2. Dinge? Es handelt sich um ein Vision-Language-Action (VLA)-Modell, das nicht nur aus Webdaten, sondern auch aus Roboterdaten lernt und dieses Wissen in verallgemeinerte Anweisungen für die Robotersteuerung übersetzt.

In einer Zeit, in der die Technologie sprunghaft voranschreitet, stellt RT-2 einen bedeutenden Sprung dar und verspricht, nicht nur den Bereich der Robotik, sondern auch die Art und Weise, wie wir jeden Tag leben und arbeiten, zu revolutionieren. Aber was bedeutet das in der Praxis?

Der Artikel wird nach den verwandten Links fortgesetzt

Künstliche Intelligenz: die nächste Evolution? Von generativ bis interaktiv

Gemini ist fünfmal leistungsfähiger als GPT-5 – der Riese Google ist aufgewacht

DeepMind RT-2, von der Vision zur Tat

Die Modelle von High Capacity Vision-Language (VLM) Sie werden auf große Datenmengen trainiert und sind dadurch auch außerordentlich gut darin, visuelle oder sprachliche Muster zu erkennen (z. B. in verschiedenen Sprachen). Aber stellen Sie sich vor, Sie könnten Roboter dazu bringen, das zu tun, was diese Modelle tun. Hören Sie auf, sich das vorzustellen: DeepMind macht es mit RT-2 möglich.

Robotertransformatoren 1 (RT-1) Es war an sich schon ein Wunder, aber RT-2 geht noch weiter und zeigt verbesserte Generalisierungsfähigkeiten sowie ein semantisches und visuelles Verständnis, das über die Roboterdaten hinausgeht, denen es ausgesetzt war.

DeepMind
Ein mit Webdaten vorab trainiertes visuelles Sprachmodell (VLM) lernt auch aus RT-1-Robotikdaten. Ergebnis? RT-2, ein visuelles Sprachaktionsmodell (VLA), das einen Roboter steuern kann – Animation: DeepMind

Kettenargumentation

Einer der faszinierendsten Aspekte von RT-2 ist seine Fähigkeit zum Kettenschluss. Er kann entscheiden, welcher Gegenstand als Behelfshammer verwendet werden kann oder welches Getränk für einen müden Menschen am besten geeignet ist. Diese Fähigkeit zum tiefen Denken könnte die Art und Weise, wie wir mit Robotern interagieren, revolutionieren.

Und im schlimmsten Fall könnten Sie immer noch einen Roboter bitten, Ihnen einen guten Kaffee zu kochen, um wieder etwas Klarheit zu erlangen.

Doch wie steuert DeepMind RT-2 einen Roboter?

Die Antwort liegt in der Art und Weise, wie er ausgebildet wurde. Tatsächlich verwendet es eine Darstellung, die den Sprachtokens nicht unähnlich ist, die von Vorlagen wie ChatGPT ausgenutzt werden.

RT-2 demonstrierte erstaunliche Emerging-Fähigkeiten wie Symbolverständnis, Argumentation und Menschenerkennung. Fähigkeiten, die derzeit eine Verbesserung um mehr als das Dreifache im Vergleich zu Vorgängermodellen aufweisen.

Mit RT-2, DeepMind nicht nur gezeigt, dass Vision-Sprach-Modelle in leistungsstarke Vision-Sprach-Aktions-Modelle umgewandelt werden können, sondern es öffnete auch die Tür zu einer Zukunft, in der Roboter schlussfolgern, Probleme lösen und Informationen interpretieren können, um eine breite Palette von Aufgaben in der Realität auszuführen Welt.

DeepMind
Ein Beispiel für die von DeepMind RT-2 erlernten Aktivitäten. Aufgaben, die nicht in den Daten enthalten waren, mit denen trainiert wurde.

Und nun?

In einer Welt, in der künstliche Intelligenz und Robotik immer wichtiger werden, zeigt uns RT-2, dass die nächste Entwicklung nicht rein technisch, sondern „wahrnehmungsbezogen“ sein wird. Maschinen werden unsere Bedürfnisse auf eine Weise verstehen und darauf reagieren, wie wir es uns nie hätten vorstellen können.

Wenn das erst der Anfang ist, wer weiß, was die Zukunft bringt.

Stichworte: Deepmindkünstliche Intelligenz Roboter

Neueste

  • Fernarbeit, halbierte Emissionen
  • Palettenversand im digitalen Zeitalter: Wie das Internet die Logistiklandschaft revolutioniert hat
  • BMW 7er Protection: Die Limousine, die Granaten und Flammenwerfern trotzt
  • Erste Nervennetzwerke 3D-gedruckt mit Bioink
  • LCLS-II: Der leistungsstärkste Röntgenlaser der Welt eingeschaltet
  • Auf Wiedersehen Drogenschnüffelhunde? Das tragbare Gerät erkennt Drogen mit einer Genauigkeit von 95 %
  • Welche Software steckt hinter Online-Casinos?
  • Squishy Robotics: für den Mars geboren, unterstützt Rettungsmaßnahmen auf der Erde
  • Pod Studio, das Mikrohaus, das seine Größe in 15 Minuten verdreifacht
  • Geoengineering, seien Sie vorsichtig: Die Auswirkungen, die wir durch die Abschirmung der Sonnenstrahlen hätten


GPT-Chat megaeinfach!

Konkreter Leitfaden für diejenigen, die sich diesem Tool der künstlichen Intelligenz nähern, das auch für die Schulwelt entwickelt wurde: viele Anwendungsbeispiele, Verwendungshinweise und gebrauchsfertige Anweisungen zum Trainieren und Abfragen von Chat GPT.

Um Artikel einzureichen, die Ergebnisse einer Forschung offenzulegen oder wissenschaftliche Entdeckungen Schreiben Sie an die Redaktion

Betreten Sie den Telegrammkanal von Futuroprossimo, klicken Sie hier. Oder folgen Sie uns weiter Instagram, Facebook, Twitter, Mastodon e Linkedin.

FacebookTwitterInstagramTelegrammLinkedinMastodonPinterestTikTok

Das tägliche Morgen.


Futuroprossimo.it informiert über die Zukunft von Technologie, Wissenschaft und Innovation: Wenn etwas kurz vor der Ankunft steht, ist es hier bereits angekommen. FuturoProssimo ist Teil des Netzwerks Weiterleiten, Studien und Fähigkeiten für Zukunftsszenarien.

  • Umwelt
  • Architektur
  • Künstliche Intelligenz
  • Gadgets
  • Konzepte
  • Design
  • Medizin
  • Raum
  • Robotica
  • Arbeit
  • Transportmittel
  • Energie
  • Edition Française
  • Deutsche Edition
  • japanische Version
  • Englische Ausgabe
  • Portugiesische Ausgabe
  • Russische Übersetzung
  • Spanische Ausgabe

Abonnieren Sie den Newsletter

  • Der Editor
  • Werbung auf FP
  • Datenschutz

© 2023 Nahe Zukunft - Creative Commons License
Diese Arbeit wird unter Lizenz vertrieben Creative Commons Namensnennung 4.0 International.

Keine Ergebnisse
Alle Ergebnisse
Die Zukunft verstehen, antizipieren, verbessern.
  • Home
  • Technik
  • Gesundheit
  • Umwelt
  • Energie
  • Transportmittel
  • Raum
  • AI
  • Konzepte
  • H+