Künstliche Intelligenz verändert die Art und Weise, wie wir mit Computern interagieren. Eine aktualisierte Version von Claude 3.5 Sonett, das Flaggschiff-KI-Modell von Anthropisch, ist ein klares Beispiel für diese Entwicklung: Während die vorherige Version auf Textdialoge beschränkt war, ist dieses neue Update gerade angekündigt ist in der Lage, grafische Oberflächen zu interpretieren und selbstständig mit Anwendungen zu interagieren.
Ein Ansatz, der neue Möglichkeiten für die Automatisierung digitaler Aktivitäten eröffnet, die sich so „bewegen“, wie es ein Mensch am PC tun würde. Lassen Sie uns gemeinsam sehen, wie diese Technologie funktioniert und welche tatsächlichen Anwendungen sie bietet.
So funktioniert die Interaktion mit dem PC
Claude 3.5 Sonnet verwendet ein System namens „Computer Use API“, um mit dem Desktop zu interagieren. In der Praxis beobachtet die KI den Bildschirm anhand von Screenshots und analysiert, was sie sieht, genau wie ein menschlicher Benutzer. Wenn es mit einer Anwendung interagieren muss, berechnet es die Entfernung in Pixeln, um den gewünschten Punkt zu erreichen, und simuliert die erforderlichen Aktionen: Mausklicks, Tippen auf der Tastatur, Cursorbewegungen.
Wir haben Claude darin geschult, zu sehen, was auf dem Bildschirm passiert, und dann verfügbare Softwaretools zu verwenden, um die Aufgaben auszuführen.
Anthropisch
Die wichtigste Neuerung dieser Version? Eine lang erwartete Fähigkeit: die Möglichkeit, jede Desktop-Anwendung zu verwenden. Es geht nicht mehr nur darum, Fragen zu beantworten oder Texte zu generieren, sondern um aktiv mit der Software zu interagieren.
Das neue Sonnet 3.5, praktische Anwendungen
Die Einsatzmöglichkeiten sind zahlreich. Zum Beispiel, Replizieren, eine Softwareentwicklungsplattform, nutzt Claude 3.5 Sonnet bereits, um einen „autonomen Verifizierer“ zu erstellen, der Anwendungen während ihrer Entwicklung bewertet. canva, die Online-Grafikbearbeitungsplattform, erforscht Möglichkeiten, KI in den Design- und Bearbeitungsprozess zu integrieren.
Ist alles so „wow“, wie es scheint? NEIN. Wird er unsere Jobs stehlen? Weder. Es ist wichtig, die aktuellen Fähigkeiten des Systems realistisch einzuschätzen. Bei einem Flugbuchungstest gelang es Claude 3.5 Sonnet, weniger als die Hälfte der zugewiesenen Aufgaben erfolgreich zu erledigen. Selbst scheinbar einfache Aufgaben wie Scrollen und Zoomen können dennoch problematisch sein.
Andererseits gibt sie es selbst zu Anthropisch:
Claudes Nutzung des Computers bleibt langsam und oft fehleranfällig. Wir ermutigen Entwickler, mit Aufgaben mit geringem Risiko zu beginnen.
Wie lange wird es dauern, bis Sonnet 3.5 perfekt ist? Wird es Jahre, Monate oder Wochen dauern? Wenn Sie darüber nachdenken, kennen Sie die Antwort bereits oder etwas, das ihr sehr nahe kommt.
Ein paar Hinweise zur Sicherheit
Das Thema Sicherheit ist von grundlegender Bedeutung. Anthropisch, das als „guter Junge“ unter den KI-Unternehmen gilt, hat mehrere vorbeugende Maßnahmen umgesetzt:
- Die KI wird nicht auf Benutzer-Screenshots trainiert;
- Während des Trainings hat er keinen Zugang zum Internet;
- Um risikoreiche Maßnahmen zu vermeiden, wurden Klassifikatoren entwickelt.
- Aus Sicherheitsgründen werden Screenshots nur 30 Tage lang gespeichert.
Zukunftsaussichten
Parallel zur Entwicklung der neuen Version von Claude 3.5 Sonnet, Anthropisch kündigte außerdem die Ankunft einer aktualisierten Version von Haiku an, dem sparsamsten und effizientesten Modell der Claude-Serie. Ein kleiner Schritt auf dem Gebiet der KI, die auf verschiedenen Nutzungsebenen zugänglich ist. Natürlich verbraucht dieses Zeug immer noch viel, zu viel Energie und Ressourcen.
Besonders interessant erscheint mir jedenfalls, wie diese Technologie unser Verhältnis zu Computern verändert. Wir sprechen nicht mehr von einfachen Automatisierungsskripten, sondern von Systemen, die grafische Oberflächen auf fast menschliche Weise verstehen und mit ihnen interagieren.
Claude Sonnet 3.5: Ausgewogene Schritte nach vorne, aber in eine überraschende Richtung
Wie so oft im Bereich der KI wird der wahre Wert dieser Innovation nicht so sehr an ihren technischen Fähigkeiten gemessen, sondern daran, wie wir sie sinnvoll in unsere täglichen Arbeitsabläufe integrieren können. Die Herausforderung für die Zukunft wird darin bestehen, das richtige Gleichgewicht zwischen Automatisierung und menschlicher Kontrolle zu finden und das Potenzial dieser Technologie optimal auszuschöpfen, ohne ihre Grenzen und ethischen Verantwortlichkeiten aus den Augen zu verlieren.
Die Fähigkeiten von Claude 3.5 Sonnet sind an sich nicht beeindruckend, aber dennoch beeindruckend für die Richtung, die sie zeigen. Wir stehen noch am Anfang dieser technologischen Reise: Was wird bald passieren?