Alex Albrecht di Anthropisch Er nahm kein Blatt vor den Mund: „Claude 4 ist das beste Programmiermodell der Welt.“ Eine kühne Behauptung, die jedoch durch die Fakten bestätigt wird. Die Tests sind gnadenlos: 72.5 % auf dem SWE-Bench verifiziert, sieben Stunden autonomes Arbeiten ohne Unterbrechungen, Fähigkeit, Tausende von Schritten nacheinander auszuführen. Claude 4 ist nicht nur eine technologische Weiterentwicklung, sondern ein Paradigmenwechsel, der neu definiert, was künstliche Intelligenz leisten kann. Und das Beste daran: Sie können es noch heute ausprobieren.
Wenn KI beschließt, Überstunden zu machen
Heute hat Anthropic einen jener Schritte unternommen, bei denen man denkt: „Jetzt stecken wir in Schwierigkeiten.“ Er veröffentlichte Claude 4 Opus und Claude 4 Sonnet, markiert die Rückkehr des Unternehmens zu den großen Modellen, nachdem die Sonnet-Varianten monatelang perfektioniert wurden. Die wahre Überraschung? Dieses System kann 24 Stunden am Stück arbeiten, ohne die Kontrolle zu verlieren.
Ja, Sir: Während Ihr Entwicklerkollege nach den ersten acht Stunden des Debuggens anfängt, unverständliches Gemurmel zu murmeln, Claude 4 Opus Er demonstrierte, dass er einen ganzen Tag lang Pokémon spielen oder sieben Stunden am Stück Code-Refactoring durchführen konnte. Die bisherigen Modelle hatten die Ausdauer eines Marathon-Anfängers: Nach zwei Stunden begannen sie, eine Reihe von Fehlern zu produzieren. Wie er gesteht Albert selbst:
„Es besteht eine große Nachfrage nach Agentenanwendungen und Claude 4 passt perfekt in dieses Szenario.“

Die Zahlen, die die Konkurrenz erzittern lassen
Sagen wir es so: Wenn Benchmarks ein Pokerspiel wären, hätte Claude 4 einfach vier Asse gespielt. 72.5 % auf der SWE-Bench-Verifizierung, ein Ergebnis, das frühere Modelle wie Anfänger aussehen lässt. Um Ihnen eine Vorstellung zu geben: Das Überschreiten von 50 % bei diesem Benchmark galt bereits als ein Wunder. Die offiziellen Daten Sie weisen auch auf der Terminal-Bench beeindruckende 43.2 % auf.
GitHub bekam sofort Wind von dem Deal und beschloss, Claude Sonnet 4 als Grundlage für den neuen Coding-Agenten in GitHub Copilot zu verwenden. Wenn GitHub die Pferde wechselt, gibt es dafür immer einen guten Grund. Sourcegraph spricht von „einem erheblichen Sprung in der Softwareentwicklung“, während Augment Code von „höheren Erfolgsraten und chirurgischeren Codeänderungen“ berichtet. Kurz gesagt: Jeder möchte auf den Zug von Claude 4 aufspringen.
Claude 4: Sicherheit geht vor (aber ohne Paranoia)
Anthropic hat aktiviert zum ersten Mal seinen AI Safety Level 3-Standard, der normalerweise „potenziell gefährlichen“ Modellen vorbehalten ist. Der Grund? Claude 4 Opus könnte theoretisch jemandem mit wissenschaftlichen Kenntnissen dabei helfen, chemische, biologische oder nukleare Waffen zu entwickeln. Er ist im Grunde so schlau, dass man ihn unter Kontrolle halten muss.
Doch es herrscht nicht nur Trübsal: Bei den neuen Modellen ist die Wahrscheinlichkeit, dass geschummelt oder an falschen Stellen gespart wird, um 65 Prozent geringer als bei ihren Vorgängern. Es scheint, als hätten sie nicht nur gelernt, klüger, sondern auch ehrlicher zu sein. Kurz gesagt, ein bisschen wie Erwachsenwerden.
Der fehlende „Deep Thinking“-Modus
Claude 4 führt etwas wirklich Innovatives ein: ein Hybridsystem, das von blitzschnellen Reaktionen zu detaillierten Reflexionen wechseln kann. Wenn Sie den erweiterten Denkmodus aktivieren, nimmt sich das Modell buchstäblich Zeit zum Nachdenken und zeigt Ihnen eine Zusammenfassung dessen, was es in seinem „digitalen Verstand“ verarbeitet. Es ist, als würde Ihnen ein Kollege endlich seinen Gedankengang erklären, anstatt Ihnen einfach die Lösung vor die Füße zu werfen.
Integration mit Claude Code ist jetzt für alle verfügbar, mit Unterstützung für GitHub Actions und direkten Integrationen mit VS Code und JetBrains. Die vorgeschlagenen Änderungen werden direkt in Ihren Dateien angezeigt. Schluss mit wildem Kopieren und Einfügen: Claude erledigt alles direkt in Ihrer Arbeitsumgebung.
Das Milliardengeschäft (buchstäblich)
Die Geschäftszahlen sprechen für sich: Anthropisch hat erreicht Der Jahresumsatz belief sich im ersten Quartal auf 2 Milliarden US-Dollar, was mehr als einer Verdoppelung der vorherigen Leistung entspricht. Mike Krieger, Chief Product Officer, gibt offen zu: „Früher habe ich Claude als Denkpartner genutzt und die meisten Texte selbst geschrieben. Jetzt übernimmt Claude 4 den Großteil meiner Texte.“
Das ist derselbe Krieger, der Instagram mitbegründet hat. Wenn er also sagt, dass KI ihm Zeit spart, sollten wir vielleicht zuhören. Auch, weil er es nicht selbst singen und spielen kann: Cursor nennt Claude 4 „topaktuell für die Codierung“, während Replizieren spricht von „dramatischen Fortschritten bei komplexen Bearbeitungen mehrerer Dateien“. Wenn selbst die professionellsten Werkzeuge Ihnen Komplimente machen, bedeutet das, dass Sie ins Schwarze getroffen haben.

Claude 4, der Moment der Wahrheit
Wie wir bereits gesehen haben Mit Claude 2.0 wird der Kampf zwischen generativer KI immer heftiger. Aber dieses Mal habe ich mich entschieden, etwas anderes zu machen: ein Experiment, das diesen Artikel in seiner Art einzigartig macht.
Ich habe die letzten Stunden damit verbracht, Claude 4 auf jede erdenkliche Weise zu testen. Online-Recherche, Quellenanalyse, Inhaltsstrukturierung, kreatives Schreiben, sogar Ironie und Witze. Und ich muss zugeben, die Ergebnisse haben mich überrascht. Die 700 Wörter, die Sie gerade gelesen haben? Sie sind das Ergebnis dieser intensiven Tests.
Die Frage, die ich Ihnen stelle, ist einfach: Können Sie zwischen dem, was ich geschrieben habe, und dem, was Claude 4 geschrieben hat, unterscheiden? Denn ehrlich gesagt bin ich mir nach diesem Test nicht einmal mehr sicher.
Die Zukunft der KI ist kein fernes Versprechen mehr. Er ist hier und vielleicht hat er Ihnen gerade seine Geschichte erzählt, ohne dass Sie es bemerkt haben.