Claude Sonnet 5: der Preis pro Token ist nicht der Preis pro Aufgabe

Agentic Engineering
Claude
Coding Agents
Automation

Anthropic hat Claude Sonnet 5 veröffentlicht. Die Schlagzeile schreibt sich fast von selbst: nahe an Opus 4.8, zum Einführungspreis von 2 Dollar je Million Eingabe-Tokens. Ich habe die Ankündigung trotzdem zweimal gelesen, wegen eines anderen Absatzes. Sonnet 5 nutzt einen neuen Tokenizer, und derselbe Text ergibt damit 1,0- bis 1,35-mal so viele Tokens wie bisher. Wer jetzt Preise pro Token vergleicht, vergleicht zwei verschiedene Maßeinheiten.

Was ist Claude Sonnet 5?

Sonnet 5 ist laut Anthropic das agentischste Sonnet bisher: Es plant, nutzt Werkzeuge wie Browser und Terminal und arbeitet autonom auf einem Niveau, für das bisher größere Modelle nötig waren. Gegenüber Sonnet 4.6 nennt Anthropic deutliche Verbesserungen bei Reasoning, Tool-Nutzung, Coding und Wissensarbeit. Auf den agentischen Evaluationen BrowseComp und OSWorld-Verified deckt das Modell ein breiteres Spektrum an Kosten-Leistungs-Punkten ab als der Vorgänger und erreicht in einzelnen Fällen das Niveau von Opus 4.8. Über die API läuft es als claude-sonnet-5. In den Free- und Pro-Plänen ist es ab sofort das Standardmodell, für Max, Team und Enterprise, in Claude Code und auf der Claude Platform ist es verfügbar, und die Rate-Limits steigen quer durch Chat, Cowork, Claude Code und die Platform. Sicherheitsseitig meldet Anthropic seltener unerwünschtes Verhalten als bei Sonnet 4.6, deutlich schwächere Leistung als Opus 4.8 bei der Entwicklung von Exploits, und die Cyber-Schutzmaßnahmen sind wie bei Opus 4.7 und 4.8 ab Start aktiv.

Was kostet es wirklich?

Auf dem Papier ist die Rechnung einfach. Bis zum 31. August 2026 gilt der Einführungspreis: 2 Dollar je Million Eingabe-Tokens, 10 Dollar für die Ausgabe. Danach kostet es 3 und 15. Opus 4.8 liegt bei 5 und 25. Nur hat sich die Einheit geändert: Der neue Tokenizer zerlegt denselben Inhalt je nach Typ in 1,0- bis 1,35-mal so viele Tokens. Anthropic sagt selbst, der Einführungspreis sei so gesetzt, dass der Umstieg ungefähr kostenneutral ausfällt. Der Umkehrschluss steht nicht in der Ankündigung, liegt aber auf der Hand: Der Standardpreis ist es nicht. Ab September zahlen Sie 3 und 15 auf eine Token-Zahl, die je nach Inhalt bis zu 35 Prozent über der alten Zählung liegt.

Warum der Faktor 1,35 gerade bei Agenten zählt

Bei einem einzelnen Chat-Prompt ist der Unterschied Kleingeld. Bei einem Agenten-Lauf nicht, denn dort wandert derselbe Kontext in jeder Schleife erneut durch das Modell: Systemprompt, Tool-Definitionen, Dateiinhalte, Zwischenergebnisse. Ein Faktor auf die Token-Zahl wirkt auf jede dieser Runden, nicht nur auf die erste. Deshalb mein praktischer Rat: Vergleichen Sie keine Preistabellen, sondern Kosten pro Aufgabe. Nehmen Sie zwei oder drei typische Läufe aus Ihrem Alltag, lassen Sie sie auf Sonnet 5 und auf Ihrem bisherigen Modell laufen und schauen Sie auf die tatsächliche Abrechnung. Die Wochen bis Ende August sind dafür der richtige Zeitraum, solange der kostenneutrale Einführungspreis die Umstellung abfedert.

Das bessere Werkzeug, ehrlich gerechnet

Als Opus 4.8 erschien, habe ich geschrieben, dass für meine Arbeit nicht die Benchmarks entscheiden, sondern das Verhalten im Alltag. Hier gilt dieselbe Linie mit umgekehrtem Vorzeichen: Ein Sonnet, das agentische Aufgaben auf diesem Niveau trägt, ist für viele Routine-Läufe vermutlich das ökonomischere Werkzeug. Aber „günstiger pro Token“ ist eine Behauptung, „günstiger pro Aufgabe“ ist ein Messwert. Wie überall im Agentic Engineering entscheidet nicht das Datenblatt, sondern die Prüfung mit den eigenen Läufen. Die machen Sie, nicht das Modell.

Quellen

Anthropic: Introducing Claude Sonnet 5