Sakana Fugu: Orchestrierung als Produkt, die Prüfung bleibt bei Ihnen

Agentic Engineering
Automation
Verification

Sakana AI hat am 22. Juni Sakana Fugu vorgestellt, ein Multi-Agenten-System, das sich nach außen wie ein einzelnes Modell verhält. Sie schicken eine Anfrage an einen Endpunkt, und Fugu entscheidet selbst, ob es direkt antwortet oder ein Team spezialisierter Modelle zusammenstellt und koordiniert. Die Auswahl der Modelle, die Delegation, die Verifikation und die Synthese laufen intern ab. Die Verdrahtung, die Sie sonst selbst bauen müssten, wird zum API-Aufruf. Das ist die eigentliche Nachricht: nicht ein neues Spitzenmodell, sondern ein Produkt, das die Orchestrierung verkauft.

Was ist Sakana Fugu?

Fugu ist laut Sakana selbst ein Sprachmodell, das darauf trainiert wurde, andere Modelle in einem Agenten-Pool aufzurufen, darunter rekursiv auch sich selbst. Es soll erkennen, wann es delegieren muss, wie die Agenten miteinander kommunizieren und wie sich ihre Teilergebnisse zu einer Antwort zusammenfügen. Von außen rufen Sie ein Modell. Innen arbeitet ein koordiniertes System aus Experten. Sakana verweist auf zwei eigene Arbeiten von der ICLR 2026, Trinity und Conductor, als Grundlage dieser gelernten Orchestrierung.

Der Zugang läuft über eine einzige OpenAI-kompatible API. Das senkt die Einstiegshürde fast auf null: Wer heute einen Chat-Endpunkt anspricht, tauscht die Basis-URL und hat ein Agenten-Ensemble hinter dem gleichen Aufruf. Sakana spricht von einem Beta-Programm mit knapp 500 frühen Nutzern und nennt das Produkt ab sofort allgemein verfügbar, mit Abo-Stufen und einem nutzungsabhängigen Tarif für größere Lasten.

Fugu und Fugu Ultra

Es gibt zwei Modelle. Fugu wiegt Leistung gegen niedrige Latenz ab und ist als Standard für den Alltag gedacht, etwa in Coding-Werkzeugen wie Codex oder in interaktiven Diensten. Für Teams mit Daten-, Datenschutz- oder Compliance-Anforderungen lässt sich einzelne Agenten aus dem Pool ausschließen. Fugu Ultra ist auf maximale Antwortqualität bei schweren, mehrstufigen Aufgaben getrimmt und zieht einen tieferen Pool an Experten heran. Sakana nennt als typische Einsätze KI-Forschung, das Reproduzieren von Papern, Sicherheitsanalysen sowie Literatur- und Patentrecherche.

Zu den Benchmarks ist Vorsicht angebracht, und Sakana ist hier ungewöhnlich offen. Das Unternehmen beansprucht, dass Fugu Ultra über anspruchsvolle Engineering-, Wissenschafts- und Reasoning-Benchmarks hinweg mit führenden Modellen wie Anthropics Fable 5 und Mythos Preview gleichauf liege. Alle Werte außer denen von Fugu stammen von den jeweiligen Anbietern, sind also nicht unabhängig nachgemessen. Und Fable 5 wie Mythos Preview sind ausdrücklich nicht Teil von Fugus Pool, weil sie nicht öffentlich zugänglich sind. Das ist kein Zufall, sondern der Kern der Verkaufsgeschichte.

Warum verkauft Sakana das als Souveränität?

Sakana rahmt Fugu nicht als reine Bequemlichkeit, sondern als Absicherung gegen die Abhängigkeit von einem einzelnen Anbieter. Wer kritische Infrastruktur, Finanzprozesse oder Verwaltung an einer einzigen API betreibt, hat eine reale Schwachstelle. Sakana verweist dabei direkt auf die Exportkontrollen, die Anthropics Fable- und Mythos-Modelle getroffen haben. Genau dieses Risiko habe ich beim Rückruf von Fable 5 schon beschrieben: Ein Modell ist kein Fundament, wenn der Zugang über Nacht verschwinden kann.

Das Versprechen lautet: Fällt ein Anbieter aus, routet Fugu dynamisch darum herum, weil die Modelle im Pool austauschbar sind. Das ist ein ehrliches Argument. Es verschiebt aber nur die Abhängigkeit. Statt an einem Modellanbieter hängen Sie an Sakanas Orchestrierungsschicht, die entscheidet, welches Modell Ihre Anfrage sieht. Die Konzentration verschwindet nicht, sie wechselt die Ebene.

Was abstrahiert wird, verschwindet aus dem Blick

Hier liegt der Punkt, der mich als Praktiker interessiert. Eine Orchestrierung, die ich selbst baue, ist Arbeit, aber sie ist sichtbar. Ich sehe, welcher Agent welche Aufgabe bekommt, wo ein Schritt fehlschlägt, wie ein Ergebnis geprüft wird. Verlässlichkeit entsteht nicht im einzelnen Modell, sondern in der Schleife darum herum, und genau das habe ich beim Loop Engineering beschrieben. Fugu nimmt mir diese Schleife ab. Damit nimmt es mir auch den Blick darauf.

Sakana sagt selbst, dass Modellauswahl, Delegation, Verifikation und Synthese intern ablaufen, „damit die Komplexität eines Multi-Agenten-Systems nie Ihren Code erreicht“. Das ist als Komfort gemeint, und für viele Anwendungen ist es genau das. Aber die Verifikation ist nicht irgendein Schritt, sondern der, der über richtig und falsch entscheidet. Wenn ein Anbieter sie intern erledigt und als bestanden meldet, prüfen Sie nicht mehr, ob die Antwort stimmt, sondern vertrauen darauf, dass jemand anderes geprüft hat. Bei einer Code-Review, einer Sicherheitsanalyse oder einer Patentrecherche ist das ein Unterschied, der zählt.

Was heißt das für Sie?

Fugu ist ein gutes Werkzeug für Aufgaben, bei denen ein koordiniertes Ensemble messbar besser ist als ein einzelner Aufruf und bei denen Sie das Ergebnis ohnehin am Ende prüfen. Genau dort verdient die Abstraktion ihren Platz: Sie sparen sich die Verdrahtung und behalten die Kontrolle über das, was zählt. Riskant wird es, wenn Sie die interne Verifikation für Ihre eigene halten. Ein Produkt, das die Orchestrierung übernimmt, übernimmt nicht die Verantwortung. Die bleibt bei Ihnen, und sie wird nicht leichter, nur weil ein API-Aufwand kleiner geworden ist. Behandeln Sie Fugu als einen sehr fähigen Lieferanten, dessen Ergebnis Sie abnehmen, und nicht als Instanz, die Ihre Prüfung ersetzt.