Sakana AI verfolgt mit Fugu einen anderen Ansatz als viele Anbieter großer Sprachmodelle: Nicht ein einzelnes Modell soll alle Aufgaben lösen, sondern ein System, das mehrere Modelle dynamisch koordiniert. Der neue Multi-LLM-Orchestrator des japanischen Start-ups verhält sich nach außen wie ein einzelnes Modell, entscheidet intern aber, ob eine Anfrage direkt beantwortet oder an spezialisierte KI-Agenten verteilt wird.
Fugu ist laut Sakana AI selbst ein Sprachmodell. Es wurde darauf trainiert, andere LLMs aus einem Agenten-Pool gezielt aufzurufen, Aufgaben zu delegieren, Ergebnisse zu prüfen und daraus eine gemeinsame Antwort zu synthetisieren. Nutzer greifen über eine einzelne OpenAI-kompatible API zu. Die eigentliche Orchestrierung bleibt im Hintergrund.
Zum Start bietet Sakana AI zwei Varianten an. Das Basismodell Fugu ist auf geringe Latenz und solide Alltagsleistung ausgelegt, etwa für Coding, Code-Reviews oder Chatbot-Anwendungen. Für Teams mit Datenschutz- oder Compliance-Anforderungen lassen sich einzelne Agenten aus dem Pool ausschließen. Fugu Ultra zielt dagegen auf maximale Antwortqualität bei komplexen, mehrstufigen Aufgaben. Frühe Nutzer setzten das System laut Sakana AI unter anderem für KI-Forschung, wissenschaftliche Reproduktionen, Cybersicherheitsanalysen sowie Patent- und Literaturrecherchen ein.
Nach eigenen Benchmark-Angaben soll Fugu Ultra über mehrere Coding-, Reasoning-, Wissenschafts- und Agenten-Benchmarks hinweg auf dem Niveau von Anthropics Fable 5 und Mythos Preview liegen. Diese Modelle befinden sich allerdings nicht im Agenten-Pool von Fugu, da sie nicht öffentlich verfügbar sind. Die Vergleichswerte der Basismodelle stammen laut Sakana AI von den jeweiligen Modellanbietern.
Strategisch positioniert Sakana AI Fugu auch als Antwort auf die Abhängigkeit von einzelnen KI-Anbietern. Das Unternehmen verweist auf die Exportkontrollen bei Anthropics Fable- und Mythos-Modellen als Beispiel dafür, dass der Zugang zu führenden KI-Systemen kurzfristig durch regulatorische oder außenpolitische Entscheidungen eingeschränkt werden kann. Ein austauschbarer Agenten-Pool soll in solchen Fällen dynamisch auf andere Modelle ausweichen.
Das löst jedoch nicht jedes Problem. Fugus Leistungsfähigkeit hängt weiterhin davon ab, welche Modelle tatsächlich im Pool verfügbar sind. Wenn mehrere führende Anbieter gleichzeitig den Zugang begrenzen, bleibt auch ein Orchestrator eingeschränkt. Fugu kann die Robustheit erhöhen, ersetzt aber keine echte technologische Souveränität.
Die ersten Praxiseindrücke fallen gemischt aus. Sakana AI berichtet von knapp 500 Beta-Nutzern und Stärken bei langen, unstrukturierten Arbeitsabläufen wie Datenforschung, Sicherheitsanalysen und Code-Reviews. Ein Entwickler soll bei Code-Reviews deutlich mehr gefundene Fehler beobachtet haben als bei GPT-5.5. Gleichzeitig kritisieren unabhängige Tester die geringe Geschwindigkeit, hohe Nutzungskosten und teils schwächere Ergebnisse als bei führenden Einzelmodellen. Auf Hacker News wurden unter anderem langsame API-Antworten und enge Nutzungslimits bemängelt, während Code-Reviews teilweise auf dem Niveau von Opus 4.8 oder GPT 5.5 gesehen wurden.
Technisch baut Fugu auf Sakana AIs Forschung zur gelernten Modell-Orchestrierung auf, darunter die Arbeiten Trinity und Conductor. Der Ansatz passt zur Leitidee des Unternehmens, KI-Systeme stärker als kollaborative Ökosysteme zu verstehen. Gegründet wurde Sakana AI von den früheren Google-KI-Experten Llion Jones und David Ha; Jones war Mitautor des Transformer-Papers „Attention Is All You Need“.
