Cloud-KI 6 Min. Lesezeit

Sakana Fugu Ultra: KI-Orchestrator mit Agenten-Pool statt lokalem Modell

Sakana Fugu Ultra ist kein lokales LLM, sondern ein Cloud-Orchestrator mit mehreren Agenten. Was das fuer Mac-Nutzer, EU-Verfuegbarkeit und Preise bedeutet.

Technische Recherche und redaktionelle Prüfung. Eigene Messungen werden im Artikel ausdrücklich gekennzeichnet.

Veröffentlicht: 24. Juni 2026 Aktualisiert: 24. Juni 2026

Redaktionelle Methode

Sakana Fugu Ultra ist kein weiteres LLM mit Gewichten fuer Ollama oder MLX. Das Produkt von Sakana AI ist ein KI-Orchestrator: Hinter einer OpenAI-kompatiblen API waehlt und koordiniert es mehrere leistungsstarke Modelle fuer eine Anfrage. Fugu Ultra ist die Variante fuer schwierige, mehrstufige Aufgaben, bei der Antwortqualitaet wichtiger ist als kurze Wartezeit.

Das klingt zunaechst wie ein Detail. In der Praxis veraendert es fast alles: Es gibt kein GGUF, keine MLX-Version und keinen lokalen Benchmark auf einem Mac. Statt ein Modell auf Apple Silicon auszufuehren, sendet man eine Aufgabe an einen Cloud-Dienst, dessen interne Modellwahl Sakana nicht offenlegt.

Kurz eingeordnet: Fugu Ultra ist interessant, weil es Modell-Routing und Agentenkoordination als Produkt verkauft, nicht weil es ein neues lokales Foundation Model waere. Fuer Nutzer in Deutschland gibt es zum Start aber eine harte Grenze: Sakana bietet Fugu derzeit nicht in der EU bzw. im EWR an.

Was Sakana Fugu Ultra eigentlich ist

Ein einzelnes Sprachmodell muss bei jeder Aufgabe selbst entscheiden, wie es plant, rechnet, programmiert und seine Antwort prueft. Fugu Ultra verfolgt einen anderen Ansatz: Ein kleinerer Koordinator zerlegt eine Aufgabe, beauftragt passende Agenten aus einem Modellpool und kombiniert deren Arbeit zu einer Antwort.

Sakana beschreibt Fugu Ultra als die leistungsorientierte Variante neben dem schnelleren Standardmodell Fugu. Laut Anbieter soll Ultra fuer aufwendige Coding-, Forschungs- und Reasoning-Aufgaben einen tieferen Pool spezialisierter Agenten koordinieren. Als Beispiele nennt Sakana unter anderem Paper-Reproduktion, Kaggle-Wettbewerbe, Cybersecurity-Analysen sowie Literatur- und Patentrecherchen.

Die zentrale Idee ist nicht neu. Multi-Agent-Systeme und Model Routing gibt es seit Jahren. Sakana versucht jedoch, die Zusammenarbeit nicht fuer jeden Anwendungsfall von Hand zu verdrahten. Die Grundlage bilden die Forschungsarbeiten TRINITY und Conductor:

  1. Ein Koordinator betrachtet Anfrage und bisherigen Arbeitsverlauf.
  2. Er waehlt einen Agenten und eine Rolle, etwa Thinker, Worker oder Verifier.
  3. Die Agenten arbeiten in mehreren Schritten; ein Verifier kann eine Antwort pruefen oder weitere Arbeit ausloesen.
  4. Das System beendet den Ablauf, wenn eine Antwort ausreichend abgesichert erscheint oder das vorgegebene Budget erreicht ist.

TRINITY beschreibt dafuer einen kompakten Koordinator mit einem kleinen Entscheidungs-Head. Conductor untersucht dagegen, wie ein Modell per Reinforcement Learning Kommunikationsmuster und gezielte Arbeitsauftraege fuer andere LLMs lernen kann. Das ist eine sinnvollere technische Einordnung als die vereinfachte Aussage, Fugu Ultra sei selbst ein neues Frontier-Modell.

Fugu Ultra ist weder Open Source noch lokal auf dem Mac nutzbar

Wer auf einem Mac lokale KI mit Ollama, LM Studio oder MLX betreibt, sollte die Produktkategorie sauber trennen:

FrageAntwort
Laesst sich Fugu Ultra als GGUF herunterladen?Nein. Sakana stellt keine lokalen Modellgewichte fuer Fugu Ultra bereit.
Laeuft es ueber MLX auf Apple Silicon?Nein. Es ist ein gehosteter API-Dienst, nicht ein MLX-Modell.
Kann ein Mac trotzdem genutzt werden?Ja, als Entwicklungsrechner bzw. API-Client. Die eigentliche Inferenz und Orchestrierung laufen nicht lokal.
Sind die eingesetzten Basismodelle pro Anfrage sichtbar?Nein. Sakana legt Routing und konkrete Modellauswahl nicht offen.
Ist Fugu Ultra Open Source?Nein. Die zugrunde liegenden Forschungsarbeiten und ein technischer Bericht sind oeffentlich, das kommerzielle Produkt ist es nicht.

Gerade die letzte Zeile ist wichtig. Die Tatsache, dass Sakana Papers veroeffentlicht, macht den Dienst nicht zu einem offenen Modell. Fuer Datenschutz- oder Compliance-Pruefungen reicht eine OpenAI-kompatible API allein ebenfalls nicht aus: Bei Fugu Ultra ist der gesamte Agentenpool laut Sakana fest vorgegeben.

Benchmarks: starke Werte, aber nicht als unabhaengigen Vergleich lesen

Sakana veroeffentlichte zum Start Werte fuer Coding-, Reasoning- und Long-Context-Benchmarks. Die Tabelle unten zeigt einen aussagekraeftigen Ausschnitt. Hoehere Werte sind besser.

BenchmarkFugu UltraOpus 4.8Gemini 3.1 ProGPT-5.5Einordnung
SWE-bench Pro73,769,254,258,6Software-Engineering-Aufgaben mit mini-swe-agent
TerminalBench 2.182,174,670,378,2Arbeit im Terminal bzw. mit Tools
LiveCodeBench Pro90,884,882,988,4aktuelle Programmieraufgaben
Humanity’s Last Exam50,049,844,441,4sehr schwierige Wissens- und Reasoning-Fragen
CharXiv Reasoning86,684,283,384,1wissenschaftliches Reasoning mit Diagrammen
GPQA-Diamond95,592,094,393,6anspruchsvolle Fachfragen
SciCode58,753,558,956,1wissenschaftliches Programmieren
Long Context Reasoning73,367,772,774,3Schlussfolgern in langen Kontexten
MRCRv293,687,984,994,8Retrieval in langen Kontexten

Das liest sich beeindruckend. Dennoch sollte man daraus nicht “Fugu Ultra ist in allem das beste Modell” machen.

Erstens stammen die Fugu-Ergebnisse von Sakana selbst. Zweitens uebernimmt Sakana fuer die Baselines zum Teil von deren Anbietern gemeldete Werte. Drittens sind Agentensysteme stark von Tool-Scaffold, Turn-Budget, Prompting und Kostenbudget abhaengig. Bei SWE-bench Pro verwendet Sakana beispielsweise mini-swe-agent als Scaffold. Ein fairer Kaufvergleich braucht daher reproduzierbare Einstellungen und reale Aufgaben aus dem eigenen Workflow.

Die Tabelle zeigt auch genau, warum das wichtig ist: Fugu Ultra liegt bei SciCode, Long Context Reasoning und MRCRv2 nicht vorne. Orchestrierung kann bei komplexer Arbeit helfen, ist aber keine magische Garantie fuer jeden Benchmark oder jede Produktionsaufgabe.

Preis und Verfuegbarkeit: fuer Deutschland derzeit der entscheidende Punkt

Fugu Ultra ist laut Sakana als fugu-ultra-20260615 ueber eine OpenAI-kompatible API geplant. Im Pay-as-you-go-Modell nennt der Anbieter fuer Kontexte bis einschliesslich 272.000 Token diese Preise:

TokenartPreis pro 1 Mio. Token
Input5 US-Dollar
Cached Input0,50 US-Dollar
Output30 US-Dollar

Ueber 272.000 Kontext-Token steigen die genannten Preise auf 10 US-Dollar Input, 1 US-Dollar Cached Input und 45 US-Dollar Output pro Million Token. Ein kleiner Rechenpunkt zur Orientierung: 100.000 Input-Token plus 10.000 Output-Token kosten bei der unteren Stufe rechnerisch etwa 0,80 US-Dollar, sofern kein Cache-Effekt greift. Bei agentischen Langlaeufen kann die Zahl der Aufrufe und der Output-Anteil jedoch schnell relevanter werden als der Preis einer einzelnen Chat-Anfrage.

Sakana verspricht, bei mehreren aktiven Agenten keine Gebuehren pro Modell zu stapeln. Das ist gut fuer die Abrechnung, ersetzt aber kein Kostenmonitoring. Die konkrete Auswahl der darunterliegenden Modelle und die Koordination bleiben proprietaer; pro Anfrage wird nicht offengelegt, welche Anbieter oder Modelle beteiligt waren.

Fuer Leser in Deutschland ist die aktuelle Verfuegbarkeit noch wichtiger als die Tokenpreise: Auf der Produktseite schreibt Sakana, dass Fugu noch nicht in der EU bzw. im EWR angeboten wird, waehrend das Unternehmen an GDPR- und regionsspezifischer Compliance arbeitet. Deshalb ist das hier keine Anleitung zum Umgehen einer Regionssperre. Stand 24. Juni 2026 ist Fugu Ultra fuer deutsche Nutzer kein normal buchbarer API-Dienst.

Was bedeutet das fuer Mac-Nutzer?

Fugu Ultra passt thematisch zu einem Mac-KI-Setup, aber anders als lokale Modelle:

  • Als API-Werkzeug: Ein Mac kann Editor, Terminal, Agenten-Client und Datenvorbereitung uebernehmen. Fugu Ultra waere der entfernte Reasoning- und Orchestrierungsdienst.
  • Nicht als private lokale KI: Prompts und Arbeitskontext verlassen den Rechner. Wer vertrauliche Dokumente bewusst lokal in Ollama oder MLX verarbeitet, bekommt mit Fugu Ultra keinen Ersatz.
  • Nicht als Hardware-Test: RAM-Groesse, Unified Memory und Metal-Performance eines M1 bis M4 sagen hier nichts ueber die Modellleistung aus. Relevant sind Netzverbindung, API-Kosten, Datenfluss, Latenz und die Qualitaet des Agenten-Workflows.
  • Als Produktidee bemerkenswert: Fugu zeigt eine moegliche Zukunft, in der Nutzer nicht mehr zwischen einzelnen Frontier-Modellen waehlen, sondern einen Dienst fuer die Auswahl und Zusammenarbeit bezahlen.

Fuer lokale Workflows bleiben Ollama, MLX, LM Studio und Modelle mit offenen Gewichten die passendere Kategorie. Fugu Ultra konkurriert eher mit komplexen Cloud-Agenten und Premium-APIs als mit einem Qwen- oder Llama-Download.

Fuer wen Fugu Ultra sinnvoll sein koennte - und fuer wen nicht

Potenziell passend: Teams ausserhalb der EU/EWR, die lange, mehrstufige Aufgaben automatisieren und die Ergebnisse ohnehin fachlich pruefen. Dazu zaehlen etwa reproduzierbare Forschungsexperimente, Code-Analyse mit klarer Testabdeckung oder strukturierte Literaturauswertung.

Derzeit nicht passend: Nutzer in Deutschland und anderen EU-/EWR-Staaten, lokale-First-Workflows, Organisationen mit zwingender Transparenz ueber jeden beteiligten Modellanbieter sowie Aufgaben, bei denen ein plausibel formulierter Fehler nicht akzeptabel ist.

Auch bei Security-Arbeit gilt: Ein Modell darf nur in einem klar abgegrenzten, autorisierten Rahmen eingesetzt werden. Ein Anbieterbeispiel ist keine Sicherheitsfreigabe und keine Alternative zu menschlicher Verantwortung, Tests und Freigabeprozessen.

Fazit

Sakana Fugu Ultra ist interessant, weil es eine unbequeme Frage direkt adressiert: Warum soll ein Nutzer fuer jede Aufgabe selbst raten, welches Modell und welcher Agentenablauf gerade der beste ist? Sakana verlagert diese Entscheidung in einen proprietaeren Orchestrator und meldet dafuer sehr starke, aber noch nicht unabhaengig validierte Benchmark-Ergebnisse.

Fuer einen lokalen Mac-KI-Stack ist Fugu Ultra kein neues Modell zum Ausprobieren. Es ist ein Cloud-Dienst mit intransparenter Modellkette, hohem Anspruch an Kosten- und Datenschutzpruefung und aktuell ohne regulaeren Zugang aus der EU/EWR. Wer genau diese Grenzen versteht, kann den Launch trotzdem als eines der spannendsten Produktkonzepte rund um KI-Agenten im Jahr 2026 einordnen.

Häufig gestellte Fragen

Kann ich Sakana Fugu Ultra auf einem Mac lokal installieren?

Nein. Es gibt keine lokalen Gewichte, kein GGUF und keine MLX-Ausgabe von Fugu Ultra. Ein Mac kann nur als Client fuer die gehostete API dienen.

Welches Modell nutzt Fugu Ultra?

Sakana nennt einen Pool leistungsstarker Modelle, legt aber nicht offen, welches konkrete Modell bei einer einzelnen Anfrage eingesetzt wurde. Bei Fugu Ultra ist der Pool nach Anbieterangabe fest.

Ist Fugu Ultra besser als GPT-5.5, Gemini oder Opus?

Auf mehreren von Sakana veroeffentlichten Benchmarks liegt Fugu Ultra vorne, auf anderen nicht. Die Ergebnisse stammen aus dem Anbieter-Reporting und verwenden nicht durchgehend eine einheitliche, unabhaengige Testumgebung. Fuer eine konkrete Aufgabe bleibt ein eigener Test mit festen Kosten- und Qualitaetskriterien notwendig.

Ist Sakana Fugu Ultra in Deutschland verfuegbar?

Nach aktuellem Stand nein: Sakana nennt die EU und den EWR als noch nicht unterstuetzte Regionen. Diese Verfuegbarkeit kann sich aendern; vor einem Einsatz sollten Produktseite, Bedingungen und Datenschutzunterlagen erneut geprueft werden.

Transparenz

Quellen und Prüfgrundlage

5

Diese Primär- und Referenzquellen bilden die Grundlage der technischen Einordnung. Herstellerangaben und externe Benchmarks werden im Artikel als solche gekennzeichnet.

  1. sakana.aifugu-release
  2. sakana.aifugu
  3. github.commain / Fugu_technical_report.pdf
  4. arxiv.orgabs / 2512.04695
  5. arxiv.orgabs / 2512.04388