Che cos’è Sakana Fugu
Il 22 giugno 2026 il laboratorio giapponese Sakana AI ha presentato Sakana Fugu, descritto come “un sistema multi-agente che si comporta come un singolo modello”. Non è un nuovo LLM monolitico: è una famiglia di modelli-orchestratori. Fugu è esso stesso un modello linguistico, addestrato a interpretare la richiesta dell’utente e a comporre dinamicamente lo scaffold di agenti necessario a risolverla, chiamando di volta in volta diversi LLM di un pool, comprese ricorsivamente istanze di sé stesso.
Tutto questo dietro un’unica API compatibile con OpenAI: chi integra invia la richiesta a un solo endpoint, e la selezione dei modelli, la delega, la verifica e la sintesi finale avvengono internamente. Due le varianti: Fugu, a bassa latenza per i compiti quotidiani (code review, chatbot), e Fugu Ultra, tarata sulla massima qualità per problemi complessi e multi-step (ricerca AI, analisi di cybersecurity, indagini brevettuali). Distribuzione a sottoscrizione, con piano pay-as-you-go per i carichi enterprise.
Come funziona
La tecnologia poggia su due lavori di ricerca presentati a ICLR 2026:
- TRINITY (An Evolved LLM Coordinator): un coordinatore leggero, ottenuto per via evolutiva, che assegna a LLM diversi i ruoli di Thinker, Worker e Verifier lungo più turni.
- The Conductor (Learning to Orchestrate Agents in Natural Language): addestrato con reinforcement learning a scoprire da solo strategie di coordinamento espresse in linguaggio naturale, invece di affidarsi a workflow scritti a mano.
L’addestramento combina fine-tuning su larga scala, algoritmi evolutivi e RL. L’aspetto più interessante è l’orchestrazione ricorsiva: Fugu può rileggere il proprio output e decidere se adottare una strategia di coordinamento migliore, senza alcun riaddestramento.
I numeri (dichiarati da Sakana)
Secondo le cifre pubblicate dall’azienda nel report tecnico, Fugu Ultra è in testa su quattro benchmark di coding, su CharXiv Reasoning e su Humanity’s Last Exam. Alcuni valori riportati:
- SWE-Bench Pro: 73,7 (Ultra), 59,0 (Fugu)
- LiveCodeBench: 93,2 (Ultra), 92,9 (Fugu)
- GPQA-Diamond: 95,5 per entrambe le varianti
Sakana sostiene che Fugu Ultra “regge il confronto” con modelli di punta come Fable 5 e Mythos Preview. Come sempre con i benchmark auto-riportati, sono numeri da prendere con cautela e da verificare in modo indipendente.
La scommessa: niente lock-in da un singolo fornitore
La motivazione dichiarata è esplicita. Sakana inquadra Fugu come copertura contro la dipendenza da un singolo fornitore: “le recenti turbolenze nel panorama AI hanno mostrato il grave rischio della dipendenza da un unico vendor”. L’azienda cita come esempio, testualmente, gli “export control imposti ai modelli Fable e Mythos di Anthropic”, per cui l’accesso “può cambiare o sparire da un giorno all’altro”. Se un fornitore limita l’accesso, l’orchestratore instrada il lavoro su altri modelli del pool.
È una tesi di resilienza architetturale: spostare il valore dal singolo modello alla capacità di coordinarne molti. L’idea è interessante, ma come vedremo in Europa si scontra con un dettaglio non da poco.
Il paradosso europeo
Qui sta il punto per chi opera in Italia e in UE. Al lancio, Fugu non è disponibile in UE/SEE: Sakana dichiara di essere ancora al lavoro sulla conformità GDPR e nel frattempo non eroga il servizio negli Stati membri UE/SEE (Stati Uniti e Regno Unito sono invece già attivi).
Il motivo è strutturale. Il routing dei modelli non è esposto “by design”: l’utente non sa quale modello di terze parti elabori la sua richiesta e, di conseguenza, dove e da chi vengano trattati i dati. Per un’architettura black-box di questo tipo le domande GDPR sono concrete: titolare e responsabili del trattamento, trasferimenti extra-UE, base giuridica, trasparenza verso l’interessato. È paradossale che proprio uno strumento pensato per ridurre la dipendenza da un fornitore arrivi, in Europa, con un vincolo di accesso geografico.
Cosa ne pensiamo
Trattare l’orchestrazione multi-modello come un prodotto è un’idea solida, e probabilmente una delle direzioni dei prossimi mesi: su molti task reali il guadagno viene più dal come si combinano i modelli che dal singolo modello. Per un’azienda o una PA italiana, però, valgono oggi due note pratiche:
- In UE non è utilizzabile, e quando lo sarà la trasparenza sul routing sarà dirimente per qualsiasi valutazione GDPR/DPIA.
- La tesi anti lock-in è corretta, ma si può perseguire anche senza affidarsi a una scatola nera: un’orchestrazione multi-modello gestita internamente, con modelli open o self-hosted dove i dati lo richiedono, mantiene il controllo su routing e trattamento.
In sintesi: segnale tecnologico importante, da tenere d’occhio; in Europa, per ora, più spunto architetturale che strumento adottabile.