Fable 5 riaperto: cosa cambia per la cybersecurity

Il 1 luglio 2026 Anthropic ha ripristinato l'accesso a Claude Fable 5 (e Mythos 5 per i soli difensori USA via Project Glasswing) dopo la revoca dei controlli all'esportazione. Nuovi safeguard anti-jailbreak validati da CAISI, un framework di gravità per i cyber-jailbreak e un Executive Order che coordina governo e frontier lab. Cosa significa per chi difende i sistemi.

AICybersecurityGovernanceAnthropicFable 5Mythos 5CybersecurityAI GovernanceAI SovereigntyExport ControlProject Glasswing

Cosa ha annunciato Anthropic

Il 1 luglio 2026 Anthropic ha ripristinato l’accesso globale a Claude Fable 5, dopo che i controlli all’esportazione che lo tenevano offline sono stati revocati. È la coda della vicenda che avevamo raccontato: il 12 giugno il governo USA aveva ordinato la sospensione di Fable 5 e Mythos 5, e Anthropic li aveva disattivati in poche ore in tutto il mondo (ne abbiamo scritto in Quando un governo spegne un modello AI). Dallo stop alla riapertura sono passati 18 giorni.

La riapertura non è simmetrica, ed è qui che la storia si fa interessante per la sicurezza:

  • Fable 5 torna disponibile a tutti, su Claude Platform, Claude.ai, Claude Code e le altre superfici.
  • Mythos 5, la variante più capace, torna accessibile alle sole organizzazioni statunitensi approvate tramite Project Glasswing, con meno safeguard e un uso esplicitamente orientato alla cybersecurity difensiva.

La causa: un jailbreak “cyber”

Il provvedimento era nato da un jailbreak scoperto da ricercatori di Amazon: inducendo Fable 5 a esaminare del codice, il modello identificava alcune vulnerabilità software e, in un caso, produceva codice che dimostrava come sfruttarne una. Il punto sollevato da Anthropic nell’analisi post-incidente è netto: la stessa dimostrazione era riproducibile praticamente da ogni modello testato, inclusi Claude Opus 4.8, GPT-5.5 e Kimi K2.7. Non era quindi una capacità unica di Fable 5, e secondo l’azienda il bypass “non esponeva capacità cyber di livello Mythos”, trattandosi di “lavoro di cybersecurity difensiva di routine”.

I nuovi safeguard e la gravità dei jailbreak

Per riaprire, Anthropic ha introdotto un classificatore di sicurezza mirato alla tecnica segnalata, che la blocca in oltre il 99% dei casi, accettando come tradeoff un aumento dei falsi positivi durante attività legittime di coding e debugging. Il CAISI (Center for AI Standards and Innovation) ha validato in modo indipendente i safeguard, definendoli “estremamente solidi”.

Soprattutto, l’azienda ha reso esplicito un framework per valutare la gravità di un cyber-jailbreak su quattro criteri: quanto la tecnica estende le capacità oltre gli strumenti esistenti, quanti compiti offensivi distinti abilita, quanto è facile trasformarla in un attacco reale e quanto è facilmente scopribile. È un modo per distinguere una curiosità da una minaccia concreta, ed è accompagnato da un programma su HackerOne dedicato proprio ai cyber-jailbreak.

La distinzione tra i due modelli riassume tutto: Mythos 5, dichiara Anthropic, “può trovare e sfruttare vulnerabilità software in modo più efficace di qualsiasi altro modello, e di tutti tranne i più abili esperti di sicurezza umani”; Fable 5, per scelta di progettazione, “non offre alcuna capacità offensiva unica”. La capacità offensiva forte esiste, ma viene confinata dietro Project Glasswing, ai difensori approvati.

Governo e frontiera cyber

Sullo sfondo c’è un Executive Order del 2 giugno 2026, “Promoting Advanced Artificial Intelligence Innovation and Security”, che istituisce un quadro di collaborazione in quattro punti: accesso e valutazione del governo prima del rilascio dei modelli rilevanti per la sicurezza nazionale, condivisione rapida di informazioni su safeguard e jailbreak, team dedicati per la ricerca congiunta e standard di sicurezza volontari condivisi tra i frontier lab. È lo stesso “cyber Executive Order” che avevamo visto dietro il rilascio filtrato di GPT-5.6 Sol: frontiera AI e cybersecurity ormai passano da un tavolo governativo.

Cosa ne pensiamo

Per chi difende i sistemi la lezione operativa è chiara: i modelli di frontiera sono diventati strumenti seri di vulnerability research ed exploitation. È una capacità a doppio taglio. Da un lato potenzia i difensori (triage, sviluppo di patch, pentest assistito, security education); dall’altro abbassa la barriera per gli attaccanti. Quando l’offesa assistita dall’AI diventa realtà, la difesa deve alzare il livello di conseguenza: è esattamente il terreno su cui lavoriamo con CyberScan e i servizi di cybersecurity.

C’è poi il tema, ormai ricorrente, dell’accesso. La capacità difensiva più forte (Mythos 5) è riservata a organizzazioni statunitensi approvate: un difensore europeo, semplicemente, non vi accede. E un modello closed resta qualcosa che un governo estero può spegnere e riaccendere a propria discrezione. Si somma alla lezione del caso Fable e di GPT-5.6: la frontiera AI è tecnologia dual-use a governance governativa. La risposta che portiamo avanti resta quella di possedere il pavimento operativo (modelli a pesi aperti, on-premise, come discusso per DwarfStar 4 e GLM 5.2) e di governare lo stack (Open Intelligence, Secure Governance, Admina per un’AI auditabile su qualunque modello).

Una nota di equilibrio: riaprire in 18 giorni, con safeguard validati da un ente indipendente e un processo dichiaratamente trasparente, è un segnale che la governance può funzionare senza congelare l’innovazione. Ma “spegnibile e filtrabile per decisione di un governo” resta un fattore che, per chi pianifica su più anni, va messo nel conto.

Fonti

Vuoi supporto?Sei sotto attacco?Stato dei servizi
Vuoi supporto?Sei sotto attacco?Stato dei servizi