
Intelligenza Artificiale
Architetture AI on-premise, LLM locali, RAG, agenti autonomi. L’intelligenza che non si può permettere di vedere spenta va posseduta.
Scopri →
Admina Enterprise
Governance AI Open Source: audit trail, PII redaction, policy bidirezionali ALLOW/BLOCK/REDACT su qualsiasi modello.
Scopri Admina →CyberScan
Vulnerability assessment e pentest assistito da AI. Asset discovery continuo, prioritizzazione del rischio, NIS2.
Scopri CyberScan →
Cybersecurity
Difesa offensiva e difensiva, vulnerability management, compliance NIS2. Competenze e strumenti per chi protegge i sistemi.
Scopri →
Cosa ha annunciato OpenAI
Il 26 giugno 2026 OpenAI ha avviato un’anteprima limitata della serie GPT-5.6: Sol, il modello di punta; Terra, bilanciato per il lavoro quotidiano (prestazioni competitive con GPT-5.5 a circa metà del prezzo); e Luna, veloce ed economico. Cambia anche lo schema dei nomi: il numero indica la generazione, mentre Sol, Terra e Luna identificano tre tier di capacità (intelligenza, velocità, costo) che possono evolvere a ritmi diversi.
Sul piano tecnico, OpenAI dichiara miglioramenti agentici in coding, biologia e cybersecurity. Arrivano due novità d’uso: un livello di ragionamento max (più tempo per ragionare a fondo) e una ultra mode che va oltre il singolo agente sfruttando sotto-agenti per accelerare i compiti complessi. Sul coding, Sol stabilisce un nuovo stato dell’arte su Terminal-Bench 2.1. I prezzi per milione di token: Sol 5/30 dollari (input/output), Terra 2,50/15, Luna 1/6. A luglio è atteso Sol su Cerebras fino a 750 token al secondo.
La vera notizia non è tecnica: è l’accesso
Il punto più interessante non è un benchmark. È come il modello viene rilasciato. GPT-5.6 parte in anteprima per un piccolo gruppo di partner fidati la cui partecipazione, scrive OpenAI, è stata condivisa con il governo USA, e proprio su richiesta del governo prima di un rilascio più ampio. La disponibilità generale è prevista “nelle prossime settimane”.
OpenAI stessa prende le distanze da questo meccanismo, con parole che vale la pena riportare: “non crediamo che questo tipo di processo di accesso governativo debba diventare lo standard di lungo periodo. Tiene i migliori strumenti lontani da utenti, sviluppatori, imprese, cyber-defender e partner globali che ne hanno bisogno”. L’azienda lo descrive come passo temporaneo, mentre lavora con l’Amministrazione a un “cyber Executive Order framework” e a un processo ripetibile per i rilasci futuri. Tradotto: l’accesso a un modello di frontiera non è più solo una decisione dell’azienda che lo costruisce.
Cyber: il motivo del filtro
La ragione del filtro è scritta a chiare lettere nelle capacità. GPT-5.6 Sol è il modello più capace di OpenAI per la cybersecurity: sposta la frontiera efficienza-prestazioni su compiti di lungo respiro come la vulnerability research e l’exploitation. Su ExploitBench risulta competitivo con Mythos Preview usando circa un terzo dei token in output.
OpenAI precisa i limiti: il modello non supera la soglia “Cyber Critical” del proprio Preparedness Framework. Nei test su Chromium e Firefox ha individuato bug e primitive di exploit (i mattoni di un attacco) ma non ha prodotto in autonomia un exploit completo “full-chain” nelle condizioni testate, ed è più efficace nel trovare e correggere le vulnerabilità che nel portare a termine un attacco end-to-end, con un orientamento esplicito ai difensori. A protezione, una pila di safeguard stratificati e oltre 700.000 ore-GPU (equivalenti A100) di red-teaming automatico dedicate a scovare jailbreak universali. Sono capacità dual-use reali: è questo che ha attirato l’attenzione del governo.
Due settimane dopo Fable 5
Per capire il peso della scelta serve il contesto. Appena due settimane prima, il 12 giugno, il governo USA aveva ordinato la sospensione di Fable 5 e Mythos 5 di Anthropic, costringendo l’azienda a disattivarli in poche ore in tutto il mondo: il primo “spegnimento” forzato di un modello di frontiera già in produzione, proprio per timori sulle capacità cyber sbloccabili tramite jailbreak. Lo abbiamo raccontato in Quando un governo spegne un modello AI.
La storia, in due settimane, ha fatto un passo avanti. Nel caso Fable la sequenza è stata “rilascia, poi vieni spento”. Con GPT-5.6 l’ordine si inverte: “concorda prima, poi rilascia”. OpenAI ha previewato piani e capacità al governo a monte e ha accettato un’anteprima ristretta. Cambia la forma, non la sostanza: l’accesso alla frontiera passa da un’autorità che non è l’azienda, e nemmeno l’utente. Non è un caso che lo stesso confronto sulle capacità cyber sia ormai esplicito, con OpenAI che misura Sol contro Mythos Preview.
Cosa ne pensiamo
Per chi opera in Italia e in UE il segnale è netto, e si somma a quello di Fable 5: la frontiera AI closed sta diventando una tecnologia dual-use a controllo governativo, e il governo in questione è estero. Due rischi diventano concreti e pianificabili. Il primo è l’accesso: si potrebbe semplicemente non essere tra i pochi partner approvati, e l’Europa non siede al tavolo che decide. Il secondo è la continuità: ciò che oggi è disponibile può essere ristretto domani, per ragioni che non si controllano.
La risposta è quella che portiamo avanti da tempo: possedere il pavimento operativo. I modelli a pesi aperti (ne abbiamo scritto a proposito di GLM 5.2), eseguiti on-premise o su infrastruttura controllata, non possono essere spenti né filtrati da una lettera. Non devono fare tutto: devono garantire continuità e governance quando il fornitore esterno cambia le regole. È la tesi Open Intelligence, Secure Governance, e il senso di prodotti come Admina per un’AI governata su qualunque modello, del nostro lavoro sull’AI on-premise e degli strumenti di cybersecurity che mettono queste capacità nelle mani dei difensori.
Una nota di equilibrio: il gating ha una logica difendibile, perché le capacità cyber e biologiche dei modelli di frontiera sono reali, e perfino OpenAI lo dichiara temporaneo. Ma “temporaneo” e “a discrezione di un governo” sono parole che, per chi pianifica su anni, pesano. La capacità più importante, oggi, non è il singolo benchmark: è non dipendere da un interruttore che non si controlla.