Il fatto non è il modello, è la licenza
Tra fine marzo e inizio aprile Google ha lanciato Gemma 4, la sua famiglia di modelli aperti più recente. La notizia rilevante non riguarda però le capacità del modello, ma il cambio di licenza: Gemma 4 esce sotto Apache 2.0, abbandonando i custom “Gemma Terms of Use” che governavano le versioni precedenti. È un passaggio da una licenza proprietaria con clausole d’uso ambigue a una licenza permissiva standard, che consente uso commerciale e ridistribuzione liberi senza vincoli condizionali. Google ha motivato la scelta come risposta diretta al feedback degli sviluppatori.
Per chi segue il tema, vale la pena ricordare il punto di partenza: la prima Gemma era distribuita con una licenza permissiva ma proprietaria, sulla falsariga del modello adottato da Llama. Con Gemma 4, Google allinea la sua famiglia aperta allo stesso piano licenziale di Qwen e Mistral, già su Apache 2.0 — un terreno che abbiamo descritto a proposito di Qwen3.6.
La famiglia: edge, MoE e dense
Il lancio iniziale ha portato più tagli. Sul fronte edge ci sono le varianti E2B ed E4B, ottimizzate per dispositivi con risorse contenute. Più in alto, un modello 26B Mixture-of-Experts con circa 4B parametri attivi e un 31B dense. Tutta la famiglia nasce dalla stessa ricerca alla base di Gemini 3, con addestramento nativo su oltre 140 lingue.
La multimodalità è nativa e trasversale: tutti i modelli elaborano immagini e video, mentre l’input audio nativo è presente su E2B, E4B e ora sulla variante mid-size. Il context window arriva fino a 128K sui modelli edge e fino a 256K sui modelli più grandi.
Gemma 4 12B: il modello che gira sul portatile
In questi giorni si è aggiunta la variante più recente, Gemma 4 12B: un modello multimodale unificato encoder-free, posizionato tra E4B e il 26B MoE. È il primo modello mid-size della famiglia con input audio nativo, con context window da 256K, distribuito su Hugging Face e Kaggle sotto Apache 2.0.
Il dato operativo è l’hardware richiesto: il 12B gira su hardware consumer con circa 16 GB di VRAM o memoria unificata — la dotazione di molti portatili e desktop. Non serve un data center per eseguirlo in locale, il che chiude il cerchio rispetto all’impostazione storica di Gemma, pensata fin dall’inizio per il deployment su hardware limitato.
Cosa significa in pratica
Per un’azienda, l’interesse del rilascio non sta nei numeri di benchmark ma nella riduzione dell’attrito a valle. Una licenza proprietaria, per quanto permissiva, costringe i team legali enterprise a leggere clausole d’uso specifiche, valutare casi limite e produrre un parere su ogni scenario di deployment commerciale o on-premise. Apache 2.0 è invece una licenza nota, già metabolizzata da qualunque ufficio legale: secondo l’analisi di settore, per chi deve approvare l’adozione di un modello, la revisione passa “da settimane a ore”.
È esattamente l’angolo che ci interessa in una logica di governance. Un modello capace gira sì su un portatile, ma il vero sblocco è che ci si può arrivare senza una revisione legale dedicata per ogni progetto. Quando la barriera all’adozione si sposta dal piano contrattuale a quello puramente tecnico, l’AI on-premise diventa una decisione di infrastruttura, non di compliance — ed è una semplificazione che, lato adozione, pesa più di qualche punto di benchmark.