Yi: i modelli bilingue di 01.AI

01.AI rilascia Yi-6B e Yi-34B, famiglia bilingue inglese-cinese. Yi-34B-200K estende il contesto, Yi-1.5 (maggio 2024) passa alla licenza Apache 2.0.

Open SourceAI Open SourceYi01.AILLMAIBilingue

L’esordio di 01.AI

Il 6 novembre 2023, 01.AI — la società fondata da Kai-Fu Lee — rilascia Yi-6B e Yi-34B, le prime versioni pubbliche della propria famiglia di modelli linguistici. I modelli sono bilingue inglese-cinese, con un equilibrio di training dati concepito per rendere le due lingue ugualmente competitive, caratteristica ancora rara al momento del rilascio per modelli pensati in un contesto cinese ma distribuiti globalmente.

Yi-34B, in particolare, si posiziona tra i modelli della fascia 30-35 miliardi di parametri che competono con Llama 2 70B sui benchmark standard in lingua inglese, mentre su benchmark cinesi (C-Eval, CMMLU) supera diversi riferimenti dell’epoca.

Context esteso e varianti

Poco dopo il rilascio iniziale, 01.AI pubblica Yi-34B-200K, una variante con finestra di contesto estesa a 200.000 token. L’estensione è ottenuta attraverso un processo di continued pretraining su sequenze lunghe, con modifiche alle posizionali RoPE per mantenere stabilità su lunghezze superiori al training originale. La disponibilità di un modello bilingue con contesto lungo è rilevante per scenari di analisi documentale e sintesi di contenuti estesi in entrambe le lingue.

Licenza e evoluzione

I primi rilasci Yi adottano una licenza custom aperta: uso libero per ricerca e concesso per casi commerciali previa registrazione presso 01.AI nel corso del 2023. Questa scelta, comune ad altri modelli cinesi dell’epoca, pone Yi in una categoria intermedia tra le licenze pienamente permissive e quelle con restrizioni esplicite.

Con Yi-1.5, rilasciato nel maggio 2024, 01.AI passa alla licenza Apache 2.0, rimuovendo l’obbligo di registrazione e allineando la famiglia alle convenzioni dominanti nell’ecosistema open source occidentale. Yi-1.5 introduce inoltre miglioramenti di qualità sui benchmark di ragionamento e generazione di codice, consolidando la posizione della famiglia come opzione bilingue robusta tra i modelli con pesi aperti.

Link: 01.ai

Vuoi supporto? Sei sotto attacco? Stato dei servizi
Vuoi supporto? Sei sotto attacco? Stato dei servizi