- OpenAI rilascia gpt-oss-120b e gpt-oss-20b come modelli di linguaggio open weights concessi in licenza con licenza Apache 2.0.
- Consentono l'esecuzione locale, la personalizzazione, l'uso commerciale e offrono prestazioni simili a quelle dei modelli proprietari come o3 e o4-mini.
- Concentrato sul ragionamento avanzato, sul pensiero a catena e sul supporto per strumenti autonomi.
- La sicurezza è stata una priorità, con revisioni indipendenti e protocolli contro l'uso dannoso.
OpenAI ha cambiato strategia e ha introdotto gpt-oss-120b insieme a gpt-oss-20b, i primi modelli linguistici di pesi aperti che ha pubblicato in oltre cinque anni. Questo lancio segna una rottura con la politica aziendale di sviluppi chiusi e apre le porte a sviluppatori, aziende e privati può utilizzare l'intelligenza artificiale avanzata senza dover ricorrere a servizi proprietari o sostenere costi elevati.
Entrambi i modelli sono ora disponibili in gratuito sulla piattaforma Hugging Face e sono distribuiti sotto la licenza Apache 2.0. Ciò consente a qualsiasi utente eseguirli localmente, adattarli a compiti specifici, integrarli nel tuo software e persino utilizzarli per scopi commerciali, senza alcun pagamento aggiuntivo o restrizione. OpenAI sottolinea che con questo movimento L'obiettivo è rendere l'intelligenza artificiale più accessibile a livello globale e promuovere l'innovazione in un quadro di trasparenza e responsabilità..
Caratteristiche tecniche principali di gpt-oss-120b
Il modello gpt-oss-120b si distingue per la sua architettura basata su “mixture-of-experts” (MoE), consentendoti di gestire 117.000 miliardi di parametri Con un'efficienza notevole: vengono attivati solo 5.100 miliardi di token per token elaborato. Ciò consente, nonostante le dimensioni, di utilizzarlo su una singola GPU da 80 GB, un requisito accessibile per centri di ricerca e aziende con risorse moderatamente avanzate. La variante gpt-oss-20b, invece, è destinata a dispositivi con meno memoria e può essere eseguita su hardware consumer e persino su laptop con 16 GB di RAM.
In entrambi i casi, è stato scelto un ragionamento avanzato utilizzando la tecnica della catena di pensiero, che consente di scomporre ogni risposta in passaggi intermedi esplicativi. I modelli sono addestrati con dati focalizzati su STEM, programmazione e conoscenze generali, che fornisce loro una solida base per compiti complessi e l'uso di strumenti specifici, come la ricerca sul web o l'esecuzione di codice Python.
Prestazioni e applicazioni pratiche
I test comparativi dimostrano che gpt-oss-120b si avvicina al livello di o4-mini e supera o3-mini di OpenAI nella maggior parte delle attività di programmazione, matematica competitiva e assistenza sanitaria. Il modello gpt-oss-20b, essendo più leggero, riesce a competere con soluzioni di terze parti come DeepSeek R1 e supera alcuni benchmark in attività specifiche, soprattutto su dispositivi edge.
Un altro dei suoi punti di forza è la sua capacità di personalizzazione: L'utente può regolare il grado di ragionamento (basso, medio o alto) a seconda del compito, bilanciando così latenza e precisioneQuesta configurazione, insieme alla possibilità di eseguire modelli offline e dietro un firewall, è particolarmente utile negli ambienti aziendali con restrizioni sulla privacy o esigenze di auditing.
Sicurezza, auditing e comunità
OpenAI ha prestato particolare attenzione al sicurezza e riduzione del rischio in questi modelli, ritardandone la pubblicazione per sottoporli a rigorose valutazioni interne ed esterne. Hanno Filtri integrati e protocolli di allineamento per prevenire l'uso improprio, come la generazione di informazioni sensibili o il furto di identità in settori quali la sicurezza informatica o la biotecnologia.
Inoltre, L'azienda ha invitato la comunità a partecipare alle sfide di red teaming, dotato di un Fondo da 500.000 dollari per incoraggiare l'individuazione di nuove vulnerabilità e minacce emergenti.
Per quanto riguarda le limitazioni, OpenAI riconosce che, nonostante la sua architettura avanzata, I modelli aperti potrebbero presentare tassi di "allucinazioni" leggermente più elevati rispetto alle loro controparti proprietarie.e la sua formazione è stata condotta principalmente con dati in inglese. Tuttavia, la documentazione e i controlli in atto facilitano l'audit e adeguamento continuo di questi modelli, promuovendo un utilizzo responsabile e sicuro all'interno dell'ecosistema globale dell'IA.
Prospettive di integrazione, licenza e adozione
I pesi per entrambi i modelli sono offerti in formato MXFP4 ed esistono già implementazioni di riferimento per PyTorch, Apple Metal e un supporto migliorato per piattaforme come Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten e Cloudflare. La licenza Apache 2.0 consente utilizzo estremamente flessibile, inclusa la possibilità di monetizzarli, ridistribuirli e integrarli in strumenti di terze parti.
Per la comunità imprenditoriale spagnola ed europea, l'arrivo di gpt-oss-120b e gpt-oss-20b apre nuove strade per automatizzare l'analisi, sviluppare assistenti intelligenti y mantenere il controllo sui dati all'interno delle proprie infrastrutture, riducendo al contempo i costi e accelerando i cicli di innovazione. Considerata la potenziale importanza dell'intelligenza artificiale in diversi settori, Questi strumenti consentono di sperimentare e fare ricerche sull'intelligenza artificiale senza dover ricorrere ad API esterne o licenze restrittive., promuovendo il proprio sviluppo tecnologico.
Questo progresso consente agli operatori del settore tecnologico di accedere a strumenti più aperti, trasparenti e adattabili, promuovendo così un ecosistema di innovazione più collaborativo e responsabile.
Sono un appassionato di tecnologia che ha trasformato i suoi interessi "geek" in una professione. Ho trascorso più di 10 anni della mia vita utilizzando tecnologie all'avanguardia e armeggiando con tutti i tipi di programmi per pura curiosità. Ora mi sono specializzato in informatica e videogiochi. Questo perché da più di 5 anni scrivo per vari siti web di tecnologia e videogiochi, creando articoli che cercano di darti le informazioni di cui hai bisogno in un linguaggio comprensibile a tutti.
In caso di domande, le mie conoscenze spaziano da tutto ciò che riguarda il sistema operativo Windows e Android per telefoni cellulari. E il mio impegno è nei tuoi confronti, sono sempre disposto a dedicare qualche minuto e aiutarti a risolvere qualsiasi domanda tu possa avere in questo mondo di Internet.