OpenAI rilascia gpt-oss-120b: il suo modello di pesi aperti più avanzato fino ad oggi.

Ultimo aggiornamento: 07/08/2025

  • OpenAI rilascia gpt-oss-120b e gpt-oss-20b come modelli di linguaggio open weights concessi in licenza con licenza Apache 2.0.
  • Consentono l'esecuzione locale, la personalizzazione, l'uso commerciale e offrono prestazioni simili a quelle dei modelli proprietari come o3 e o4-mini.
  • Concentrato sul ragionamento avanzato, sul pensiero a catena e sul supporto per strumenti autonomi.
  • La sicurezza è stata una priorità, con revisioni indipendenti e protocolli contro l'uso dannoso.

Modello gpt-oss-120b

OpenAI ha cambiato strategia e ha introdotto gpt-oss-120b insieme a gpt-oss-20b, i primi modelli linguistici di pesi aperti che ha pubblicato in oltre cinque anni. Questo lancio segna una rottura con la politica aziendale di sviluppi chiusi e apre le porte a sviluppatori, aziende e privati può utilizzare l'intelligenza artificiale avanzata senza dover ricorrere a servizi proprietari o sostenere costi elevati.

Entrambi i modelli sono ora disponibili in gratuito sulla piattaforma Hugging Face e sono distribuiti sotto la licenza Apache 2.0. Ciò consente a qualsiasi utente eseguirli localmente, adattarli a compiti specifici, integrarli nel tuo software e persino utilizzarli per scopi commerciali, senza alcun pagamento aggiuntivo o restrizione. OpenAI sottolinea che con questo movimento L'obiettivo è rendere l'intelligenza artificiale più accessibile a livello globale e promuovere l'innovazione in un quadro di trasparenza e responsabilità..

Caratteristiche tecniche principali di gpt-oss-120b

Pesi aperti OpenAI

Il modello gpt-oss-120b si distingue per la sua architettura basata su “mixture-of-experts” (MoE), consentendoti di gestire 117.000 miliardi di parametri Con un'efficienza notevole: vengono attivati solo 5.100 miliardi di token per token elaborato. Ciò consente, nonostante le dimensioni, di utilizzarlo su una singola GPU da 80 GB, un requisito accessibile per centri di ricerca e aziende con risorse moderatamente avanzate. La variante gpt-oss-20b, invece, è destinata a dispositivi con meno memoria e può essere eseguita su hardware consumer e persino su laptop con 16 GB di RAM.

Contenuti esclusivi: clicca qui  Come puoi utilizzare Alexa per ottenere risposte a domande generali o per effettuare ricerche in Internet?

In entrambi i casi, è stato scelto un ragionamento avanzato utilizzando la tecnica della catena di pensiero, che consente di scomporre ogni risposta in passaggi intermedi esplicativi. I modelli sono addestrati con dati focalizzati su STEM, programmazione e conoscenze generali, che fornisce loro una solida base per compiti complessi e l'uso di strumenti specifici, come la ricerca sul web o l'esecuzione di codice Python.

Modello OpenAI 'open-weight'
Articolo correlato:
OpenAI punta su un modello "open-weight": ecco come apparirà la sua nuova intelligenza artificiale dotata di ragionamento avanzato.

Prestazioni e applicazioni pratiche

gpt oss 120b e 20b

I test comparativi dimostrano che gpt-oss-120b si avvicina al livello di o4-mini e supera o3-mini di OpenAI nella maggior parte delle attività di programmazione, matematica competitiva e assistenza sanitaria. Il modello gpt-oss-20b, essendo più leggero, riesce a competere con soluzioni di terze parti come DeepSeek R1 e supera alcuni benchmark in attività specifiche, soprattutto su dispositivi edge.

Un altro dei suoi punti di forza è la sua capacità di personalizzazione: L'utente può regolare il grado di ragionamento (basso, medio o alto) a seconda del compito, bilanciando così latenza e precisioneQuesta configurazione, insieme alla possibilità di eseguire modelli offline e dietro un firewall, è particolarmente utile negli ambienti aziendali con restrizioni sulla privacy o esigenze di auditing.

Contenuti esclusivi: clicca qui  Come utilizzare Microsoft Designer per migliorare i tuoi progetti creativi

Sicurezza, auditing e comunità

OpenAI ha prestato particolare attenzione al sicurezza e riduzione del rischio in questi modelli, ritardandone la pubblicazione per sottoporli a rigorose valutazioni interne ed esterne. Hanno Filtri integrati e protocolli di allineamento per prevenire l'uso improprio, come la generazione di informazioni sensibili o il furto di identità in settori quali la sicurezza informatica o la biotecnologia.

Inoltre, L'azienda ha invitato la comunità a partecipare alle sfide di red teaming, dotato di un Fondo da 500.000 dollari per incoraggiare l'individuazione di nuove vulnerabilità e minacce emergenti.

Per quanto riguarda le limitazioni, OpenAI riconosce che, nonostante la sua architettura avanzata, I modelli aperti potrebbero presentare tassi di "allucinazioni" leggermente più elevati rispetto alle loro controparti proprietarie.e la sua formazione è stata condotta principalmente con dati in inglese. Tuttavia, la documentazione e i controlli in atto facilitano l'audit e adeguamento continuo di questi modelli, promuovendo un utilizzo responsabile e sicuro all'interno dell'ecosistema globale dell'IA.

Prospettive di integrazione, licenza e adozione

I pesi per entrambi i modelli sono offerti in formato MXFP4 ed esistono già implementazioni di riferimento per PyTorch, Apple Metal e un supporto migliorato per piattaforme come Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten e Cloudflare. La licenza Apache 2.0 consente utilizzo estremamente flessibile, inclusa la possibilità di monetizzarli, ridistribuirli e integrarli in strumenti di terze parti.

Contenuti esclusivi: clicca qui  Microsoft inizia i test di Copilot Gaming: ecco come funziona il nuovo assistente AI per i videogiochi.

Per la comunità imprenditoriale spagnola ed europea, l'arrivo di gpt-oss-120b e gpt-oss-20b apre nuove strade per automatizzare l'analisi, sviluppare assistenti intelligenti y mantenere il controllo sui dati all'interno delle proprie infrastrutture, riducendo al contempo i costi e accelerando i cicli di innovazione. Considerata la potenziale importanza dell'intelligenza artificiale in diversi settori, Questi strumenti consentono di sperimentare e fare ricerche sull'intelligenza artificiale senza dover ricorrere ad API esterne o licenze restrittive., promuovendo il proprio sviluppo tecnologico.

Questo progresso consente agli operatori del settore tecnologico di accedere a strumenti più aperti, trasparenti e adattabili, promuovendo così un ecosistema di innovazione più collaborativo e responsabile.

Lascia un commento