gpt-oss-120b : le modèle ouvert accessible et avancé d'OpenAI

OpenAI publie gpt-oss-120b et gpt-oss-20b en tant que modèles de langage de pondération ouverts sous licence Apache 2.0.
Ils permettent une exécution locale, une personnalisation, une utilisation commerciale et offrent des performances proches des modèles propriétaires tels que l'o3 et l'o4-mini.
Axé sur le raisonnement avancé, la pensée en chaîne et la prise en charge des outils autonomes.
La sécurité a été une priorité, avec des examens indépendants et des protocoles contre toute utilisation malveillante.

Modèle gpt-oss-120b

OpenAI a changé de stratégie et a introduit gpt-oss-120b avec gpt-oss-20b, les premiers modèles de langage de poids ouverts qu'elle a publié en plus de cinq ans. Ce lancement marque une rupture avec la politique de développements fermés de l'entreprise et ouvre la voie à développeurs, entreprises et particuliers peut utiliser une IA avancée sans recourir à des services propriétaires ni engager de coûts importants.

Les deux modèles sont désormais disponibles en gratuit sur la plateforme Hugging Face et sont distribués sous licence Apache 2.0. Cela permet à tout utilisateur les exécuter localement, adaptez-les à des tâches spécifiques, intégrez-les dans votre propre logiciel et utilisez-les même à des fins commerciales, sans aucun paiement ni restriction supplémentaire. OpenAI souligne qu'avec ce mouvement Son objectif est de rendre l’intelligence artificielle plus accessible à l’échelle mondiale et de favoriser l’innovation dans un cadre de transparence et de responsabilité..

Principales caractéristiques techniques du gpt-oss-120b

Poids ouverts OpenAI

Le modèle gpt-oss-120b se distingue par son architecture basée sur le « mélange d'experts » (MoE), vous permettant de gérer 117.000 milliards de paramètres Avec une efficacité remarquable : seulement 5.100 milliards de jetons sont activés par jeton traité. Malgré sa taille, il peut fonctionner sur un seul GPU de 80 Go, un besoin abordable pour les centres de recherche et les entreprises disposant de ressources moyennement avancées. La variante gpt-oss-20b, quant à elle, est destinée aux appareils disposant de moins de mémoire et peut fonctionner sur du matériel grand public, voire sur des ordinateurs portables dotés de 16 Go de RAM.

Contenu exclusif - Cliquez ici Amazon trébuche dans sa course à l'espace : le projet Kuiper subit un nouveau revers

Dans les deux cas, le raisonnement avancé a été choisi en utilisant la technique de la chaîne de pensée, permettant de décomposer chaque réponse en étapes intermédiaires explicatives. Les modèles sont formés avec des données axées sur les STEM, programmation et connaissances générales, ce qui leur fournit une base solide pour les tâches complexes et l'utilisation d'outils spécifiques, tels que la recherche sur le Web ou l'exécution de code Python.

Performances et applications pratiques

Des tests comparatifs montrent que gpt-oss-120b se rapproche du niveau de o4-mini et surpasse l'o3-mini d'OpenAI dans la plupart des tâches de programmation, de mathématiques de compétition et de santé. Le modèle gpt-oss-20b, plus léger, parvient à concurrencer des solutions tierces comme DeepSeek R1 et surpasse certains benchmarks sur des tâches spécifiques, notamment sur les appareils périphériques.

Un autre de ses points forts est son capacité de personnalisation:L'utilisateur peut ajuster le degré de raisonnement (faible, moyen ou élevé) en fonction de la tâche, équilibrant ainsi la latence et la précisionCette configuration, ainsi que la possibilité d'exécuter des modèles hors ligne et derrière un pare-feu, est particulièrement utile dans les environnements d'entreprise avec des restrictions de confidentialité ou des besoins d'audit.

Contenu exclusif - Cliquez ici Burry contre Nvidia : la bataille qui remet en question l’essor de l’IA

Sécurité, audit et communauté

OpenAI a accordé une attention particulière à la sécurité et réduction des risques dans ces modèles, en retardant leur publication pour les soumettre à des évaluations internes et externes rigoureuses. Ils ont Filtres intégrés et protocoles d'alignement pour éviter les abus, comme la génération d’informations sensibles ou le vol d’identité dans des domaines tels que la cybersécurité ou la biotechnologie.

En outre, L'entreprise a invité la communauté à participer à des défis de red teaming, équipé d'un Un fonds de 500.000 XNUMX $ pour encourager la détection de nouvelles vulnérabilités et les menaces émergentes.

Quant aux limites, OpenAI reconnaît que, malgré son architecture avancée, Les modèles ouverts peuvent avoir des taux d’« hallucinations » légèrement plus élevés que leurs homologues propriétaires., et sa formation a été menée principalement avec des données en anglais. Cependant, la documentation et les contrôles en place facilitent l'audit et ajustement continu de ces modèles, promouvant une utilisation responsable et sûre au sein de l’écosystème mondial de l’IA.

Perspectives d'intégration, de licence et d'adoption

Les pondérations des deux modèles sont proposées au format MXFP4, et des implémentations de référence existent déjà pour PyTorch et Apple Metal, ainsi qu'une prise en charge améliorée de plateformes telles qu'Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten et Cloudflare. La licence Apache 2.0 permet utilisation extrêmement flexible, y compris la possibilité de les monétiser, de les redistribuer et de les intégrer dans des outils tiers.

Contenu exclusif - Cliquez ici Comment utiliser Microsoft Designer pour améliorer vos projets créatifs

Pour la communauté d'affaires espagnole et européenne, l'arrivée de gpt-oss-120b et gpt-oss-20b ouvre de nouvelles perspectives automatiser l'analyse, développer des assistants intelligents y garder le contrôle des données au sein de leurs propres infrastructures, tout en réduisant les coûts et en accélérant les cycles d'innovation. Compte tenu de l'importance potentielle de l'intelligence artificielle dans différents secteurs, Ces outils vous permettent d’expérimenter et de rechercher en IA sans dépendre d’API externes ou de licences restrictives., favorisant son propre développement technologique.

Cette avancée permet aux acteurs du secteur technologique d’accéder à des outils plus ouverts, transparents et adaptables, favorisant ainsi un écosystème d’innovation plus collaboratif et responsable.

Alberto navarro

Je suis un passionné de technologie qui a fait de ses intérêts de « geek » un métier. J'ai passé plus de 10 ans de ma vie à utiliser des technologies de pointe et à bricoler toutes sortes de programmes par pure curiosité. Aujourd'hui, je me spécialise dans l'informatique et les jeux vidéo. En effet, depuis plus de 5 ans, j'écris pour différents sites Web sur la technologie et les jeux vidéo, créant des articles qui cherchent à vous donner les informations dont vous avez besoin dans un langage compréhensible par tous.

Si vous avez des questions, mes connaissances s'étendent de tout ce qui concerne le système d'exploitation Windows ainsi qu'Android pour les téléphones mobiles. Et mon engagement est envers vous, je suis toujours prêt à consacrer quelques minutes et à vous aider à résoudre toutes les questions que vous pourriez avoir dans ce monde Internet.