Nemotron 3 : le pari audacieux de NVIDIA sur l’IA multi-agents

Dernière mise à jour: 17/12/2025

  • Nemotron 3 est une famille ouverte de modèles, de données et de bibliothèques axée sur l'IA multi-agents et les systèmes multi-agents.
  • Il comprend trois tailles MoE (Nano, Super et Ultra) avec une architecture hybride et un entraînement efficace sur 4 bits sur NVIDIA Blackwell.
  • Nemotron 3 Nano est désormais disponible en Europe via Hugging Face, les clouds publics et en tant que microservice NIM, avec une fenêtre de 1 million de jetons.
  • L'écosystème est complété par des ensembles de données massifs, NeMo Gym, NeMo RL et Evaluator pour entraîner, optimiser et auditer les agents d'IA souverains.

Modèle d'intelligence artificielle Nemotron 3

La course à l'intelligence artificielle évolue des chatbots simples et isolés vers des systèmes d'agents qui collaborent entre eux, gèrent des flux de travail complexes et doivent être auditables. Dans ce nouveau contexte, NVIDIA a décidé de franchir une étape assez claire : ouvrir non seulement ses modèles, mais aussi ses données et ses outils.afin que les entreprises, les administrations publiques et les centres de recherche puissent construire leurs propres plateformes d'IA avec un contrôle accru.

Ce mouvement se matérialise dans Nemotron 3, une famille de modèles ouverts destinés à l'IA multi-agents Elle vise à combiner hautes performances, faibles coûts d'inférence et transparence. Cette proposition n'est pas conçue comme un simple chatbot généraliste de plus, mais comme une base sur laquelle déployer des agents qui raisonnent, planifient et exécutent des tâches complexes dans des secteurs réglementésCela est particulièrement pertinent en Europe et en Espagne, où la souveraineté des données et la conformité réglementaire sont importantes.

Une famille ouverte de modèles pour l'IA agentive et souveraine

Nemotron 3 est présenté comme un écosystème complet : modèles, jeux de données, bibliothèques et recettes d’entraînement sous des licences ouvertes. L'idée de NVIDIA est que les organisations ne se contentent pas de consommer l'IA comme un service opaque, mais puissent en examiner le fonctionnement interne, adapter les modèles à leurs domaines et les déployer sur leur propre infrastructure, que ce soit dans le cloud ou dans des centres de données locaux.

L'entreprise inscrit cette stratégie dans son engagement envers IA souveraineEn Europe, en Corée du Sud et dans d'autres régions, les gouvernements et les entreprises recherchent des alternatives ouvertes aux systèmes fermés ou étrangers, souvent mal adaptés à leurs lois sur la protection des données ou à leurs exigences d'audit. Nemotron 3 ambitionne de constituer le socle technique permettant de bâtir des modèles nationaux, sectoriels ou d'entreprise offrant une visibilité et un contrôle accrus.

En parallèle, NVIDIA renforce sa position au-delà du matérielJusqu'à présent, il s'agissait principalement d'un fournisseur de GPU de référence ; avec Nemotron 3, il se positionne également sur le marché des outils de modélisation et d'entraînement, concurrençant plus directement des acteurs comme OpenAI, Google, Anthropic, voire Meta, et des modèles haut de gamme tels que SuperGrok HeavyCes dernières générations de Llama, Meta a réduit son engagement envers l'open source.

Pour l'écosystème européen de la recherche et des startups, fortement dépendant des modèles ouverts hébergés sur des plateformes comme Hugging Face, la disponibilité de pondérations, de données synthétiques et de bibliothèques sous licences ouvertes représente une alternative puissante aux modèles ouverts. modèles chinois et les Américains qui dominent les classements de popularité et de référence.

Contenu exclusif - Cliquez ici  Le Microsoft Store ne s'ouvre pas ou se ferme sans cesse : solutions détaillées

Architecture hybride du ministère de l'Éducation : efficacité pour les agents à grande échelle

La principale caractéristique technique du Nemotron 3 est un Architecture hybride de mélange latent d'experts (MoE)Au lieu d'activer tous les paramètres du modèle à chaque inférence, seule une fraction d'entre eux est activée, le sous-ensemble d'experts le plus pertinent pour la tâche ou le jeton en question.

Cette approche permet réduire drastiquement le coût de calcul et la consommation de mémoireCela augmente également le débit de jetons. Pour les architectures multi-agents, où des dizaines ou des centaines d'agents échangent des messages en continu, cette efficacité est essentielle pour éviter que le système ne devienne non viable en termes de coûts GPU et cloud.

D'après les données communiquées par NVIDIA et les tests de performance indépendants, le Nemotron 3 Nano atteint jusqu'à quatre fois plus de jetons par seconde Comparé à son prédécesseur, le Nemotron 2 Nano, il réduit d'environ 60 % la génération de jetons de raisonnement inutiles. En pratique, cela se traduit par des réponses tout aussi, voire plus, précises, mais plus concises et à moindre coût par requête.

L'architecture hybride du ministère de l'Éducation, combinée à des techniques de formation spécifiques, a permis de De nombreux modèles ouverts parmi les plus avancés adoptent des schémas experts.Nemotron 3 s'inscrit dans cette tendance, mais se concentre spécifiquement sur l'IA agentielle : des routes internes conçues pour la coordination entre les agents, l'utilisation d'outils, la gestion des états longs et la planification étape par étape.

Trois tailles : Nano, Super et Ultra pour différentes charges de travail

Architecture du modèle Nemotron 3

La famille Nemotron 3 est organisée en trois tailles principales du modèle MoE, tous ouverts et avec des paramètres actifs réduits grâce à l'architecture experte :

  • Nemotron 3 Nano: environ 30.000 milliards de paramètres au total, avec environ 3.000 milliards d'actifs par jetonIl est conçu pour des tâches ciblées où l'efficacité est primordiale : débogage logiciel, résumé de documents, recherche d'informations, surveillance système ou assistants IA spécialisés.
  • Nemotron 3 Super: environ 100.000 milliards de paramètres, avec 10.000 milliards d'actifs à chaque étape. Il est orienté vers Raisonnement avancé dans les architectures multi-agentsavec une faible latence même lorsque plusieurs agents coopèrent pour résoudre des flux complexes.
  • Nemotron 3 Ultra: le niveau supérieur, avec environ 500.000 milliards de paramètres et jusqu'à 50.000 milliards d'actifs par jetonIl fonctionne comme un puissant moteur de raisonnement pour la recherche, la planification stratégique, l'aide à la décision de haut niveau et les systèmes d'IA particulièrement exigeants.

En pratique, cela permet aux organisations Choisissez la taille du modèle en fonction de votre budget et de vos besoins.Nano pour les charges de travail massives et intensives et les coûts serrés ; Super lorsqu’une plus grande profondeur de raisonnement est nécessaire avec de nombreux agents collaborant ; et Ultra pour les cas où la qualité et le contexte long l’emportent sur le coût du GPU.

Contenu exclusif - Cliquez ici  TAG Heuer Connected Calibre E5 : le saut vers un logiciel propriétaire et une édition New Balance

Pour le moment, Seul le Nemotron 3 Nano est disponible pour une utilisation immédiate.Les variantes Super et Ultra sont prévues pour le premier semestre 2026, ce qui donnera aux entreprises et aux laboratoires européens le temps d'expérimenter d'abord avec Nano, de mettre en place des chaînes de production et, plus tard, de migrer vers les cas nécessitant une plus grande capacité.

Nemotron 3 Nano : fenêtre d’un million de jetons et coût inclus

Nemotron 3 Nano

Nemotron 3 Nano est, à ce jour, le fer de lance pratique de la familleNVIDIA le décrit comme le modèle le plus économe en ressources de calcul de la gamme, optimisé pour offrir des performances maximales dans les flux de travail multi-agents et les tâches intensives mais répétitives.

Parmi ses caractéristiques techniques, les suivantes se distinguent : fenêtre de contexte pouvant contenir jusqu'à un million de jetonsCela permet de conserver en mémoire des documents volumineux, des référentiels de code entiers ou des processus métier complexes. Pour les applications européennes dans les secteurs bancaire, de la santé ou de l'administration publique, où les enregistrements peuvent être volumineux, cette capacité de gestion du contexte à long terme est particulièrement précieuse.

Les critères de référence de l'organisation indépendante L'analyse artificielle place le Nemotron 3 Nano parmi les modèles open-source les plus équilibrés. Elle allie intelligence, précision et rapidité, avec un débit de plusieurs centaines de jetons par seconde. Cette combinaison la rend attrayante pour les intégrateurs d'IA et les fournisseurs de services en Espagne qui recherchent une expérience utilisateur optimale sans pour autant faire exploser leurs coûts d'infrastructure.

En termes de cas d'utilisation, NVIDIA cible Nano à Résumé de contenu, débogage logiciel, recherche d'informations et assistants IA d'entrepriseGrâce à la réduction des jetons de raisonnement redondants, il est possible d'exécuter des agents qui maintiennent de longues conversations avec des utilisateurs ou des systèmes sans que la facture d'inférence ne s'envole.

Données ouvertes et bibliothèques : NeMo Gym, NeMo RL et Evaluator

Bibliothèques NeMo

L'une des caractéristiques les plus marquantes de Nemotron 3 est que Cela ne se limite pas à la publication des poids des modèles.NVIDIA accompagne cette famille d'une suite complète de ressources ouvertes pour la formation, le réglage et l'évaluation des agents.

d'une part, il met à disposition un corpus synthétique de plusieurs billions de jetons de données de pré-entraînement, de post-entraînement et de renforcementCes ensembles de données, axés sur le raisonnement, le codage et les flux de travail en plusieurs étapes, permettent aux entreprises et aux centres de recherche de générer leurs propres variantes spécifiques à un domaine de Nemotron (par exemple, juridique, santé ou industrie) sans partir de zéro.

Parmi ces ressources, la suivante se distingue : Ensemble de données sur la sécurité des agents NemotronElle collecte des données télémétriques sur le comportement des agents dans des scénarios réels. Son objectif est d'aider les équipes à mesurer et à renforcer la sécurité des systèmes autonomes complexes : des actions entreprises par un agent lorsqu'il rencontre des données sensibles à sa réaction face à des commandes ambiguës ou potentiellement dangereuses.

Contenu exclusif - Cliquez ici  Les dernières fonctionnalités de Windows 11 : l’intelligence artificielle et de nouvelles façons de gérer votre PC

Concernant la section outils, NVIDIA lance NeMo Gym et NeMo RL en tant que bibliothèques open source Pour la formation par renforcement et le suivi post-formation, ainsi que pour l'évaluation de la sécurité et des performances avec NeMo Evaluator, ces bibliothèques fournissent des environnements de simulation et des pipelines prêts à l'emploi compatibles avec la gamme Nemotron, et peuvent être étendues à d'autres modèles.

Tout ce matériel (poids, ensembles de données et code) est distribué via GitHub et Hugging Face sont distribués sous licence NVIDIA Open Model License.Ainsi, les équipes européennes peuvent l'intégrer facilement à leurs propres MLOps. Des entreprises comme Prime Intellect et Unsloth intègrent déjà NeMo Gym directement dans leurs flux de travail pour simplifier l'apprentissage par renforcement sur Nemotron.

Disponibilité dans les clouds publics et l'écosystème européen

Nemotron 3 Nano Hugging Face

Nemotron 3 Nano est maintenant disponible chez Étreindre le visage y GitHubainsi que par le biais de fournisseurs d'inférence tels que Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter et Together AI. Cela permet aux équipes de développement espagnoles de tester le modèle via une API ou de le déployer sur leurs propres infrastructures sans complexité excessive.

Sur le front du cloud, Nemotron 3 Nano rejoint AWS via Amazon Bedrock Nemotron est compatible avec l'inférence sans serveur et prend désormais en charge Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale et Yotta. Pour les organisations européennes utilisant déjà ces plateformes, cela simplifie l'adoption de Nemotron sans bouleverser leur architecture.

Outre le cloud public, NVIDIA promeut l'utilisation du Nemotron 3 Nano en tant que Microservice NIM déployable sur toute infrastructure accélérée par NVIDIACela permet des scénarios hybrides : une partie de la charge dans des clouds internationaux et une autre partie dans des centres de données locaux ou dans des clouds européens qui privilégient la résidence des données dans l’UE.

Versions Nemotron 3 Super et Ultra, conçus pour les charges de travail de raisonnement extrêmes et les systèmes multi-agents à grande échelle, sont prévu pour le premier semestre 2026Ce calendrier permet à l'écosystème européen de la recherche et des entreprises d'expérimenter avec Nano, de valider les cas d'utilisation et de concevoir des stratégies de migration vers des modèles plus grands si nécessaire.

Nemotron 3 positionne NVIDIA comme l'un des principaux fournisseurs de modèles ouverts haut de gamme orientés vers l'IA agentielleAvec une proposition qui allie efficacité technique (MoE hybride, NVFP4, contexte massif), ouverture (pondérations, ensembles de données et bibliothèques disponibles) et une attention particulière portée à la souveraineté et à la transparence des données, aspects particulièrement sensibles en Espagne et dans le reste de l'Europe, où la réglementation et la pression en faveur de l'audit de l'IA sont de plus en plus fortes.

Microsoft Discovery IA-2
Article connexe:
Microsoft Discovery AI stimule les avancées scientifiques et éducatives grâce à l'intelligence artificielle personnalisée