Nemotron 3: la gran aposta oberta de NVIDIA per a la IA multiagent

Darrera actualització: 17/12/2025

  • Nemotron 3 és una família oberta de models, dades i biblioteques centrada en IA agèntica i sistemes multiagent.
  • Inclou tres mides MoE (Nano, Super i Ultra) amb arquitectura híbrida i entrenament eficient en 4 bits sobre NVIDIA Blackwell.
  • Nemotron 3 Nano ja està disponible a Europa via Hugging Face, núvols públics i com a microservei NIM, amb finestra d'1 milió de tokens.
  • L'ecosistema es completa amb datasets massius, NeMo Gym, NeMo RL i Evaluator per entrenar, ajustar i auditar agents d'IA sobirana.

Model d'intel·ligència artificial Nemotron 3

La carrera per la intel·ligència artificial s'està movent des del simple chatbot aïllat cap a sistemes d'agents que col·laboren entre ells, gestionen fluxos de feina llargs i necessiten ser auditables. En aquest nou escenari, NVIDIA ha decidit fer un pas força clar: obrir no només models, sinó també dades i eines, perquè empreses, administracions públiques i centres de recerca puguin construir les seves plataformes d'IA amb més control.

Aquest moviment es materialitza en Nemotron 3, una família de models oberts orientats a IA multiagent que cerca combinar rendiment alt, costos d'inferència continguts i transparència. La proposta no està pensada com un altre chatbot generalista més, sinó com una base sobre la qual desplegar agents que raonen, planifiquen i executen tasques complexes en sectors regulats, una cosa especialment rellevant a Europa i Espanya, on pesen la sobirania de dades i el compliment normatiu.

Una família oberta de models per a IA agentica i sobirana

Nemotron 3 es presenta com un ecosistema complet: models, conjunts de dades, biblioteques i receptes d´entrenament sota llicències obertes. La idea de NVIDIA és que les organitzacions no només consumeixin la IA com un servei opac, sinó que puguin inspeccionar què hi ha dins, adaptar els models als seus dominis i desplegar-los a la seva pròpia infraestructura, ja sigui al núvol oa centres de dades locals.

La companyia emmarca aquesta estratègia dins de la seva aposta per la IA sobirana: governs i empreses d'Europa, Corea del Sud i altres regions busquen alternatives obertes davant sistemes tancats o forans, que sovint no encaixen bé amb les lleis de protecció de dades o les exigències d'auditoria. Nemotron 3 vol ser aquest pilar tècnic sobre el qual construir models nacionals, sectorials o corporatius amb més visibilitat i control.

En paral·lel, NVIDIA reforça la seva posició més enllà del maquinari. Fins ara era sobretot el proveïdor de GPU de referència; amb Nemotron 3 es posiciona també a la capa de models i eines d'entrenament, competint de forma més directa amb actors com OpenAI, Google, Anthropic o fins i tot Meta, i davant models premium com SuperGrok Heavy. Meta ha anat rebaixant la seva aposta pel codi obert en les darreres generacions de Llama.

Per a l'ecosistema europeu de recerca i startups –molt recolzat en models oberts allotjats en plataformes com Hugging Face–, la disponibilitat de pesos, dades sintètiques i biblioteques sota llicències obertes suposa una alternativa potent als models xinesos i nord-americans que dominen el rànquing de popularitat i benchmarks.

Contingut exclusiu - Clic Aquí  Microsoft Store no obre o es tanca sola: solucions detallades

Arquitectura MoE híbrida: eficiència per a agents a gran escala

El tret tècnic central de Nemotron 3 és una arquitectura híbrida de mescla latent d'experts (Mixture-of-Experts, MoE). En comptes d'activar tots els paràmetres del model en cada inferència, només se n'encén una fracció, el subconjunt d'experts més rellevants per a la tasca o el token en qüestió.

Aquest enfocament permet reduir de forma dràstica el cost computacional i el consum de memòria, augmentant alhora el throughput de tokens. Per a arquitectures multiagent, on desenes o centenars d'agents intercanvien missatges de manera contínua, aquesta eficiència és clau perquè el sistema no es torni inassumible a GPU i factura de núvol.

Segons dades compartides per NVIDIA i benchmarks independents, Nemotron 3 Nano aconsegueix fins a quatre vegades més tokens per segon que el seu predecessor Nemotron 2 Nano, i aconsegueix reduir al voltant d'un 60% la generació de tokens de raonament innecessaris. A la pràctica, això significa respostes igual o més precises, però amb menys «parauleria» i menys cost per consulta.

L'arquitectura MoE híbrida, combinada amb tècniques d'entrenament específiques, ha fet que bona part dels models oberts més avançats adoptin esquemes d'experts. Nemotron 3 se suma a aquesta tendència, però l'orienta expressament a la IA agèntica: rutes internes pensades per a coordinació entre agents, ús d'eines, maneig d'estats llargs i planificació per passos.

Tres mides: Nano, Super i Ultra per a diferents càrregues de treball

Arquitectura de models Nemotron 3

La família Nemotron 3 s'organitza a tres mides principals de model MoE, tots oberts i amb paràmetres actius reduïts gràcies a l'arquitectura d'experts:

  • Nemotron 3 Nano: al voltant de 30.000 milions de paràmetres totals, amb uns 3.000 milions actius per token. Està pensat per a tasques dirigides on importa l'eficiència: depuració de programari, resum de documents, recuperació d'informació, supervisió de sistemes o assistents d'IA especialitzats.
  • Nemotron 3 Super: aproximadament 100.000 milions de paràmetres, amb 10.000 milions actius a cada pas. S'orienta a raonament avançat en arquitectures multiagent, amb baixa latència fins i tot quan múltiples agents cooperen per resoldre fluxos complexos.
  • Nemotron 3 Ultra: el nivell superior, amb uns 500.000 milions de paràmetres i fins i tot 50.000 milions actius per token. Opera com un gran motor de raonament per a investigació, planificació estratègica, suport a decisions d'alt nivell i sistemes d'IA especialment exigents.

A la pràctica, això permet a les organitzacions triar la mida del model segons la butxaca i els requisits: Nano per a càrregues massives d'ús intensiu i costos ajustats; Super quan es necessita més profunditat de raonament amb molts agents col·laborant; i Ultra per a casos on la qualitat i el context llarg pesen més que el cost de GPU.

Contingut exclusiu - Clic Aquí  TAG Heuer Connected Calibre E5: salt a programari propi i edició New Balance

De moment, només Nemotron 3 Nano està disponible per a ús immediat. Les variants Super i Ultra estan previstes per a la primera meitat del 2026, donant marge a empreses i laboratoris europeus per experimentar primer amb Nano, establir pipelins i, més endavant, migrar els casos que requereixin més capacitat.

Nemotron 3 Nano: finestra d'1 milió de tokens i cost contingut

Nemotron 3 Nano

Nemotron 3 Nano és, avui dia, la punta de llança pràctica de la família. NVIDIA ho descriu com el model més eficient en cost computacional de la gamma, optimitzat per oferir màxim rendiment en fluxos de treball multiagent i tasques intensives però repetitives.

Entre les seves característiques tècniques destaquen una finestra de context de fins a un milió de tokens, el que permet mantenir memòria sobre documents extensos, repositoris de codi complets o processos empresarials de molts passos. Per a aplicacions europees a banca, salut o administració pública, on els expedients poden ser voluminosos, aquesta capacitat de context llarg resulta especialment interessant.

Els benchmarks de l'organització independent Artificial Analysis situen Nemotron 3 Nano com un dels models oberts més equilibrats entre intel·ligència, precisió i velocitat de sortida, amb taxes que ronden els centenars de tokens per segon. Aquesta combinació fa que sigui atractiu per a integradors i proveïdors de serveis d'IA a Espanya que necessiten bona experiència d'usuari sense disparar els costos d'infraestructura.

Pel que fa a casos d'ús, NVIDIA orienta Nano a resum de continguts, depuració de programari, recuperació dinformació i assistents dIA corporatius. Gràcies a la reducció de tokens de raonament redundants, és viable executar agents que mantinguin converses llargues amb usuaris o sistemes sense que la factura d'inferència es dispari.

Dades obertes i biblioteques: NeMo Gym, NeMo RL i Evaluator

biblioteques NeMo

Un dels punts més diferencials de Nemotron 3 és que no es limita a alliberar pesos de model. NVIDIA acompanya la família amb un paquet ampli de recursos oberts per entrenar, ajustar i avaluar agents.

D'una banda, posa a disposició un corpus sintètic de diversos bilions de tokens de dades de preentrenament, postentrenament i reforç, centrats en raonament, codificació i fluxos de treball multi‐pas. Aquests conjunts de dades permeten a empreses i centres de recerca generar variants pròpies de Nemotron adaptades al domini (per exemple, jurídic, sanitari o industrial) sense partir de zero.

Entre aquests recursos destaca el conjunt de dades Nemotron Agentic Safety, que recopila telemetria de comportament d'agents en escenaris reals. El seu objectiu és ajudar els equips a mesurar i reforçar la seguretat de sistemes autònoms complexos: des de quines accions pren un agent quan es troba amb una dada sensible, fins a com reacciona davant d'ordres ambigües o potencialment perjudicials.

Contingut exclusiu - Clic Aquí  Les últimes funcions que arriben a Windows 11: intel·ligència artificial i noves maneres de gestionar el teu PC

Sobre la part d'eines, NVIDIA llança NeMo Gym i NeMo RL com a biblioteques de codi obert per a entrenament per reforç i postentrenament, juntament amb NeMo Evaluator per avaluar seguretat i rendiment. Aquestes llibreries proporcionen entorns de simulació i pipelins llestos per utilitzar amb la família Nemotron, però es poden estendre a altres models.

Tot aquest material —pesos, datasets i codi— es distribueix a través de GitHub i Hugging Face sota la Llicència de Model Obert de NVIDIA, de manera que equips europeus puguin integrar-lo als seus propis MLOps sense fricció. Empreses com Prime Intellect o Unsloth ja estan incorporant NeMo Gym directament als seus fluxos de treball per simplificar l'aprenentatge per reforç sobre Nemotron.

Disponibilitat en núvols públics i ecosistema europeu

Nemotron 3 Nano Hugging Face

Nemotron 3 Nano ja està disponible a Cara abraçada y GitHub, així com a través de proveïdors d'inferència com Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI. Això obre la porta perquè equips de desenvolupament a Espanya puguin provar el model via API o desplegar-lo en infraestructures pròpies sense excessiva complexitat.

Al front del núvol, Nemotron 3 Nano s'incorpora a AWS mitjançant Amazon Bedrock per a inferència sense servidor, i compta amb suport anunciat per a Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta. Per a les organitzacions europees que ja treballen sobre aquestes plataformes, això facilita adoptar Nemotron sense canvis dràstics a la seva arquitectura.

A més del núvol públic, NVIDIA impulsa l'ús de Nemotron 3 Nano com microservei NIM desplegable a qualsevol infraestructura accelerada per NVIDIA. Això permet escenaris híbrids: part de la càrrega en núvols internacionals i part en centres de dades locals o en núvols europeus que prioritzen la residència de dades a la UE.

les versions Nemotron 3 Super i Ultra, orientades a càrregues de treball de raonament extrem i sistemes multiagent de gran escala, estan previstes per a la primera meitat del 2026. Aquest calendari dóna marge perquè l'ecosistema europeu de recerca i empreses experimenti amb Nano, validi casos d'ús i dissenyi estratègies de migració cap a models més grans quan siguin necessaris.

Nemotron 3 situa NVIDIA com un dels principals proveïdors de models oberts d'alta gamma orientats a IA agentica, amb una proposta que barreja eficiència tècnica (MoE híbrid, NVFP4, context massiu), obertura (pesos, datasets i llibreries disponibles) i un focus clar en la sobirania de dades i la transparència, aspectes especialment sensibles a Espanya ia la resta d'Europa, on la regulació i la pressió per auditar la IA són cada cop més grans.

microsoft discovery ia-2
Article relacionat:
Microsoft Discovery IA impulsa avenços científics i educatius amb intel·ligència artificial personalitzada