- Nemotron 3 hè una famiglia aperta di mudelli, dati è biblioteche focalizzate nantu à l'IA agentica è i sistemi multi-agente.
- Include trè dimensioni MoE (Nano, Super è Ultra) cù architettura ibrida è furmazione efficiente à 4 bit nantu à NVIDIA Blackwell.
- Nemotron 3 Nano hè avà dispunibule in Europa via Hugging Face, nuvole publiche è cum'è microserviziu NIM, cù una finestra di 1 milione di gettoni.
- L'ecosistema hè cumpletatu cù enormi insemi di dati, NeMo Gym, NeMo RL è Evaluator per furmà, affinà è audità l'agenti IA sovrani.
A corsa per l'intelligenza artificiale si move da chatbot simplici è isolati à sistemi d'agenti chì collaboranu trà di elli, gestiscenu flussi di travagliu longhi è devenu esse verificabili. In questu novu scenariu, NVIDIA hà decisu di fà un passu abbastanza chjaru: apre micca solu i mudelli, ma ancu dati è strumentiaffinchì l'imprese, l'amministrazioni publiche è i centri di ricerca possinu custruisce e so propie piattaforme di IA cù più cuntrollu.
Quellu muvimentu si materializeghja in Nemotron 3, una famiglia di mudelli aperti orientati versu l'IA multi-agente Cerca di cumbinà alte prestazioni, bassi costi di inferenza è trasparenza. A pruposta ùn hè micca pensata cum'è un altru chatbot di usu generale, ma cum'è una basa nantu à quale schierà agenti chì ragionanu, pianificanu è eseguiscenu compiti cumplessi in settori regulatiQuestu hè particularmente pertinente in Europa è in Spagna, induve a suvranità di i dati è a cunfurmità regulatoria sò impurtanti.
Una famiglia aperta di mudelli per l'IA agentica è suvrana
Nemotron 3 hè prisentatu cum'è un ecosistema cumpletu: mudelli, datasets, biblioteche è ricette di furmazione sottu licenze aperte. L'idea di NVIDIA hè chì l'urganisazioni ùn solu cunsumanu l'IA cum'è un serviziu opacu, ma ponu ancu ispezionà ciò chì hè dentru, adattà i mudelli à i so duminii è implementalli nantu à a so propria infrastruttura, sia in u cloud sia in i centri di dati lucali.
L'impresa inquadra sta strategia in u so impegnu à AI souveraineI guverni è l'imprese in Europa, Corea di u Sud è altre regioni cercanu alternative aperte à i sistemi chjusi o stranieri, chì spessu ùn sò micca in cunfurmità cù e so lege di prutezzione di i dati o i requisiti di audit. Nemotron 3 hà per scopu di esse a basa tecnica nantu à a quale custruisce mudelli naziunali, settoriali o aziendali cù una maggiore visibilità è cuntrollu.
In parallelu, NVIDIA rinfurzeghja a so pusizione oltre l'hardwareFinu à avà, era principalmente un fornitore di GPU di riferimentu; cù Nemotron 3, si posiziona ancu in u stratu di strumenti di modelizazione è di furmazione, cumpete più direttamente cù attori cum'è OpenAI, Google, Anthropic, o ancu Meta, è contr'à mudelli premium cum'è SuperGrok PesanteMeta hà riduttu u so impegnu à l'open source in l'ultime generazioni di Llama.
Per l'ecosistema europeu di ricerca è startup - assai dipendente da mudelli aperti ospitati nantu à piattaforme cum'è Hugging Face - a dispunibilità di pesi, dati sintetici è biblioteche sottu licenze aperte rapprisenta una putente alternativa à u Modelli cinesi è l'Americani chì dominanu a pupularità è e classifiche di riferimentu.
Architettura MoE ibrida: efficienza per agenti à grande scala
A caratteristica tecnica centrale di Nemotron 3 hè una Architettura ibrida di mistura latente di esperti (MoE)Invece di attivà tutti i parametri di u mudellu in ogni inferenza, solu una frazzione di elli sò attivati, u sottoinsieme di esperti più pertinenti à u compitu o u token in quistione.
Questu approcciu permette riduce drasticamente u costu di calculu è u cunsumu di memoriaQuestu aumenta ancu u rendimentu di i token. Per l'architetture multi-agente, induve decine o centinaie d'agenti scambianu continuamente missaghji, sta efficienza hè chjave per impedisce chì u sistema diventi insostenibile in termini di costi di GPU è cloud.
Sicondu i dati spartuti da NVIDIA è benchmark indipendenti, u Nemotron 3 Nano riesce finu à quattru volte più gettoni per seconda In paragone cù u so predecessore, u Nemotron 2 Nano, riduce a generazione di gettoni di ragiunamentu inutili di circa u 60%. In pratica, questu significa risposte ugualmente precise o ancu più precise, ma cù menu "verbalità" è un costu per dumanda più bassu.
L'architettura ibrida di u MoE, cumminata cù tecniche di furmazione specifiche, hà purtatu à Parechji di i mudelli aperti più avanzati aduttanu schemi di espertiNemotron 3 si unisce à sta tendenza, ma si cuncentra specificamente nantu à l'IA agentica: percorsi interni cuncepiti per a coordinazione trà l'agenti, l'usu di strumenti, a gestione di stati longhi è a pianificazione passu à passu.
Trè dimensioni: Nano, Super è Ultra per diverse carichi di travagliu

A famiglia Nemotron 3 hè urganizata in trè dimensioni principali di u mudellu MoE, tutti aperti è cù parametri attivi ridutti grazia à l'architettura esperta:
- Nemotron 3 Nanocirca 30.000 miliardi di parametri totali, cù circa 3.000 miliardi di beni per tokenHè cuncipitu per compiti mirati induve l'efficienza hè impurtante: debugging di software, riassuntu di documenti, recuperu d'infurmazioni, monitoraghju di sistema, o assistenti specializati di IA.
- Nemotron 3 Super: circa 100.000 miliardi di parametri, cù 10.000 miliardi di beni à ogni passu. Hè orientatu versu Ragionamentu avanzatu in architetture multi-agentecù una bassa latenza ancu quandu parechji agenti cooperanu per risolve flussi cumplessi.
- Nemotron 3 Ultra: u livellu superiore, cù circa 500.000 miliardi di parametri è finu à 50.000 miliardi di beni per tokenFunziona cum'è un putente mutore di ragiunamentu per a ricerca, a pianificazione strategica, u supportu à e decisioni di altu livellu è i sistemi di IA particularmente esigenti.
In pratica, questu permette à l'urganisazioni Sceglite a taglia di u mudellu secondu u vostru budget è i vostri bisogniNano per carichi di travagliu massivi è intensivi è costi stretti; Super quandu hè necessaria una maggiore prufundità di ragiunamentu cù parechji agenti collaboratori; è Ultra per i casi induve a qualità è u cuntestu longu superanu u costu di a GPU.
Per avà Solu u Nemotron 3 Nano hè dispunibule per un usu immediatu.E variante Super è Ultra sò previste per a prima metà di u 2026, dendu à e cumpagnie è i laboratorii europei u tempu di sperimentà prima cù Nano, stabilisce pipeline è, dopu, migrà i casi chì necessitanu una capacità più grande.
Nemotron 3 Nano: finestra di 1 milione di gettoni è costu cuntenutu

Nemotron 3 Nano hè, da oghje, a punta di lancia pratica di a famigliaNVIDIA u descrive cum'è u mudellu u più efficiente in termini di costi computazionali di a gamma, ottimizatu per furnisce e massime prestazioni in flussi di travagliu multi-agente è attività intensive ma ripetitive.
Trà e so caratteristiche tecniche, si distinguenu e seguenti: finestra di cuntestu finu à un milione di gettoniQuestu permette a cunservazione di a memoria per documenti estensivi, interi archivi di codice, o prucessi cummerciali in più tappe. Per l'applicazioni europee in u settore bancariu, sanitariu o amministrativu publicu, induve i registri ponu esse voluminosi, sta capacità di cuntestu à longu andà hè particularmente preziosa.
I punti di riferimentu di l'urganizazione indipendente L'analisi artificiale piazza Nemotron 3 Nano cum'è unu di i mudelli open-source più equilibrati. Combina intelligenza, precisione è velocità, cù tassi di rendimentu di centinaie di gettoni per seconda. Sta cumbinazione a rende attraente per l'integratori di IA è i fornitori di servizii in Spagna chì anu bisognu di una bona esperienza d'utilizatore senza costi d'infrastruttura chì aumentanu vertiginosamente.
In termini di casi d'usu, NVIDIA hà cum'è scopu Nano. Riassuntu di cuntenutu, debugging di software, recuperu d'infurmazioni è assistenti IA d'impresaGrazie à a riduzzione di i gettoni di ragiunamentu ridondanti, hè pussibule di fà funziunà agenti chì mantenenu longhe conversazioni cù l'utilizatori o i sistemi senza chì a fattura di l'inferenza aumenti vertiginosamente.
Dati aperti è biblioteche: NeMo Gym, NeMo RL è Evaluator

Una di e caratteristiche più distintive di Nemotron 3 hè chì Ùn hè micca limitatu à liberà i pesi di u mudelluNVIDIA accumpagna a famiglia cù una suite cumpleta di risorse aperte per a furmazione, l'ottimisazione è a valutazione di l'agenti.
Da una parte, mette à dispusizione un corpus sinteticu di parechji trilioni di gettoni di dati di pre-addestramentu, post-addestramentu è di rinforzuQuesti insemi di dati, focalizati nantu à u ragiunamentu, a codificazione è i flussi di travagliu in più tappe, permettenu à l'imprese è à i centri di ricerca di generà e so varianti specifiche di u duminiu di Nemotron (per esempiu, legale, sanitariu o industriale) senza cumincià da zero.
Trà queste risorse, si distinguenu e seguenti: Inseme di dati di sicurezza agentica di NemotronRaccoglie dati di telemetria nantu à u cumpurtamentu di l'agenti in scenarii di u mondu reale. U so scopu hè di aiutà e squadre à misurà è rinfurzà a sicurezza di sistemi autonomi cumplessi: da l'azzioni chì un agente piglia quandu incontra dati sensibili, à cumu reagisce à cumandamenti ambigui o potenzialmente dannosi.
In quantu à a sezzione di strumenti, NVIDIA lancia NeMo Gym è NeMo RL cum'è biblioteche open source per a furmazione di rinforzu è dopu a furmazione, inseme cù NeMo Evaluator per valutà a sicurezza è e prestazioni. Queste biblioteche furniscenu ambienti di simulazione è pipeline pronti à l'usu cù a famiglia Nemotron, ma ponu esse estese à altri mudelli.
Tuttu stu materiale - pesi, insemi di dati è codice - hè distribuitu per mezu di GitHub è Hugging Face sò licenziati sottu a licenza NVIDIA Open Model.affinchì e squadre europee possinu integrallu perfettamente in i so propri MLOps. Cumpagnie cum'è Prime Intellect è Unsloth stanu digià incorporendu NeMo Gym direttamente in i so flussi di travagliu per simplificà l'apprendimentu di rinforzu nantu à Nemotron.
Disponibilità in i nuvuli publichi è l'ecosistema europeu

Nemotron 3 Nano hè avà dispunibule à Face Abbracciata y GitHubè ancu per mezu di fornitori d'inferenza cum'è Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter è Together AI. Questu apre a porta à e squadre di sviluppu in Spagna per pruvà u mudellu via API o implementallu nantu à e so propie infrastrutture senza eccessiva cumplessità.
Nant'à u fronte di e nuvole, Nemotron 3 Nano si unisce à AWS via Amazon Bedrock per l'inferenza senza server, è hà annunziatu u supportu per Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale è Yotta. Per l'urganisazioni europee chì travaglianu digià nantu à queste piattaforme, questu facilita l'adopzione di Nemotron senza cambiamenti drastici à a so architettura.
In più di u cloud publicu, NVIDIA prumove l'usu di Nemotron 3 Nano cum'è Microserviziu NIM implementabile nantu à qualsiasi infrastruttura accelerata da NVIDIAQuestu permette scenarii ibridi: una parte di u caricu in nuvole internaziunali è una parte in centri di dati lucali o in nuvole europee chì prioritizanu a residenza di i dati in l'UE.
Versioni Nemotron 3 Super è Ultra, orientati versu carichi di travagliu di ragiunamentu estremi è sistemi multi-agente à grande scala, sò previstu per a prima metà di u 2026Questa cronologia permette à l'ecosistema europeu di ricerca è d'affari di sperimentà cù Nano, validà i casi d'usu è cuncepisce strategie di migrazione versu mudelli più grandi quandu hè necessariu.
Nemotron 3 posiziona NVIDIA cum'è unu di i principali fornitori di mudelli aperti di alta gamma orientati versu l'IA agenticaCù una pruposta chì mischia l'efficienza tecnica (MoE ibridu, NVFP4, cuntestu massivu), l'apertura (pesi, insemi di dati è biblioteche dispunibili) è una chiara attenzione à a suvranità è a trasparenza di i dati, aspetti particularmente sensibili in Spagna è in u restu di l'Europa, induve a regulazione è a pressione per verificà l'IA sò sempre più grande.
Sò un entusiasta di a tecnulugia chì hà trasfurmatu i so interessi "geek" in una professione. Aghju passatu più di 10 anni di a mo vita cù a tecnulugia d'avanguardia è scacciendu ogni tipu di prugrammi per pura curiosità. Avà sò specializatu in tecnulugia di computer è video games. Questu hè chì dapoi più di 5 anni aghju scrittu per diversi siti web nantu à a tecnulugia è i video games, creendu articuli chì cercanu di dà l'infurmazioni chì avete bisognu in una lingua chì hè comprensibile à tutti.
Sì avete qualchì quistione, a mo cunniscenza varieghja da tuttu ciò chì riguarda u sistema operatore Windows è ancu Android per i telefunini. È u mo impegnu hè di voi, sò sempre dispostu à passà uni pochi di minuti è aiutavvi à risolve tutte e dumande chì pudete avè in questu mondu Internet.
