- Nemotron 3 er en åpen familie av modeller, data og biblioteker fokusert på agentisk AI og multiagentsystemer.
- Den inkluderer tre MoE-størrelser (Nano, Super og Ultra) med hybridarkitektur og effektiv 4-bits trening på NVIDIA Blackwell.
- Nemotron 3 Nano er nå tilgjengelig i Europa via Hugging Face, offentlige skyer og som en NIM-mikrotjeneste, med et vindu på 1 million tokens.
- Økosystemet kompletteres med massive datasett, NeMo Gym, NeMo RL og Evaluator for å trene, finjustere og revidere suverene AI-agenter.
Kappløpet om kunstig intelligens beveger seg fra enkle, isolerte chatboter til agentsystemer som samarbeider med hverandre, håndterer lange arbeidsflyter og må være reviderbare. I dette nye scenariet, NVIDIA har bestemt seg for å ta et ganske tydelig skritt: å åpne ikke bare modeller, men også data og verktøyslik at bedrifter, offentlige forvaltninger og forskningssentre kan bygge sine egne AI-plattformer med mer kontroll.
Den bevegelsen materialiserer seg i Nemotron 3, en familie av åpne modeller rettet mot multi-agent AI Den søker å kombinere høy ytelse, lave slutningskostnader og åpenhet. Forslaget er ikke ment som bare nok en generell chatbot, men som et grunnlag for å utplassere agenter som resonnerer, planlegger og utfører komplekse oppgaver i regulerte sektorerDette er spesielt relevant i Europa og Spania, hvor datasuverenitet og samsvar med regelverk er viktig.
En åpen familie av modeller for agentisk og suveren AI
Nemotron 3 presenteres som et komplett økosystem: modeller, datasett, biblioteker og treningsoppskrifter under åpne lisenser. NVIDIAs idé er at organisasjoner ikke bare bruker AI som en ugjennomsiktig tjeneste, men kan inspisere hva som er inni, tilpasse modellene til sine domener og distribuere dem på sin egen infrastruktur, enten i skyen eller i lokale datasentre.
Selskapet setter denne strategien innenfor sin forpliktelse til Suveren AIMyndigheter og selskaper i Europa, Sør-Korea og andre regioner søker åpne alternativer til lukkede eller utenlandske systemer, som ofte ikke samsvarer godt med deres personvernlover eller revisjonskrav. Nemotron 3 har som mål å være det tekniske grunnlaget for å bygge nasjonale, sektorvise eller bedriftsmodeller med større synlighet og kontroll.
Parallelt, NVIDIA styrker sin posisjon utover maskinvareFrem til nå var det primært en referanseleverandør av GPUer; med Nemotron 3 posisjonerer det seg også i modellerings- og treningsverktøysjiktet, og konkurrerer mer direkte med aktører som OpenAI, Google, Anthropic eller til og med Meta, og mot premiummodeller som SuperGrok HeavyMeta har redusert sin forpliktelse til åpen kildekode i de siste generasjonene av Llama.
For det europeiske forsknings- og oppstartsøkosystemet – som er sterkt avhengig av åpne modeller som ligger på plattformer som Hugging Face – representerer tilgjengeligheten av vekter, syntetiske data og biblioteker under åpne lisenser et kraftig alternativ til Kinesiske modeller og amerikanere som dominerer popularitets- og referanserangeringene.
Hybrid MoE-arkitektur: effektivitet for storskala agenter
Den sentrale tekniske funksjonen til Nemotron 3 er en Hybridarkitektur av latent blanding av eksperter (MoE)I stedet for å aktivere alle modellens parametere i hver inferens, er bare en brøkdel av dem slått på, delmengden av eksperter som er mest relevante for den aktuelle oppgaven eller tokenet.
Denne tilnærmingen tillater redusere beregningskostnader og minneforbruk drastiskDette øker også token-gjennomstrømningen. For arkitekturer med flere agenter, der dusinvis eller hundrevis av agenter kontinuerlig utveksler meldinger, er denne effektiviteten nøkkelen til å forhindre at systemet blir uholdbart når det gjelder GPU- og skykostnader.
Ifølge data delt av NVIDIA og uavhengige benchmarktester, oppnår Nemotron 3 Nano opptil fire ganger flere tokens per sekund Sammenlignet med forgjengeren, Nemotron 2 Nano, reduserer den genereringen av unødvendige resonnementstokener med rundt 60 %. I praksis betyr dette like eller enda mer nøyaktige svar, men med mindre "ordrikhet" og lavere kostnad per spørring.
Den hybride MoE-arkitekturen, kombinert med spesifikke treningsteknikker, har ført til Mange av de mest avanserte åpne modellene bruker ekspertordningerNemotron 3 slutter seg til denne trenden, men fokuserer spesifikt på agentisk AI: interne ruter designet for koordinering mellom agenter, bruk av verktøy, håndtering av lange tilstander og trinnvis planlegging.
Tre størrelser: Nano, Super og Ultra for ulike arbeidsbelastninger

Nemotron 3-familien er organisert i tre hovedstørrelser av MoE-modellen, alle åpne og med reduserte aktive parametere takket være ekspertarkitekturen:
- Nemotron 3 Nanorundt 30.000 milliarder parametere totalt, med omtrent 3.000 milliarder eiendeler per tokenDen er utviklet for målrettede oppgaver der effektivitet er viktig: feilsøking av programvare, dokumentoppsummering, informasjonsinnhenting, systemovervåking eller spesialiserte AI-assistenter.
- Nemotron 3 Superomtrent 100.000 milliarder parametere, med 10.000 milliarder i eiendeler på hvert trinn. Den er rettet mot Avansert resonnement i multiagentarkitekturermed lav latens selv når flere agenter samarbeider for å løse komplekse flyter.
- Nemotron 3 Ultra: det øvre nivået, med omtrent 500.000 milliarder parametere og opptil 50.000 milliarder eiendeler per tokenDen fungerer som en kraftig resonneringsmotor for forskning, strategisk planlegging, beslutningsstøtte på høyt nivå og spesielt krevende AI-systemer.
I praksis tillater dette organisasjoner Velg modellstørrelse i henhold til budsjett og behovNano for massive, intensive arbeidsmengder og stramme kostnader; Super når det er behov for dypere resonnement med mange samarbeidende agenter; og Ultra for tilfeller der kvalitet og lang kontekst oppveier GPU-kostnaden.
For nå Kun Nemotron 3 Nano er tilgjengelig for umiddelbar bruk.Super- og Ultra-variantene er planlagt for første halvdel av 2026, noe som gir europeiske selskaper og laboratorier tid til å eksperimentere først med Nano, etablere rørledninger og senere migrere tilfeller som krever større kapasitet.
Nemotron 3 Nano: Vindu for 1 million tokener og begrenset kostnad

Nemotron 3 Nano er, per i dag, familiens praktiske spydspissNVIDIA beskriver den som den mest beregningsmessig kostnadseffektive modellen i serien, optimalisert for å levere maksimal ytelse i arbeidsflyter med flere agenter og intensive, men repeterende oppgaver.
Blant de tekniske funksjonene skiller følgende seg ut: kontekstvindu på opptil én million tokensDette muliggjør lagring av minne for omfattende dokumenter, hele kodelagre eller forretningsprosesser med flere trinn. For europeiske applikasjoner innen bank, helsevesen eller offentlig administrasjon, der poster kan være omfangsrike, er denne langsiktige kontekstfunksjonen spesielt verdifull.
Referansepunktene for den uavhengige organisasjonen Kunstig analyse plasserer Nemotron 3 Nano som en av de mest balanserte modellene med åpen kildekode Den kombinerer intelligens, nøyaktighet og hastighet, med gjennomstrømningshastigheter på hundrevis av tokens per sekund. Denne kombinasjonen gjør den attraktiv for AI-integratorer og tjenesteleverandører i Spania som trenger en god brukeropplevelse uten skyhøye infrastrukturkostnader.
Når det gjelder brukstilfeller, sikter NVIDIA seg inn på Nano på Innholdssammendrag, feilsøking av programvare, informasjonsinnhenting og AI-assistenter for bedrifterTakket være reduksjonen av overflødige resonnementstokener er det mulig å kjøre agenter som opprettholder lange samtaler med brukere eller systemer uten at inferensregningen skyter i været.
Åpne data og biblioteker: NeMo Gym, NeMo RL og Evaluator

En av de mest karakteristiske egenskapene til Nemotron 3 er at Det er ikke begrenset til å frigjøre modellvekterNVIDIA følger med familien med en omfattende pakke med åpne ressurser for opplæring, finjustering og evaluering av agenter.
På den ene siden gjør den tilgjengelig et syntetisk korpus av flere billioner tokens med data før, etter trening og forsterkningDisse datasettene, fokusert på resonnement, koding og flertrinns arbeidsflyter, lar bedrifter og forskningssentre generere sine egne domenespesifikke varianter av Nemotron (f.eks. juridisk, helsevesen eller industri) uten å starte fra bunnen av.
Blant disse ressursene skiller følgende seg ut: Nemotron Agentic Safety-datasettDen samler inn telemetridata om agenters oppførsel i virkelige scenarier. Målet er å hjelpe team med å måle og styrke sikkerheten til komplekse autonome systemer: fra hvilke handlinger en agent foretar seg når den møter sensitive data, til hvordan den reagerer på tvetydige eller potensielt skadelige kommandoer.
Når det gjelder verktøydelen, lanserer NVIDIA NeMo Gym og NeMo RL som åpen kildekode-biblioteker for forsterkningstrening og ettertrening, sammen med NeMo Evaluator for vurdering av sikkerhet og ytelse. Disse bibliotekene tilbyr bruksklare simuleringsmiljøer og pipelines med Nemotron-familien, men kan utvides til andre modeller.
Alt dette materialet – vekter, datasett og kode – distribueres gjennom GitHub og Hugging Face er lisensiert under NVIDIA Open Model License.slik at europeiske team sømløst kan integrere det i sine egne MLO-er. Selskaper som Prime Intellect og Unsloth integrerer allerede NeMo Gym direkte i arbeidsflytene sine for å forenkle forsterkninglæring på Nemotron.
Tilgjengelighet i offentlige skyer og det europeiske økosystemet

Nemotron 3 Nano er nå tilgjengelig hos Klemme ansiktet y GitHubsamt gjennom leverandører av slutningssystemer som Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter og Together AI. Dette åpner døren for utviklingsteam i Spania til å teste modellen via API eller distribuere den på sine egne infrastrukturer uten overdreven kompleksitet.
På skyfronten, Nemotron 3 Nano blir en del av AWS via Amazon Bedrock for serverløs inferens, og har annonsert støtte for Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale og Yotta. For europeiske organisasjoner som allerede jobber med disse plattformene, gjør dette det enklere å ta i bruk Nemotron uten drastiske endringer i arkitekturen deres.
I tillegg til den offentlige skyen promoterer NVIDIA bruken av Nemotron 3 Nano som NIM-mikrotjeneste kan distribueres på enhver NVIDIA-akselerert infrastrukturDette gir mulighet for hybride scenarioer: deler av belastningen i internasjonale skyer og deler i lokale datasentre eller i europeiske skyer som prioriterer datalagring i EU.
Versjonene Nemotron 3 Super og Ultra, rettet mot ekstreme resonneringsbelastninger og store multiagentsystemer, er planlagt for første halvdel av 2026Denne tidslinjen gir det europeiske forsknings- og næringslivsøkosystemet tid til å eksperimentere med nano, validere brukstilfeller og utforme migreringsstrategier til større modeller når det er nødvendig.
Nemotron 3 posisjonerer NVIDIA som en av de ledende leverandørene av avanserte åpne modeller rettet mot agentisk AIMed et forslag som blander teknisk effektivitet (hybrid MoE, NVFP4, massiv kontekst), åpenhet (vekter, datasett og tilgjengelige biblioteker) og et klart fokus på datasuverenitet og transparens, aspekter som er spesielt sensitive i Spania og resten av Europa, hvor regulering og press for å revidere AI er stadig større.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.
