Nemotron 3: NVIDIAs store åbne satsning på multi-agent AI

Sidste ændring: 17/12/2025

  • Nemotron 3 er en åben familie af modeller, data og biblioteker med fokus på agentisk AI og multi-agent-systemer.
  • Den inkluderer tre MoE-størrelser (Nano, Super og Ultra) med hybridarkitektur og effektiv 4-bit træning på NVIDIA Blackwell.
  • Nemotron 3 Nano er nu tilgængelig i Europa via Hugging Face, offentlige cloud-løsninger og som en NIM-mikrotjeneste med et vindue på 1 million tokens.
  • Økosystemet er komplet med massive datasæt, NeMo Gym, NeMo RL og Evaluator til at træne, finjustere og revidere suveræne AI-agenter.

Nemotron 3 kunstig intelligensmodel

Kapløbet om kunstig intelligens bevæger sig fra simple, isolerede chatbots til agentsystemer, der samarbejder med hinanden, håndterer lange arbejdsgange og skal kunne revideres. I dette nye scenarie, NVIDIA har besluttet at tage et ret klart skridt: at åbne ikke kun modeller, men også data og værktøjerså virksomheder, offentlige forvaltninger og forskningscentre kan bygge deres egne AI-platforme med mere kontrol.

Den bevægelse materialiserer sig i Nemotron 3, en familie af åbne modeller rettet mod multi-agent AI Den søger at kombinere høj ydeevne, lave inferensomkostninger og gennemsigtighed. Forslaget er ikke tænkt som blot endnu en generel chatbot, men som et grundlag for at indsætte agenter, der ræsonnerer, planlægger og udfører komplekse opgaver i regulerede sektorerDette er især relevant i Europa og Spanien, hvor datasuverænitet og overholdelse af lovgivningen er vigtige.

En åben familie af modeller til agentisk og suveræn AI

Nemotron 3 præsenteres som et komplet økosystem: modeller, datasæt, biblioteker og træningsopskrifter under åbne licenser. NVIDIAs idé er, at organisationer ikke kun bruger AI som en uigennemsigtig tjeneste, men også kan inspicere, hvad der er indeni, tilpasse modellerne til deres domæner og implementere dem på deres egen infrastruktur, hvad enten det er i skyen eller i lokale datacentre.

Virksomheden integrerer denne strategi i sin forpligtelse til Suveræn AIRegeringer og virksomheder i Europa, Sydkorea og andre regioner søger åbne alternativer til lukkede eller udenlandske systemer, som ofte ikke stemmer godt overens med deres databeskyttelseslove eller revisionskrav. Nemotron 3 sigter mod at være det tekniske fundament, hvorpå nationale, sektorspecifikke eller virksomhedsmodeller kan bygges med større synlighed og kontrol.

Parallelt, NVIDIA styrker sin position ud over hardwareIndtil nu var det primært en reference-GPU-udbyder; med Nemotron 3 positionerer det sig også i laget for modellerings- og træningsværktøjer og konkurrerer mere direkte med aktører som OpenAI, Google, Anthropic eller endda Meta, og mod premiummodeller som SuperGrok HeavyMeta har reduceret sin forpligtelse til open source i de seneste generationer af Llama.

For det europæiske forsknings- og startup-økosystem – som er stærkt afhængigt af åbne modeller, der hostes på platforme som Hugging Face – repræsenterer tilgængeligheden af ​​vægte, syntetiske data og biblioteker under åbne licenser et stærkt alternativ til kinesiske modeller og amerikanere, der dominerer popularitets- og benchmark-ranglisterne.

Eksklusivt indhold - Klik her  Microsoft Store åbner ikke eller lukker hele tiden: detaljerede løsninger

Hybrid MoE-arkitektur: effektivitet for store agenter

Den centrale tekniske funktion ved Nemotron 3 er en Hybridarkitektur af latent blanding af eksperter (MoE)I stedet for at aktivere alle modellens parametre i hver inferens, er kun en brøkdel af dem aktiveret, den delmængde af eksperter, der er mest relevante for den pågældende opgave eller token.

Denne tilgang tillader reducerer beregningsomkostninger og hukommelsesforbrug drastiskDette øger også token-gennemstrømningen. For multi-agent-arkitekturer, hvor snesevis eller hundredvis af agenter kontinuerligt udveksler beskeder, er denne effektivitet nøglen til at forhindre, at systemet bliver uholdbart med hensyn til GPU- og cloud-omkostninger.

Ifølge data delt af NVIDIA og uafhængige benchmarks opnår Nemotron 3 Nano op til fire gange flere tokens per sekund Sammenlignet med sin forgænger, Nemotron 2 Nano, reducerer den genereringen af ​​unødvendige ræsonnementstokens med omkring 60%. I praksis betyder det lige så eller endda mere præcise svar, men med mindre "ordlighed" og en lavere pris pr. forespørgsel.

Den hybride MoE-arkitektur kombineret med specifikke træningsteknikker har ført til Mange af de mest avancerede åbne modeller anvender ekspertordningerNemotron 3 tilslutter sig denne tendens, men fokuserer specifikt på agentisk AI: interne ruter designet til koordinering mellem agenter, brug af værktøjer, håndtering af lange tilstande og trinvis planlægning.

Tre størrelser: Nano, Super og Ultra til forskellige arbejdsbelastninger

Nemotron 3 modelarkitektur

Nemotron 3-familien er organiseret i Tre hovedstørrelser af MoE-modellen, alle åbne og med reducerede aktive parametre takket være ekspertarkitekturen:

  • Nemotron 3 Nanoomkring 30.000 milliarder parametre i alt, med ca. 3.000 milliarder aktiver pr. tokenDen er designet til målrettede opgaver, hvor effektivitet er vigtig: softwarefejlfinding, dokumentopsummering, informationshentning, systemovervågning eller specialiserede AI-assistenter.
  • Nemotron 3 Supercirka 100.000 milliarder parametre, med 10.000 milliarder i aktiver ved hvert trin. Det er rettet mod Avanceret ræsonnement i multi-agent-arkitekturermed lav latenstid, selv når flere agenter samarbejder om at løse komplekse flows.
  • Nemotron 3 Ultra: det øvre niveau, med cirka 500.000 milliarder parametre og op til 50.000 milliarder aktiver pr. tokenDen fungerer som en kraftfuld ræsonnementsmotor til forskning, strategisk planlægning, beslutningsstøtte på højt niveau og særligt krævende AI-systemer.

I praksis giver dette organisationer mulighed for Vælg modelstørrelsen i henhold til dit budget og dine behovNano til massive, intensive arbejdsbyrder og stramme omkostninger; Super når der er behov for mere dybdegående ræsonnement med mange samarbejdende agenter; og Ultra til tilfælde hvor kvalitet og lang kontekst opvejer GPU-omkostningerne.

Eksklusivt indhold - Klik her  TAG Heuer Connected Calibre E5: springet til proprietær software og en New Balance-udgave

For nu Kun Nemotron 3 Nano er tilgængelig til øjeblikkelig brug.Super- og Ultra-varianterne er planlagt til første halvdel af 2026, hvilket giver europæiske virksomheder og laboratorier tid til først at eksperimentere med Nano, etablere pipelines og senere migrere cases, der kræver større kapacitet.

Nemotron 3 Nano: Vindue for 1 million tokens og begrænset pris

Nemotron 3 Nano

Nemotron 3 Nano er, fra i dag, familiens praktiske spydspidsNVIDIA beskriver den som den mest beregningsmæssigt omkostningseffektive model i serien, optimeret til at levere maksimal ydeevne i arbejdsgange med flere agenter og intensive, men gentagne opgaver.

Blandt dens tekniske funktioner skiller følgende sig ud: kontekstvindue på op til en million tokensDette muliggør hukommelsesbevaring til omfattende dokumenter, hele kodelagre eller forretningsprocesser med flere trin. For europæiske applikationer inden for bankvæsen, sundhedsvæsen eller offentlig administration, hvor registreringer kan være omfangsrige, er denne langsigtede kontekstfunktion særligt værdifuld.

Benchmarks for den uafhængige organisation Kunstig analyse placerer Nemotron 3 Nano som en af ​​de mest afbalancerede open source-modeller Den kombinerer intelligens, præcision og hastighed med gennemløbshastigheder på hundredvis af tokens i sekundet. Denne kombination gør den attraktiv for AI-integratorer og tjenesteudbydere i Spanien, der har brug for en god brugeroplevelse uden at infrastrukturomkostningerne stiger voldsomt.

Med hensyn til use cases sigter NVIDIA mod Nano på Indholdsoversigt, softwarefejlfinding, informationsindhentning og AI-assistenter til virksomhederTakket være reduktionen af ​​redundante ræsonnementstokens er det muligt at køre agenter, der opretholder lange samtaler med brugere eller systemer, uden at inferensregningen stiger voldsomt.

Åbne data og biblioteker: NeMo Gym, NeMo RL og Evaluator

NeMo-biblioteker

Et af de mest karakteristiske træk ved Nemotron 3 er, at Det er ikke begrænset til at frigive modelvægteNVIDIA ledsager familien med en omfattende pakke af åbne ressourcer til træning, finjustering og evaluering af agenter.

På den ene side stiller den et syntetisk korpus af flere billioner tokens af data før træning, efter træning og forstærkningDisse datasæt, der fokuserer på ræsonnement, kodning og flertrinsarbejdsgange, giver virksomheder og forskningscentre mulighed for at generere deres egne domænespecifikke varianter af Nemotron (f.eks. juridiske, sundhedsmæssige eller industrielle) uden at starte forfra.

Blandt disse ressourcer skiller følgende sig ud: Nemotron Agentic Safety-datasætDen indsamler telemetridata om agenters adfærd i virkelige scenarier. Dens mål er at hjælpe teams med at måle og styrke sikkerheden i komplekse autonome systemer: fra hvilke handlinger en agent foretager, når den støder på følsomme data, til hvordan den reagerer på tvetydige eller potentielt skadelige kommandoer.

Eksklusivt indhold - Klik her  De seneste funktioner i Windows 11: kunstig intelligens og nye måder at administrere din pc på

Hvad angår værktøjssektionen, lancerer NVIDIA NeMo Gym og NeMo RL som open source-biblioteker til forstærkningstræning og eftertræning, sammen med NeMo Evaluator til vurdering af sikkerhed og ydeevne. Disse biblioteker leverer brugsklare simuleringsmiljøer og pipelines med Nemotron-familien, men kan udvides til andre modeller.

Alt dette materiale – vægte, datasæt og kode – distribueres via GitHub og Hugging Face er licenseret under NVIDIA Open Model License.så europæiske teams problemfrit kan integrere det i deres egne MLOps. Virksomheder som Prime Intellect og Unsloth integrerer allerede NeMo Gym direkte i deres arbejdsgange for at forenkle reinforcement learning på Nemotron.

Tilgængelighed i offentlige clouds og det europæiske økosystem

Nemotron 3 Nano Krammeansigt

Nemotron 3 Nano er nu tilgængelig hos Knusende ansigt y GitHubsamt gennem inferensudbydere som Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter og Together AI. Dette åbner døren for udviklingsteams i Spanien til at teste modellen via API eller implementere den på deres egne infrastrukturer uden overdreven kompleksitet.

På skyfronten, Nemotron 3 Nano slutter sig til AWS via Amazon Bedrock til serverløs inferens og har annonceret understøttelse af Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale og Yotta. For europæiske organisationer, der allerede arbejder på disse platforme, gør dette det nemmere at implementere Nemotron uden drastiske ændringer i deres arkitektur.

Ud over den offentlige cloud promoverer NVIDIA brugen af ​​Nemotron 3 Nano som NIM-mikroservice kan implementeres på enhver NVIDIA-accelereret infrastrukturDette muliggør hybride scenarier: en del af belastningen i internationale clouds og en del i lokale datacentre eller i europæiske clouds, der prioriterer dataopbevaring i EU.

Versionerne Nemotron 3 Super og Ultra, rettet mod ekstreme ræsonnementsbelastninger og store multi-agent-systemer, er planlagt til første halvdel af 2026Denne tidslinje giver det europæiske forsknings- og erhvervssystem tid til at eksperimentere med nano, validere anvendelsesscenarier og designe migreringsstrategier til større modeller, når det er nødvendigt.

Nemotron 3 positionerer NVIDIA som en af ​​de førende leverandører af Avancerede åbne modeller rettet mod agentisk AIMed et forslag, der kombinerer teknisk effektivitet (hybrid MoE, NVFP4, massiv kontekst), åbenhed (vægte, datasæt og tilgængelige biblioteker) og et klart fokus på datasuverænitet og gennemsigtighed, aspekter der er særligt følsomme i Spanien og resten af ​​Europa, hvor regulering og pres for at revidere AI er stadig større.

Microsoft Discovery IA-2
relateret artikel:
Microsoft Discovery AI driver videnskabelige og uddannelsesmæssige gennembrud med personlig kunstig intelligens