Nemotron 3: NVIDIA-ina velika odprta stava na večagentno umetno inteligenco

Zadnja posodobitev: 17/12/2025

  • Nemotron 3 je odprta družina modelov, podatkov in knjižnic, osredotočenih na agentno umetno inteligenco in večagentne sisteme.
  • Vključuje tri velikosti MoE (Nano, Super in Ultra) s hibridno arhitekturo in učinkovitim 4-bitnim učenjem na NVIDIA Blackwell.
  • Nemotron 3 Nano je zdaj na voljo v Evropi prek Hugging Face, javnih oblakov in kot mikrostoritev NIM, z oknom 1 milijona žetonov.
  • Ekosistem je dopolnjen z ogromnimi nabori podatkov, NeMo Gym, NeMo RL in Evaluatorjem za usposabljanje, uglaševanje in revidiranje suverenih agentov umetne inteligence.

Model umetne inteligence Nemotron 3

Tekma za umetno inteligenco se seli od preprostih, izoliranih klepetalnih robotov k agentskim sistemom, ki sodelujejo med seboj, upravljajo dolge delovne procese in morajo biti pregledni. V tem novem scenariju, NVIDIA se je odločila za dokaj jasen korak: odpreti ne le modele, temveč tudi podatke in orodja.da lahko podjetja, javne uprave in raziskovalni centri zgradijo lastne platforme umetne inteligence z večjim nadzorom.

To gibanje se uresniči v Nemotron 3, družina odprtih modelov, usmerjenih v večagentno umetno inteligenco Prizadeva si združiti visoko zmogljivost, nizke stroške sklepanja in preglednost. Predlog ni mišljen kot le še en splošni klepetalni robot, temveč kot osnova za uporabo agentov, ki sklepajo, načrtujejo in izvajajo kompleksne naloge v reguliranih sektorjihTo je še posebej pomembno v Evropi in Španiji, kjer sta suverenost podatkov in skladnost s predpisi pomembni.

Odprta družina modelov za agentno in suvereno umetno inteligenco

Nemotron 3 je predstavljen kot celoten ekosistem: modeli, nabori podatkov, knjižnice in recepti za učenje pod odprtimi licencami. Ideja NVIDIA je, da organizacije ne le uporabljajo umetno inteligenco kot nepregledno storitev, temveč lahko pregledajo, kaj je v njej, prilagodijo modele svojim domenam in jih namestijo na lastno infrastrukturo, bodisi v oblaku bodisi v lokalnih podatkovnih centrih.

Podjetje to strategijo uokvirja v svojo zavezo Suverena umetna inteligencaVlade in podjetja v Evropi, Južni Koreji in drugih regijah iščejo odprte alternative zaprtim ali tujim sistemom, ki pogosto niso v skladu z njihovimi zakoni o varstvu podatkov ali zahtevami glede revizije. Nemotron 3 si prizadeva postati tehnična podlaga za gradnjo nacionalnih, sektorskih ali korporativnih modelov z večjo preglednostjo in nadzorom.

Vzporedno, NVIDIA krepi svoj položaj onkraj strojne opremeDo sedaj je bil predvsem ponudnik referenčnih grafičnih procesorjev; z Nemotronom 3 se pozicionira tudi na ravni orodij za modeliranje in usposabljanje, kjer bolj neposredno konkurira igralcem, kot so OpenAI, Google, Anthropic ali celo Meta, in premium modelom, kot je SuperGrok HeavyMeta je v zadnjih generacijah Llame zmanjšala svojo zavezanost odprtokodni programski opremi.

Za evropski raziskovalni in zagonski ekosistem – ki je močno odvisen od odprtih modelov, gostovanih na platformah, kot je Hugging Face – predstavlja razpoložljivost uteži, sintetičnih podatkov in knjižnic pod odprtimi licencami močno alternativo kitajski modeli in Američani, ki prevladujejo na lestvicah priljubljenosti in primerjalnih ocen.

Ekskluzivna vsebina - Kliknite tukaj  Trgovina Microsoft Store se ne odpre ali se nenehno zapira: podrobne rešitve

Hibridna arhitektura MoE: učinkovitost za velike agente

Osrednja tehnična značilnost Nemotrona 3 je Hibridna arhitektura latentne mešanice strokovnjakov (MoE)Namesto da bi se pri vsakem sklepanju aktivirali vsi parametri modela, se vklopi le del njih, podmnožica strokovnjakov, ki so najbolj relevantni za zadevno nalogo ali žeton.

Ta pristop omogoča drastično zmanjša stroške računanja in porabo pomnilnikaTo poveča tudi prepustnost žetonov. Za večagentne arhitekture, kjer si na desetine ali stotine agentov nenehno izmenjujejo sporočila, je ta učinkovitost ključna za preprečevanje, da bi sistem postal nevzdržen glede stroškov grafične kartice in oblaka.

Glede na podatke, ki jih je delila NVIDIA, in neodvisne primerjalne teste, Nemotron 3 Nano dosega do štirikrat več žetonov na sekundo V primerjavi s predhodnikom, Nemotronom 2 Nano, zmanjša generiranje nepotrebnih žetonov sklepanja za približno 60 %. V praksi to pomeni enako ali celo bolj natančne odgovore, vendar z manj "besednosti" in nižjimi stroški na poizvedbo.

Hibridna arhitektura ministrstva za izobraževanje je v kombinaciji s specifičnimi tehnikami usposabljanja privedla do Mnogi najnaprednejši odprti modeli uporabljajo ekspertne shemeNemotron 3 se pridružuje temu trendu, vendar se osredotoča posebej na agentno umetno inteligenco: notranje poti, zasnovane za koordinacijo med agenti, uporabo orodij, obvladovanje dolgih stanj in postopno načrtovanje.

Tri velikosti: Nano, Super in Ultra za različne delovne obremenitve

Arhitektura modela Nemotron 3

Družina Nemotron 3 je organizirana v tri glavne velikosti modela MoE, vsi so odprti in z zmanjšanimi aktivnimi parametri zaradi strokovne arhitekture:

  • Nemotron 3 Nano: približno 30.000 milijard parametrov skupaj, s približno 3.000 milijard sredstev na žetonZasnovan je za ciljno usmerjene naloge, kjer je učinkovitost pomembna: odpravljanje napak v programski opremi, povzemanje dokumentov, iskanje informacij, spremljanje sistema ali specializirani pomočniki umetne inteligence.
  • Nemotron 3 Superpribližno 100.000 milijard parametrov, z 10.000 milijard premoženja na vsakem koraku. Usmerjen je k Napredno sklepanje v večagentnih arhitekturahz nizko latenco, tudi ko več agentov sodeluje pri reševanju kompleksnih tokov.
  • Nemotron 3 Ultra: zgornja raven, s približno 500.000 milijardami parametrov in do 50.000 milijard sredstev na žetonDeluje kot zmogljiv mehanizem sklepanja za raziskave, strateško načrtovanje, podporo odločanju na visoki ravni in še posebej zahtevne sisteme umetne inteligence.

V praksi to organizacijam omogoča Izberite velikost modela glede na vaš proračun in zahteveNano za ogromne, intenzivne delovne obremenitve in nizke stroške; Super, kadar je potrebna večja globina sklepanja s številnimi sodelujočimi agenti; in Ultra za primere, ko kakovost in dolg kontekst odtehtata stroške grafičnega procesorja.

Ekskluzivna vsebina - Kliknite tukaj  TAG Heuer Connected Calibre E5: preskok k lastniški programski opremi in izdaji New Balance

Za zdaj Za takojšnjo uporabo je na voljo samo Nemotron 3 Nano.Različici Super in Ultra sta načrtovani za prvo polovico leta 2026, kar bo evropskim podjetjem in laboratorijem dalo čas, da najprej eksperimentirajo z Nano, vzpostavijo cevovode in kasneje migrirajo ohišja, ki zahtevajo večjo zmogljivost.

Nemotron 3 Nano: okno za 1 milijon žetonov in omejeni stroški

Nemotron 3 Nano

Nemotron 3 Nano je od danes naprej praktični vodja družineNVIDIA ga opisuje kot računalniško najbolj stroškovno učinkovit model v ponudbi, optimiziran za zagotavljanje maksimalne zmogljivosti v večagentnih delovnih procesih in intenzivnih, a ponavljajočih se nalogah.

Med njegovimi tehničnimi lastnostmi izstopajo naslednje: kontekstno okno do enega milijona žetonovTo omogoča shranjevanje pomnilnika za obsežne dokumente, celotne repozitorije kode ali večstopenjske poslovne procese. Za evropske aplikacije v bančništvu, zdravstvu ali javni upravi, kjer so zapisi lahko obsežni, je ta dolgoročna kontekstna zmogljivost še posebej dragocena.

Merila neodvisne organizacije Umetna analiza uvršča Nemotron 3 Nano med najbolj uravnotežene odprtokodne modele Združuje inteligenco, natančnost in hitrost s pretočnostjo v stotinah žetonov na sekundo. Zaradi te kombinacije je privlačen za integratorje umetne inteligence in ponudnike storitev v Španiji, ki potrebujejo dobro uporabniško izkušnjo brez vrtoglavih stroškov infrastrukture.

Kar zadeva primere uporabe, NVIDIA cilja na Nano. Povzetek vsebine, odpravljanje napak v programski opremi, iskanje informacij in pomočniki za umetno inteligenco v podjetjihZahvaljujoč zmanjšanju odvečnih žetonov sklepanja je mogoče zagnati agente, ki vzdržujejo dolge pogovore z uporabniki ali sistemi, ne da bi se stroški sklepanja močno povečali.

Odprti podatki in knjižnice: NeMo Gym, NeMo RL in Evaluator

Knjižnice NeMo

Ena najbolj značilnih značilnosti Nemotrona 3 je, da Ni omejeno na objavo uteži modelaNVIDIA družino spremlja s celovito zbirko odprtih virov za usposabljanje, uglaševanje in ocenjevanje agentov.

Po eni strani omogoča dostop do sintetičnega korpusa več bilijonov žetonov podatkov pred usposabljanjem, po usposabljanju in okrepitveTi nabori podatkov, osredotočeni na sklepanje, kodiranje in večstopenjske delovne procese, omogočajo podjetjem in raziskovalnim centrom, da ustvarijo lastne različice Nemotrona, specifične za določeno področje (npr. pravno, zdravstveno ali industrijsko), ne da bi morali začeti iz nič.

Med temi viri izstopajo naslednji: Nabor podatkov o varnosti agentov NemotronZbira telemetrične podatke o vedenju agentov v resničnih scenarijih. Njegov cilj je pomagati ekipam pri merjenju in krepitvi varnosti kompleksnih avtonomnih sistemov: od dejanj, ki jih agent izvede, ko naleti na občutljive podatke, do tega, kako se odzove na dvoumne ali potencialno škodljive ukaze.

Ekskluzivna vsebina - Kliknite tukaj  Najnovejše funkcije, ki prihajajo v sistem Windows 11: umetna inteligenca in novi načini upravljanja računalnika

Kar zadeva razdelek z orodji, NVIDIA začenja NeMo Gym in NeMo RL kot odprtokodni knjižnici za usposabljanje z okrepitvami in po usposabljanju, skupaj z NeMo Evaluatorjem za ocenjevanje varnosti in delovanja. Te knjižnice zagotavljajo simulacijska okolja in cevovode, ki so pripravljena za uporabo, z družino Nemotron, vendar jih je mogoče razširiti tudi na druge modele.

Vse to gradivo – uteži, nabori podatkov in koda – se distribuira prek GitHub in Hugging Face sta licencirana pod licenco NVIDIA Open Model.da ga lahko evropske ekipe brezhibno integrirajo v svoje lastne MLO-e. Podjetja, kot sta Prime Intellect in Unsloth, že vključujejo NeMo Gym neposredno v svoje delovne procese, da bi poenostavila učenje z okrepitvijo na Nemotronu.

Razpoložljivost v javnih oblakih in evropski ekosistem

Nemotron 3 Nano objemni obraz

Nemotron 3 Nano je zdaj na voljo na Objemni obraz y GitHubkot tudi prek ponudnikov sklepanja, kot so Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter in Together AI. To razvojnim ekipam v Španiji odpira vrata, da model preizkusijo prek API-ja ali ga brez pretirane kompleksnosti uvedejo v lastno infrastrukturo.

Na oblačni fronti, Nemotron 3 Nano se pridružuje AWS prek Amazon Bedrock za sklepanje brez strežnika in napovedal podporo za Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale in Yotta. Za evropske organizacije, ki že delajo na teh platformah, to olajša uvedbo Nemotrona brez drastičnih sprememb njihove arhitekture.

Poleg javnega oblaka NVIDIA promovira uporabo Nemotrona 3 Nano kot Mikrostoritev NIM, ki jo je mogoče namestiti na katero koli infrastrukturo, pospešeno z NVIDIATo omogoča hibridne scenarije: del obremenitve v mednarodnih oblakih in del v lokalnih podatkovnih centrih ali v evropskih oblakih, ki dajejo prednost lokaciji podatkov v EU.

Različice Nemotron 3 Super in Ultra, usmerjeni v ekstremne delovne obremenitve sklepanja in obsežne večagentne sisteme, so načrtovano za prvo polovico leta 2026Ta časovnica evropskemu raziskovalnemu in poslovnemu ekosistemu omogoča čas za eksperimentiranje z Nano, potrjevanje primerov uporabe in oblikovanje strategij migracije na večje modele, kadar je to potrebno.

Nemotron 3 postavlja NVIDIA med vodilne ponudnike vrhunski odprti modeli, usmerjeni v agentno umetno inteligencoS predlogom, ki združuje tehnično učinkovitost (hibridni MoE, NVFP4, masiven kontekst), odprtost (uteži, nabori podatkov in razpoložljive knjižnice) in jasen poudarek na suverenosti in preglednosti podatkov, vidikih, ki so še posebej občutljivi v Španiji in preostali Evropi, kjer sta regulacija in pritisk za revidiranje umetne inteligence vse večji.

Microsoft Discovery IA-2
Povezani članek:
Microsoft Discovery AI s personalizirano umetno inteligenco spodbuja znanstvene in izobraževalne preboje