- Nemotron 3 je otvorena obitelj modela, podataka i biblioteka usmjerenih na agentsku umjetnu inteligenciju i višeagentske sustave.
- Uključuje tri MoE veličine (Nano, Super i Ultra) s hibridnom arhitekturom i učinkovitim 4-bitnim treningom na NVIDIA Blackwellu.
- Nemotron 3 Nano sada je dostupan u Europi putem Hugging Facea, javnih oblaka i kao NIM mikroservis, s prozorom od milijun tokena.
- Ekosustav je upotpunjen masivnim skupovima podataka, NeMo Gymom, NeMo RL-om i Evaluatorom za obuku, podešavanje i reviziju suverenih AI agenata.
Utrka za umjetnu inteligenciju seli se od jednostavnih, izoliranih chatbotova do agentskih sustava koji surađuju jedni s drugima, upravljaju dugim tijekovima rada i moraju biti podložni reviziji. U ovom novom scenariju, NVIDIA se odlučila za prilično jasan korak: otvoriti ne samo modele, već i podatke i alatekako bi tvrtke, javne uprave i istraživački centri mogli izgraditi vlastite AI platforme s većom kontrolom.
Taj pokret se materijalizira u Nemotron 3, obitelj otvorenih modela usmjerenih prema višeagentnoj umjetnoj inteligenciji Nastoji kombinirati visoke performanse, niske troškove zaključivanja i transparentnost. Prijedlog nije zamišljen kao još jedan chatbot opće namjene, već kao baza na kojoj se mogu rasporediti agenti koji razmišljaju, planiraju i izvršavaju složene zadatke u reguliranim sektorimaTo je posebno važno u Europi i Španjolskoj, gdje su suverenitet podataka i usklađenost s propisima važni.
Otvorena obitelj modela za agentnu i suverenu umjetnu inteligenciju
Nemotron 3 je predstavljen kao kompletan ekosustav: modeli, skupovi podataka, biblioteke i recepti za obuku pod otvorenim licencama. NVIDIA-ina ideja je da organizacije ne samo da koriste umjetnu inteligenciju kao neprozirnu uslugu, već mogu pregledati što je unutra, prilagoditi modele svojim domenama i implementirati ih na vlastitu infrastrukturu, bilo u oblaku ili u lokalnim podatkovnim centrima.
Tvrtka ovu strategiju uokviruje u svoju predanost Suvereni AIVlade i tvrtke u Europi, Južnoj Koreji i drugim regijama traže otvorene alternative zatvorenim ili stranim sustavima, koji često nisu u skladu s njihovim zakonima o zaštiti podataka ili zahtjevima za reviziju. Nemotron 3 ima za cilj biti tehnička osnova na kojoj će se graditi nacionalni, sektorski ili korporativni modeli s većom vidljivošću i kontrolom.
Paralelno, NVIDIA jača svoju poziciju izvan hardveraDo sada je prvenstveno bio dobavljač referentnih GPU-ova; s Nemotronom 3 pozicionira se i u sloju alata za modeliranje i obuku, izravnije se natječući s igračima poput OpenAI-a, Googlea, Anthropica ili čak Mete, te protiv premium modela poput SuperGrok HeavyMeta je smanjila svoju predanost otvorenom kodu u posljednjim generacijama Llame.
Za europski istraživački i startup ekosustav – koji se uvelike oslanja na otvorene modele smještene na platformama poput Hugging Facea – dostupnost težina, sintetičkih podataka i biblioteka pod otvorenim licencama predstavlja snažnu alternativu kineski modeli i Amerikanci koji dominiraju ljestvicama popularnosti i referentnim vrijednostima.
Hibridna MoE arhitektura: učinkovitost za velike agente
Središnja tehnička značajka Nemotrona 3 je... Hibridna arhitektura latentne mješavine stručnjaka (MoE)Umjesto aktiviranja svih parametara modela u svakom zaključivanju, uključuje se samo njihov dio, podskup stručnjaka najrelevantnijih za dotični zadatak ili token.
Ovaj pristup omogućuje drastično smanjiti računalne troškove i potrošnju memorijeTo također povećava propusnost tokena. Za arhitekture s više agenata, gdje deseci ili stotine agenata kontinuirano razmjenjuju poruke, ova učinkovitost je ključna za sprječavanje da sustav postane neodrživ u smislu troškova GPU-a i oblaka.
Prema podacima koje je podijelila NVIDIA i neovisnim testovima, Nemotron 3 Nano postiže do četiri puta više tokena u sekundi U usporedbi s prethodnikom, Nemotronom 2 Nano, smanjuje generiranje nepotrebnih tokena za zaključivanje za oko 60%. U praksi to znači jednako ili čak točnije odgovore, ali s manje "opširnosti" i nižom cijenom po upitu.
Hibridna arhitektura Ministarstva obrazovanja, u kombinaciji sa specifičnim tehnikama obuke, dovela je do Mnogi od najnaprednijih otvorenih modela usvajaju ekspertne shemeNemotron 3 pridružuje se ovom trendu, ali se posebno fokusira na agentsku umjetnu inteligenciju: interne rute dizajnirane za koordinaciju između agenata, korištenje alata, rukovanje dugim stanjima i postupno planiranje.
Tri veličine: Nano, Super i Ultra za različita radna opterećenja

Obitelj Nemotron 3 organizirana je u tri glavne veličine MoE modela, svi su otvoreni i sa smanjenim aktivnim parametrima zahvaljujući stručnoj arhitekturi:
- Nemotron 3 Nanooko 30.000 milijardi ukupnih parametara, s otprilike 3.000 milijardi imovine po tokenuDizajniran je za ciljane zadatke gdje je učinkovitost važna: otklanjanje pogrešaka u softveru, sažimanje dokumenata, pronalaženje informacija, nadzor sustava ili specijalizirani AI asistenti.
- Nemotron 3 Superpribližno 100.000 milijardi parametara, s 10.000 milijardi imovine na svakom koraku. Usmjeren je prema Napredno zaključivanje u višeagentnim arhitekturamas niskom latencijom čak i kada više agenata surađuje u rješavanju složenih tokova.
- Nemotron 3 Ultra: gornja razina, s otprilike 500.000 milijardi parametara i do 50.000 milijardi imovine po tokenuDjeluje kao snažan mehanizam za rasuđivanje za istraživanje, strateško planiranje, podršku odlučivanju na visokoj razini i posebno zahtjevne AI sustave.
U praksi, to omogućuje organizacijama Odaberite veličinu modela prema svom budžetu i zahtjevimaNano za masovna, intenzivna opterećenja i niske troškove; Super kada je potrebna veća dubina rezoniranja s mnogo suradničkih agenata; i Ultra za slučajeve gdje kvaliteta i dugi kontekst nadmašuju cijenu GPU-a.
Zasad Samo Nemotron 3 Nano je dostupan za trenutnu upotrebu.Super i Ultra varijante planirane su za prvu polovicu 2026., što će europskim tvrtkama i laboratorijima dati vremena da prvo eksperimentiraju s Nano tehnologijom, uspostave cjevovode, a kasnije i migriraju kućišta koja zahtijevaju veći kapacitet.
Nemotron 3 Nano: prozor od 1 milijun tokena i ograničeni troškovi

Nemotron 3 Nano je, od danas, praktični predvodnik obiteljiNVIDIA ga opisuje kao računalno najisplativiji model u ponudi, optimiziran za maksimalne performanse u višeagentnim tijekovima rada i intenzivnim, ali repetitivnim zadacima.
Među njegovim tehničkim značajkama ističu se sljedeće: kontekstni prozor do milijun tokenaTo omogućuje zadržavanje memorije za opsežne dokumente, cijele repozitorije koda ili višekoračne poslovne procese. Za europske primjene u bankarstvu, zdravstvu ili javnoj upravi, gdje zapisi mogu biti opsežni, ova dugoročna kontekstualna sposobnost je posebno vrijedna.
Mjerila neovisne organizacije Umjetna analiza smješta Nemotron 3 Nano kao jedan od najuravnoteženijih modela otvorenog koda. Kombinira inteligenciju, točnost i brzinu, s propusnošću od stotina tokena u sekundi. Ova kombinacija čini ga privlačnim integratorima umjetne inteligencije i pružateljima usluga u Španjolskoj kojima je potrebno dobro korisničko iskustvo bez vrtoglavih troškova infrastrukture.
Što se tiče slučajeva upotrebe, NVIDIA cilja na Nano. Sažetak sadržaja, otklanjanje pogrešaka u softveru, pronalaženje informacija i pomoćnici za umjetnu inteligenciju u poduzećuZahvaljujući smanjenju redundantnih tokena za zaključivanje, moguće je pokretati agente koji održavaju duge razgovore s korisnicima ili sustavima bez naglog porasta troškova zaključivanja.
Otvoreni podaci i knjižnice: NeMo Gym, NeMo RL i Evaluator

Jedna od najizrazitijih karakteristika Nemotrona 3 je ta što Nije ograničeno samo na objavljivanje težina modelaNVIDIA prati obitelj s opsežnim paketom otvorenih resursa za obuku, podešavanje i evaluaciju agenata.
S jedne strane, omogućuje pristup sintetičkom korpusu nekoliko bilijuna tokena podataka prije obuke, nakon obuke i pojačanjaOvi skupovi podataka, usmjereni na zaključivanje, kodiranje i višekoračne tijekove rada, omogućuju tvrtkama i istraživačkim centrima generiranje vlastitih varijanti Nemotrona specifičnih za određenu domenu (npr. pravnu, zdravstvenu ili industrijsku) bez početka od nule.
Među tim resursima ističu se sljedeći: Nemotron Agent Safety skup podatakaPrikuplja telemetrijske podatke o ponašanju agenata u stvarnim scenarijima. Cilj mu je pomoći timovima u mjerenju i jačanju sigurnosti složenih autonomnih sustava: od radnji koje agent poduzima kada naiđe na osjetljive podatke do toga kako reagira na dvosmislene ili potencijalno štetne naredbe.
Što se tiče odjeljka s alatima, NVIDIA pokreće NeMo Gym i NeMo RL kao biblioteke otvorenog koda za obuku pojačanja i naknadnu obuku, zajedno s NeMo Evaluatorom za procjenu sigurnosti i performansi. Ove biblioteke pružaju simulacijska okruženja i cjevovode spremne za upotrebu s Nemotron obitelji, ali se mogu proširiti i na druge modele.
Sav ovaj materijal - težine, skupovi podataka i kod - distribuira se putem GitHub i Hugging Face licencirani su pod NVIDIA Open Model licencom.tako da ga europski timovi mogu besprijekorno integrirati u vlastite MLO-ove. Tvrtke poput Prime Intellecta i Unslotha već uključuju NeMo Gym izravno u svoje tijekove rada kako bi pojednostavile učenje s potkrepljenjem na Nemotronu.
Dostupnost u javnim oblacima i europskom ekosustavu

Nemotron 3 Nano je sada dostupan na Zagrljeno lice y GitHubkao i putem pružatelja inferencije kao što su Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI. To otvara vrata razvojnim timovima u Španjolskoj da testiraju model putem API-ja ili ga implementiraju na vlastitoj infrastrukturi bez pretjerane složenosti.
Na oblačnoj fronti, Nemotron 3 Nano se pridružuje AWS-u putem Amazon Bedrocka za zaključivanje bez poslužitelja i najavio je podršku za Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta. Za europske organizacije koje već rade na tim platformama, ovo olakšava usvajanje Nemotrona bez drastičnih promjena u njihovoj arhitekturi.
Uz javni oblak, NVIDIA promovira korištenje Nemotrona 3 Nano kao NIM mikroservis koji se može primijeniti na bilo koju infrastrukturu s NVIDIA ubrzanjemTo omogućuje hibridne scenarije: dio opterećenja u međunarodnim oblacima, a dio u lokalnim podatkovnim centrima ili u europskim oblacima koji daju prioritet boravištu podataka u EU.
Inačice Nemotron 3 Super i Ultra, usmjereni na ekstremna radna opterećenja zaključivanja i velike višeagentske sustave, su planirano za prvu polovicu 2026.Ovaj vremenski okvir omogućuje europskom istraživačkom i poslovnom ekosustavu vrijeme za eksperimentiranje s Nano tehnologijom, validaciju slučajeva upotrebe i dizajniranje strategija migracije na veće modele kada je to potrebno.
Nemotron 3 pozicionira NVIDIA-u kao jednog od vodećih dobavljača vrhunski otvoreni modeli usmjereni prema agentskoj umjetnoj inteligencijiS prijedlogom koji spaja tehničku učinkovitost (hibridni MoE, NVFP4, masivni kontekst), otvorenost (težine, skupovi podataka i dostupne biblioteke) i jasan fokus na suverenitet i transparentnost podataka, aspekte koji su posebno osjetljivi u Španjolskoj i ostatku Europe, gdje su regulacija i pritisak na reviziju umjetne inteligencije sve veći.
Ja sam tehnološki entuzijast koji je svoje "geek" interese pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći vrhunsku tehnologiju i petljajući sa svim vrstama programa iz čiste znatiželje. Sada sam se specijalizirao za računalne tehnologije i video igre. To je zato što sam više od 5 godina pisao za razne web stranice o tehnologiji i videoigrama, stvarajući članke koji vam nastoje dati informacije koje su vam potrebne na jeziku koji je svima razumljiv.
Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog uz Windows operativni sustav kao i Android za mobitele. I moja je posvećenost vama, uvijek sam spreman odvojiti nekoliko minuta i pomoći vam riješiti sva pitanja koja imate u ovom internetskom svijetu.
