- Nemotron 3 je otvorena porodica modela, podataka i biblioteka fokusiranih na agentsku umjetnu inteligenciju i multi-agentske sisteme.
- Uključuje tri MoE veličine (Nano, Super i Ultra) sa hibridnom arhitekturom i efikasnim 4-bitnim obučavanjem na NVIDIA Blackwell platformi.
- Nemotron 3 Nano je sada dostupan u Evropi putem Hugging Face-a, javnih oblaka i kao NIM mikroservis, sa prozorom od milion tokena.
- Ekosistem je upotpunjen ogromnim skupovima podataka, NeMo Gym-om, NeMo RL-om i Evaluatorom za obuku, podešavanje i reviziju suverenih AI agenata.
Trka za vještačkom inteligencijom seli se od jednostavnih, izolovanih chatbotova do agentskih sistema koji međusobno sarađuju, upravljaju dugim radnim procesima i moraju biti podložni reviziji. U ovom novom scenariju, NVIDIA se odlučila na prilično jasan korak: otvoriti ne samo modele, već i podatke i alatekako bi kompanije, javne uprave i istraživački centri mogli izgraditi vlastite AI platforme s većom kontrolom.
Taj pokret se materijalizuje u Nemotron 3, porodica otvorenih modela usmjerenih ka multi-agentskoj umjetnoj inteligenciji Nastoji kombinirati visoke performanse, niske troškove zaključivanja i transparentnost. Prijedlog nije zamišljen kao još jedan chatbot opće namjene, već kao baza na kojoj se mogu rasporediti agenti koji razmišljaju, planiraju i izvršavaju složene zadatke u reguliranim sektorimaOvo je posebno relevantno u Evropi i Španiji, gdje su suverenitet podataka i usklađenost s propisima važni.
Otvorena porodica modela za agentnu i suverenu vještačku inteligenciju
Nemotron 3 je predstavljen kao kompletan ekosistem: modeli, skupovi podataka, biblioteke i recepti za obuku pod otvorenim licencama. Ideja kompanije NVIDIA je da organizacije ne samo da koriste AI kao neprozirnu uslugu, već mogu i pregledati šta je unutra, prilagoditi modele svojim domenima i implementirati ih na vlastitu infrastrukturu, bilo u oblaku ili u lokalnim podatkovnim centrima.
Kompanija uokviruje ovu strategiju u okviru svoje posvećenosti Sovereign AIVlade i kompanije u Evropi, Južnoj Koreji i drugim regijama traže otvorene alternative zatvorenim ili stranim sistemima, koji često nisu u skladu s njihovim zakonima o zaštiti podataka ili zahtjevima za reviziju. Nemotron 3 ima za cilj da bude tehnička osnova na kojoj će se graditi nacionalni, sektorski ili korporativni modeli s većom vidljivošću i kontrolom.
Paralelno, NVIDIA jača svoju poziciju izvan hardveraDo sada je prvenstveno bio dobavljač referentnih GPU-ova; s Nemotronom 3, pozicionira se i u sloju alata za modeliranje i obuku, direktnije se takmičeći s igračima poput OpenAI-a, Googlea, Anthropica ili čak Mete, te protiv premium modela poput... SuperGrok HeavyMeta je smanjila svoju posvećenost otvorenom kodu u posljednjim generacijama Llame.
Za evropski istraživački i startup ekosistem – koji se u velikoj mjeri oslanja na otvorene modele hostovane na platformama poput Hugging Face – dostupnost težina, sintetičkih podataka i biblioteka pod otvorenim licencama predstavlja snažnu alternativu… kineski modeli i Amerikanci koji dominiraju rangiranjem popularnosti i referentnim vrijednostima.
Hibridna MoE arhitektura: efikasnost za velike agente
Centralna tehnička karakteristika Nemotrona 3 je... Hibridna arhitektura latentne mješavine stručnjaka (MoE)Umjesto aktiviranja svih parametara modela u svakom zaključivanju, uključuje se samo dio njih, podskup stručnjaka najrelevantnijih za dotični zadatak ili token.
Ovaj pristup omogućava drastično smanjuju troškove računanja i potrošnju memorijeOvo također povećava propusnost tokena. Za multi-agentske arhitekture, gdje desetine ili stotine agenata kontinuirano razmjenjuju poruke, ova efikasnost je ključna za sprječavanje da sistem postane neodrživ u smislu troškova GPU-a i clouda.
Prema podacima koje je podijelila NVIDIA i nezavisnim testovima, Nemotron 3 Nano postiže do četiri puta više tokena u sekundi U poređenju sa svojim prethodnikom, Nemotron 2 Nano, smanjuje generisanje nepotrebnih tokena za zaključivanje za oko 60%. U praksi, to znači jednako ili čak i tačnije odgovore, ali sa manje "opširnosti" i nižom cijenom po upitu.
Hibridna arhitektura Ministarstva obrazovanja, u kombinaciji sa specifičnim tehnikama obuke, dovela je do Mnogi od najnaprednijih otvorenih modela usvajaju ekspertne shemeNemotron 3 se pridružuje ovom trendu, ali se posebno fokusira na agentsku umjetnu inteligenciju: interne rute dizajnirane za koordinaciju između agenata, korištenje alata, rukovanje dugim stanjima i planiranje korak po korak.
Tri veličine: Nano, Super i Ultra za različita radna opterećenja

Porodica Nemotron 3 je organizovana u Tri glavne veličine MoE modela, svi su otvoreni i sa smanjenim aktivnim parametrima zahvaljujući stručnoj arhitekturi:
- Nemotron 3 Nanooko 30.000 milijardi ukupnih parametara, sa otprilike 3.000 milijardi imovine po tokenuDizajniran je za ciljane zadatke gdje je efikasnost bitna: otklanjanje grešaka u softveru, sažimanje dokumenata, pronalaženje informacija, praćenje sistema ili specijalizirani AI asistenti.
- Nemotron 3 Superpribližno 100.000 milijardi parametara, sa 10.000 milijardi imovine na svakom koraku. Usmjeren je na Napredno zaključivanje u multiagentskim arhitekturamasa niskom latencijom čak i kada više agenata sarađuje u rješavanju složenih tokova.
- Nemotron 3 Ultra: gornji nivo, sa približno 500.000 milijardi parametara i do 50.000 milijardi imovine po tokenuFunkcioniše kao moćan mehanizam za rasuđivanje u istraživanju, strateškom planiranju, podršci odlučivanju na visokom nivou i posebno zahtjevnim sistemima umjetne inteligencije.
U praksi, ovo omogućava organizacijama Odaberite veličinu modela prema vašem budžetu i zahtjevimaNano za ogromna, intenzivna opterećenja i niske troškove; Super kada je potrebna veća dubina rezonovanja s mnogo saradničkih agenata; i Ultra za slučajeve gdje kvalitet i dugi kontekst nadmašuju cijenu GPU-a.
Za sada Samo Nemotron 3 Nano je dostupan za trenutnu upotrebu.Super i Ultra varijante planirane su za prvu polovinu 2026. godine, što će evropskim kompanijama i laboratorijama dati vremena da prvo eksperimentišu sa Nano tehnologijom, uspostave cjevovode, a kasnije i da migriraju kućišta koja zahtijevaju veći kapacitet.
Nemotron 3 Nano: Prozor od 1 milion tokena i ograničeni troškovi

Nemotron 3 Nano je, od danas, praktični predvodnik porodiceNVIDIA ga opisuje kao računarski najisplativiji model u ponudi, optimizovan za pružanje maksimalnih performansi u višeagentnim radnim procesima i intenzivnim, ali repetitivnim zadacima.
Među njegovim tehničkim karakteristikama ističu se sljedeće: kontekstni prozor do milion tokenaOvo omogućava zadržavanje memorije za opsežne dokumente, cijele repozitorije koda ili višestepene poslovne procese. Za evropske primjene u bankarstvu, zdravstvu ili javnoj upravi, gdje zapisi mogu biti obimni, ova dugoročna kontekstualna sposobnost je posebno vrijedna.
Mjerila nezavisne organizacije Vještačka analiza svrstava Nemotron 3 Nano među najuravnoteženije modele otvorenog koda. Kombinuje inteligenciju, tačnost i brzinu, sa propusnošću od stotina tokena u sekundi. Ova kombinacija ga čini atraktivnim za integratore vještačke inteligencije i pružaoce usluga u Španiji kojima je potrebno dobro korisničko iskustvo bez vrtoglavih troškova infrastrukture.
Što se tiče slučajeva upotrebe, NVIDIA cilja na Nano. Sažetak sadržaja, otklanjanje grešaka u softveru, pronalaženje informacija i pomoćnici za umjetnu inteligenciju u preduzećimaZahvaljujući smanjenju redundantnih tokena za zaključivanje, moguće je pokretati agente koji održavaju duge razgovore s korisnicima ili sistemima bez naglog povećanja troškova zaključivanja.
Otvoreni podaci i biblioteke: NeMo Gym, NeMo RL i Evaluator

Jedna od najizrazitijih karakteristika Nemotrona 3 je to što Nije ograničeno samo na objavljivanje težina modelaNVIDIA prati porodicu sa sveobuhvatnim paketom otvorenih resursa za obuku, podešavanje i evaluaciju agenata.
S jedne strane, on omogućava pristup sintetičkom korpusu nekoliko triliona tokena podataka prije obuke, nakon obuke i pojačanjaOvi skupovi podataka, fokusirani na zaključivanje, kodiranje i višekoračne tokove rada, omogućavaju kompanijama i istraživačkim centrima da generiraju vlastite varijante Nemotrona specifične za određenu domenu (npr. pravnu, zdravstvenu ili industrijsku) bez počinjanja od nule.
Među ovim resursima, ističu se sljedeći: Nemotron Agent Safety skup podatakaPrikuplja telemetrijske podatke o ponašanju agenata u stvarnim scenarijima. Njegov cilj je pomoći timovima da mjere i ojačaju sigurnost složenih autonomnih sistema: od radnji koje agent preduzima kada naiđe na osjetljive podatke, do toga kako reaguje na dvosmislene ili potencijalno štetne komande.
Što se tiče sekcije alata, NVIDIA pokreće NeMo Gym i NeMo RL kao biblioteke otvorenog koda za obuku pojačanja i naknadnu obuku, zajedno s NeMo Evaluatorom za procjenu sigurnosti i performansi. Ove biblioteke pružaju simulacijska okruženja i cjevovode spremna za upotrebu s Nemotron porodicom, ali se mogu proširiti i na druge modele.
Sav ovaj materijal - težine, skupovi podataka i kod - distribuira se putem GitHub i Hugging Face su licencirani pod NVIDIA Open Model licencom.tako da evropski timovi mogu besprijekorno integrirati NeMo Gym u vlastite MLO-ove. Kompanije poput Prime Intellect i Unsloth već uključuju NeMo Gym direktno u svoje radne procese kako bi pojednostavile učenje s potkrepljenjem na Nemotronu.
Dostupnost u javnim oblacima i evropskom ekosistemu

Nemotron 3 Nano je sada dostupan na Zagrljeno lice y GitHubkao i putem provajdera inferencije kao što su Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI. Ovo otvara vrata razvojnim timovima u Španiji da testiraju model putem API-ja ili ga implementiraju na vlastitoj infrastrukturi bez pretjerane složenosti.
Na oblačnom frontu, Nemotron 3 Nano se pridružuje AWS-u putem Amazon Bedrocka za serverless inferenciju i najavio je podršku za Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta. Za evropske organizacije koje već rade na ovim platformama, ovo olakšava usvajanje Nemotrona bez drastičnih promjena u njihovoj arhitekturi.
Pored javnog oblaka, NVIDIA promoviše upotrebu Nemotron 3 Nano kao NIM mikroservis se može primijeniti na bilo kojoj infrastrukturi ubrzanoj od strane NVIDIA tehnologijeOvo omogućava hibridne scenarije: dio opterećenja u međunarodnim oblacima, a dio u lokalnim podatkovnim centrima ili u evropskim oblacima koji daju prioritet boravištu podataka u EU.
Verzije Nemotron 3 Super i Ultra, usmjereni na ekstremna radna opterećenja zaključivanja i velike multiagentske sisteme, su planirano za prvu polovinu 2026.Ovaj vremenski okvir omogućava evropskom istraživačkom i poslovnom ekosistemu vrijeme za eksperimentiranje s Nano tehnologijom, validaciju slučajeva upotrebe i dizajniranje strategija migracije na veće modele kada je to potrebno.
Nemotron 3 pozicionira NVIDIA kao jednog od vodećih dobavljača vrhunski otvoreni modeli usmjereni na agentsku umjetnu inteligencijuS prijedlogom koji spaja tehničku efikasnost (hibridni MoE, NVFP4, masivni kontekst), otvorenost (težine, skupovi podataka i dostupne biblioteke) i jasan fokus na suverenitet i transparentnost podataka, aspekte koji su posebno osjetljivi u Španiji i ostatku Evrope, gdje su regulacija i pritisak za reviziju umjetne inteligencije sve veći.
Ja sam tehnološki entuzijasta koji je svoja "geek" interesovanja pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći najsavremeniju tehnologiju i petljajući po svim vrstama programa iz čiste radoznalosti. Sada sam se specijalizirao za kompjutersku tehnologiju i video igrice. To je zato što više od 5 godina pišem za razne web stranice o tehnologiji i video igricama, stvarajući članke koji nastoje dati vam potrebne informacije na jeziku koji je svima razumljiv.
Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog za Windows operativni sistem kao i Android za mobilne telefone. I moja posvećenost je vama, uvijek sam spreman potrošiti nekoliko minuta i pomoći vam da riješite sva pitanja koja imate u ovom svijetu interneta.
