Nemotron 3: NVIDIA-in veliki otvoreni ulog za multi-agentsku umjetnu inteligenciju

Posljednje ažuriranje: 17/12/2025

  • Nemotron 3 je otvorena porodica modela, podataka i biblioteka fokusiranih na agentsku umjetnu inteligenciju i multi-agentske sisteme.
  • Uključuje tri MoE veličine (Nano, Super i Ultra) sa hibridnom arhitekturom i efikasnim 4-bitnim obučavanjem na NVIDIA Blackwell platformi.
  • Nemotron 3 Nano je sada dostupan u Evropi putem Hugging Face-a, javnih oblaka i kao NIM mikroservis, sa prozorom od milion tokena.
  • Ekosistem je upotpunjen ogromnim skupovima podataka, NeMo Gym-om, NeMo RL-om i Evaluatorom za obuku, podešavanje i reviziju suverenih AI agenata.

Model umjetne inteligencije Nemotron 3

Trka za vještačkom inteligencijom seli se od jednostavnih, izolovanih chatbotova do agentskih sistema koji međusobno sarađuju, upravljaju dugim radnim procesima i moraju biti podložni reviziji. U ovom novom scenariju, NVIDIA se odlučila na prilično jasan korak: otvoriti ne samo modele, već i podatke i alatekako bi kompanije, javne uprave i istraživački centri mogli izgraditi vlastite AI platforme s većom kontrolom.

Taj pokret se materijalizuje u Nemotron 3, porodica otvorenih modela usmjerenih ka multi-agentskoj umjetnoj inteligenciji Nastoji kombinirati visoke performanse, niske troškove zaključivanja i transparentnost. Prijedlog nije zamišljen kao još jedan chatbot opće namjene, već kao baza na kojoj se mogu rasporediti agenti koji razmišljaju, planiraju i izvršavaju složene zadatke u reguliranim sektorimaOvo je posebno relevantno u Evropi i Španiji, gdje su suverenitet podataka i usklađenost s propisima važni.

Otvorena porodica modela za agentnu i suverenu vještačku inteligenciju

Nemotron 3 je predstavljen kao kompletan ekosistem: modeli, skupovi podataka, biblioteke i recepti za obuku pod otvorenim licencama. Ideja kompanije NVIDIA je da organizacije ne samo da koriste AI kao neprozirnu uslugu, već mogu i pregledati šta je unutra, prilagoditi modele svojim domenima i implementirati ih na vlastitu infrastrukturu, bilo u oblaku ili u lokalnim podatkovnim centrima.

Kompanija uokviruje ovu strategiju u okviru svoje posvećenosti Sovereign AIVlade i kompanije u Evropi, Južnoj Koreji i drugim regijama traže otvorene alternative zatvorenim ili stranim sistemima, koji često nisu u skladu s njihovim zakonima o zaštiti podataka ili zahtjevima za reviziju. Nemotron 3 ima za cilj da bude tehnička osnova na kojoj će se graditi nacionalni, sektorski ili korporativni modeli s većom vidljivošću i kontrolom.

Paralelno, NVIDIA jača svoju poziciju izvan hardveraDo sada je prvenstveno bio dobavljač referentnih GPU-ova; s Nemotronom 3, pozicionira se i u sloju alata za modeliranje i obuku, direktnije se takmičeći s igračima poput OpenAI-a, Googlea, Anthropica ili čak Mete, te protiv premium modela poput... SuperGrok HeavyMeta je smanjila svoju posvećenost otvorenom kodu u posljednjim generacijama Llame.

Za evropski istraživački i startup ekosistem – koji se u velikoj mjeri oslanja na otvorene modele hostovane na platformama poput Hugging Face – dostupnost težina, sintetičkih podataka i biblioteka pod otvorenim licencama predstavlja snažnu alternativu… kineski modeli i Amerikanci koji dominiraju rangiranjem popularnosti i referentnim vrijednostima.

Ekskluzivni sadržaj - kliknite ovdje  Microsoft Store se ne otvara ili se stalno zatvara: detaljna rješenja

Hibridna MoE arhitektura: efikasnost za velike agente

Centralna tehnička karakteristika Nemotrona 3 je... Hibridna arhitektura latentne mješavine stručnjaka (MoE)Umjesto aktiviranja svih parametara modela u svakom zaključivanju, uključuje se samo dio njih, podskup stručnjaka najrelevantnijih za dotični zadatak ili token.

Ovaj pristup omogućava drastično smanjuju troškove računanja i potrošnju memorijeOvo također povećava propusnost tokena. Za multi-agentske arhitekture, gdje desetine ili stotine agenata kontinuirano razmjenjuju poruke, ova efikasnost je ključna za sprječavanje da sistem postane neodrživ u smislu troškova GPU-a i clouda.

Prema podacima koje je podijelila NVIDIA i nezavisnim testovima, Nemotron 3 Nano postiže do četiri puta više tokena u sekundi U poređenju sa svojim prethodnikom, Nemotron 2 Nano, smanjuje generisanje nepotrebnih tokena za zaključivanje za oko 60%. U praksi, to znači jednako ili čak i tačnije odgovore, ali sa manje "opširnosti" i nižom cijenom po upitu.

Hibridna arhitektura Ministarstva obrazovanja, u kombinaciji sa specifičnim tehnikama obuke, dovela je do Mnogi od najnaprednijih otvorenih modela usvajaju ekspertne shemeNemotron 3 se pridružuje ovom trendu, ali se posebno fokusira na agentsku umjetnu inteligenciju: interne rute dizajnirane za koordinaciju između agenata, korištenje alata, rukovanje dugim stanjima i planiranje korak po korak.

Tri veličine: Nano, Super i Ultra za različita radna opterećenja

Arhitektura modela Nemotron 3

Porodica Nemotron 3 je organizovana u Tri glavne veličine MoE modela, svi su otvoreni i sa smanjenim aktivnim parametrima zahvaljujući stručnoj arhitekturi:

  • Nemotron 3 Nanooko 30.000 milijardi ukupnih parametara, sa otprilike 3.000 milijardi imovine po tokenuDizajniran je za ciljane zadatke gdje je efikasnost bitna: otklanjanje grešaka u softveru, sažimanje dokumenata, pronalaženje informacija, praćenje sistema ili specijalizirani AI asistenti.
  • Nemotron 3 Superpribližno 100.000 milijardi parametara, sa 10.000 milijardi imovine na svakom koraku. Usmjeren je na Napredno zaključivanje u multiagentskim arhitekturamasa niskom latencijom čak i kada više agenata sarađuje u rješavanju složenih tokova.
  • Nemotron 3 Ultra: gornji nivo, sa približno 500.000 milijardi parametara i do 50.000 milijardi imovine po tokenuFunkcioniše kao moćan mehanizam za rasuđivanje u istraživanju, strateškom planiranju, podršci odlučivanju na visokom nivou i posebno zahtjevnim sistemima umjetne inteligencije.

U praksi, ovo omogućava organizacijama Odaberite veličinu modela prema vašem budžetu i zahtjevimaNano za ogromna, intenzivna opterećenja i niske troškove; Super kada je potrebna veća dubina rezonovanja s mnogo saradničkih agenata; i Ultra za slučajeve gdje kvalitet i dugi kontekst nadmašuju cijenu GPU-a.

Ekskluzivni sadržaj - kliknite ovdje  TAG Heuer Connected Calibre E5: prelazak na vlasnički softver i New Balance izdanje

Za sada Samo Nemotron 3 Nano je dostupan za trenutnu upotrebu.Super i Ultra varijante planirane su za prvu polovinu 2026. godine, što će evropskim kompanijama i laboratorijama dati vremena da prvo eksperimentišu sa Nano tehnologijom, uspostave cjevovode, a kasnije i da migriraju kućišta koja zahtijevaju veći kapacitet.

Nemotron 3 Nano: Prozor od 1 milion tokena i ograničeni troškovi

Nemotron 3 Nano

Nemotron 3 Nano je, od danas, praktični predvodnik porodiceNVIDIA ga opisuje kao računarski najisplativiji model u ponudi, optimizovan za pružanje maksimalnih performansi u višeagentnim radnim procesima i intenzivnim, ali repetitivnim zadacima.

Među njegovim tehničkim karakteristikama ističu se sljedeće: kontekstni prozor do milion tokenaOvo omogućava zadržavanje memorije za opsežne dokumente, cijele repozitorije koda ili višestepene poslovne procese. Za evropske primjene u bankarstvu, zdravstvu ili javnoj upravi, gdje zapisi mogu biti obimni, ova dugoročna kontekstualna sposobnost je posebno vrijedna.

Mjerila nezavisne organizacije Vještačka analiza svrstava Nemotron 3 Nano među najuravnoteženije modele otvorenog koda. Kombinuje inteligenciju, tačnost i brzinu, sa propusnošću od stotina tokena u sekundi. Ova kombinacija ga čini atraktivnim za integratore vještačke inteligencije i pružaoce usluga u Španiji kojima je potrebno dobro korisničko iskustvo bez vrtoglavih troškova infrastrukture.

Što se tiče slučajeva upotrebe, NVIDIA cilja na Nano. Sažetak sadržaja, otklanjanje grešaka u softveru, pronalaženje informacija i pomoćnici za umjetnu inteligenciju u preduzećimaZahvaljujući smanjenju redundantnih tokena za zaključivanje, moguće je pokretati agente koji održavaju duge razgovore s korisnicima ili sistemima bez naglog povećanja troškova zaključivanja.

Otvoreni podaci i biblioteke: NeMo Gym, NeMo RL i Evaluator

NeMo biblioteke

Jedna od najizrazitijih karakteristika Nemotrona 3 je to što Nije ograničeno samo na objavljivanje težina modelaNVIDIA prati porodicu sa sveobuhvatnim paketom otvorenih resursa za obuku, podešavanje i evaluaciju agenata.

S jedne strane, on omogućava pristup sintetičkom korpusu nekoliko triliona tokena podataka prije obuke, nakon obuke i pojačanjaOvi skupovi podataka, fokusirani na zaključivanje, kodiranje i višekoračne tokove rada, omogućavaju kompanijama i istraživačkim centrima da generiraju vlastite varijante Nemotrona specifične za određenu domenu (npr. pravnu, zdravstvenu ili industrijsku) bez počinjanja od nule.

Među ovim resursima, ističu se sljedeći: Nemotron Agent Safety skup podatakaPrikuplja telemetrijske podatke o ponašanju agenata u stvarnim scenarijima. Njegov cilj je pomoći timovima da mjere i ojačaju sigurnost složenih autonomnih sistema: od radnji koje agent preduzima kada naiđe na osjetljive podatke, do toga kako reaguje na dvosmislene ili potencijalno štetne komande.

Ekskluzivni sadržaj - kliknite ovdje  Najnovije funkcije koje dolaze u Windows 11: umjetna inteligencija i novi načini upravljanja računarom

Što se tiče sekcije alata, NVIDIA pokreće NeMo Gym i NeMo RL kao biblioteke otvorenog koda za obuku pojačanja i naknadnu obuku, zajedno s NeMo Evaluatorom za procjenu sigurnosti i performansi. Ove biblioteke pružaju simulacijska okruženja i cjevovode spremna za upotrebu s Nemotron porodicom, ali se mogu proširiti i na druge modele.

Sav ovaj materijal - težine, skupovi podataka i kod - distribuira se putem GitHub i Hugging Face su licencirani pod NVIDIA Open Model licencom.tako da evropski timovi mogu besprijekorno integrirati NeMo Gym u vlastite MLO-ove. Kompanije poput Prime Intellect i Unsloth već uključuju NeMo Gym direktno u svoje radne procese kako bi pojednostavile učenje s potkrepljenjem na Nemotronu.

Dostupnost u javnim oblacima i evropskom ekosistemu

Nemotron 3 Nano uređaj za grljenje lica

Nemotron 3 Nano je sada dostupan na Zagrljeno lice y GitHubkao i putem provajdera inferencije kao što su Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI. Ovo otvara vrata razvojnim timovima u Španiji da testiraju model putem API-ja ili ga implementiraju na vlastitoj infrastrukturi bez pretjerane složenosti.

Na oblačnom frontu, Nemotron 3 Nano se pridružuje AWS-u putem Amazon Bedrocka za serverless inferenciju i najavio je podršku za Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta. Za evropske organizacije koje već rade na ovim platformama, ovo olakšava usvajanje Nemotrona bez drastičnih promjena u njihovoj arhitekturi.

Pored javnog oblaka, NVIDIA promoviše upotrebu Nemotron 3 Nano kao NIM mikroservis se može primijeniti na bilo kojoj infrastrukturi ubrzanoj od strane NVIDIA tehnologijeOvo omogućava hibridne scenarije: dio opterećenja u međunarodnim oblacima, a dio u lokalnim podatkovnim centrima ili u evropskim oblacima koji daju prioritet boravištu podataka u EU.

Verzije Nemotron 3 Super i Ultra, usmjereni na ekstremna radna opterećenja zaključivanja i velike multiagentske sisteme, su planirano za prvu polovinu 2026.Ovaj vremenski okvir omogućava evropskom istraživačkom i poslovnom ekosistemu vrijeme za eksperimentiranje s Nano tehnologijom, validaciju slučajeva upotrebe i dizajniranje strategija migracije na veće modele kada je to potrebno.

Nemotron 3 pozicionira NVIDIA kao jednog od vodećih dobavljača vrhunski otvoreni modeli usmjereni na agentsku umjetnu inteligencijuS prijedlogom koji spaja tehničku efikasnost (hibridni MoE, NVFP4, masivni kontekst), otvorenost (težine, skupovi podataka i dostupne biblioteke) i jasan fokus na suverenitet i transparentnost podataka, aspekte koji su posebno osjetljivi u Španiji i ostatku Evrope, gdje su regulacija i pritisak za reviziju umjetne inteligencije sve veći.

Microsoft Discovery IA-2
Vezani članak:
Microsoft Discovery AI pokreće naučne i obrazovne prodore personaliziranom umjetnom inteligencijom