Nemotron 3: NVIDIA-in veliki otvoreni ulog za višeagentsku umjetnu inteligenciju

Zadnje ažuriranje: 17/12/2025

  • Nemotron 3 je otvorena obitelj modela, podataka i biblioteka usmjerenih na agentsku umjetnu inteligenciju i višeagentske sustave.
  • Uključuje tri MoE veličine (Nano, Super i Ultra) s hibridnom arhitekturom i učinkovitim 4-bitnim treningom na NVIDIA Blackwellu.
  • Nemotron 3 Nano sada je dostupan u Europi putem Hugging Facea, javnih oblaka i kao NIM mikroservis, s prozorom od milijun tokena.
  • Ekosustav je upotpunjen masivnim skupovima podataka, NeMo Gymom, NeMo RL-om i Evaluatorom za obuku, podešavanje i reviziju suverenih AI agenata.

Model umjetne inteligencije Nemotron 3

Utrka za umjetnu inteligenciju seli se od jednostavnih, izoliranih chatbotova do agentskih sustava koji surađuju jedni s drugima, upravljaju dugim tijekovima rada i moraju biti podložni reviziji. U ovom novom scenariju, NVIDIA se odlučila za prilično jasan korak: otvoriti ne samo modele, već i podatke i alatekako bi tvrtke, javne uprave i istraživački centri mogli izgraditi vlastite AI platforme s većom kontrolom.

Taj pokret se materijalizira u Nemotron 3, obitelj otvorenih modela usmjerenih prema višeagentnoj umjetnoj inteligenciji Nastoji kombinirati visoke performanse, niske troškove zaključivanja i transparentnost. Prijedlog nije zamišljen kao još jedan chatbot opće namjene, već kao baza na kojoj se mogu rasporediti agenti koji razmišljaju, planiraju i izvršavaju složene zadatke u reguliranim sektorimaTo je posebno važno u Europi i Španjolskoj, gdje su suverenitet podataka i usklađenost s propisima važni.

Otvorena obitelj modela za agentnu i suverenu umjetnu inteligenciju

Nemotron 3 je predstavljen kao kompletan ekosustav: modeli, skupovi podataka, biblioteke i recepti za obuku pod otvorenim licencama. NVIDIA-ina ideja je da organizacije ne samo da koriste umjetnu inteligenciju kao neprozirnu uslugu, već mogu pregledati što je unutra, prilagoditi modele svojim domenama i implementirati ih na vlastitu infrastrukturu, bilo u oblaku ili u lokalnim podatkovnim centrima.

Tvrtka ovu strategiju uokviruje u svoju predanost Suvereni AIVlade i tvrtke u Europi, Južnoj Koreji i drugim regijama traže otvorene alternative zatvorenim ili stranim sustavima, koji često nisu u skladu s njihovim zakonima o zaštiti podataka ili zahtjevima za reviziju. Nemotron 3 ima za cilj biti tehnička osnova na kojoj će se graditi nacionalni, sektorski ili korporativni modeli s većom vidljivošću i kontrolom.

Paralelno, NVIDIA jača svoju poziciju izvan hardveraDo sada je prvenstveno bio dobavljač referentnih GPU-ova; s Nemotronom 3 pozicionira se i u sloju alata za modeliranje i obuku, izravnije se natječući s igračima poput OpenAI-a, Googlea, Anthropica ili čak Mete, te protiv premium modela poput SuperGrok HeavyMeta je smanjila svoju predanost otvorenom kodu u posljednjim generacijama Llame.

Za europski istraživački i startup ekosustav – koji se uvelike oslanja na otvorene modele smještene na platformama poput Hugging Facea – dostupnost težina, sintetičkih podataka i biblioteka pod otvorenim licencama predstavlja snažnu alternativu kineski modeli i Amerikanci koji dominiraju ljestvicama popularnosti i referentnim vrijednostima.

Ekskluzivan sadržaj - Kliknite ovdje  Microsoft Store se ne otvara ili se stalno zatvara: detaljna rješenja

Hibridna MoE arhitektura: učinkovitost za velike agente

Središnja tehnička značajka Nemotrona 3 je... Hibridna arhitektura latentne mješavine stručnjaka (MoE)Umjesto aktiviranja svih parametara modela u svakom zaključivanju, uključuje se samo njihov dio, podskup stručnjaka najrelevantnijih za dotični zadatak ili token.

Ovaj pristup omogućuje drastično smanjiti računalne troškove i potrošnju memorijeTo također povećava propusnost tokena. Za arhitekture s više agenata, gdje deseci ili stotine agenata kontinuirano razmjenjuju poruke, ova učinkovitost je ključna za sprječavanje da sustav postane neodrživ u smislu troškova GPU-a i oblaka.

Prema podacima koje je podijelila NVIDIA i neovisnim testovima, Nemotron 3 Nano postiže do četiri puta više tokena u sekundi U usporedbi s prethodnikom, Nemotronom 2 Nano, smanjuje generiranje nepotrebnih tokena za zaključivanje za oko 60%. U praksi to znači jednako ili čak točnije odgovore, ali s manje "opširnosti" i nižom cijenom po upitu.

Hibridna arhitektura Ministarstva obrazovanja, u kombinaciji sa specifičnim tehnikama obuke, dovela je do Mnogi od najnaprednijih otvorenih modela usvajaju ekspertne shemeNemotron 3 pridružuje se ovom trendu, ali se posebno fokusira na agentsku umjetnu inteligenciju: interne rute dizajnirane za koordinaciju između agenata, korištenje alata, rukovanje dugim stanjima i postupno planiranje.

Tri veličine: Nano, Super i Ultra za različita radna opterećenja

Arhitektura modela Nemotrona 3

Obitelj Nemotron 3 organizirana je u tri glavne veličine MoE modela, svi su otvoreni i sa smanjenim aktivnim parametrima zahvaljujući stručnoj arhitekturi:

  • Nemotron 3 Nanooko 30.000 milijardi ukupnih parametara, s otprilike 3.000 milijardi imovine po tokenuDizajniran je za ciljane zadatke gdje je učinkovitost važna: otklanjanje pogrešaka u softveru, sažimanje dokumenata, pronalaženje informacija, nadzor sustava ili specijalizirani AI asistenti.
  • Nemotron 3 Superpribližno 100.000 milijardi parametara, s 10.000 milijardi imovine na svakom koraku. Usmjeren je prema Napredno zaključivanje u višeagentnim arhitekturamas niskom latencijom čak i kada više agenata surađuje u rješavanju složenih tokova.
  • Nemotron 3 Ultra: gornja razina, s otprilike 500.000 milijardi parametara i do 50.000 milijardi imovine po tokenuDjeluje kao snažan mehanizam za rasuđivanje za istraživanje, strateško planiranje, podršku odlučivanju na visokoj razini i posebno zahtjevne AI sustave.

U praksi, to omogućuje organizacijama Odaberite veličinu modela prema svom budžetu i zahtjevimaNano za masovna, intenzivna opterećenja i niske troškove; Super kada je potrebna veća dubina rezoniranja s mnogo suradničkih agenata; i Ultra za slučajeve gdje kvaliteta i dugi kontekst nadmašuju cijenu GPU-a.

Ekskluzivan sadržaj - Kliknite ovdje  TAG Heuer Connected Calibre E5: skok prema vlasničkom softveru i izdanju New Balance

Zasad Samo Nemotron 3 Nano je dostupan za trenutnu upotrebu.Super i Ultra varijante planirane su za prvu polovicu 2026., što će europskim tvrtkama i laboratorijima dati vremena da prvo eksperimentiraju s Nano tehnologijom, uspostave cjevovode, a kasnije i migriraju kućišta koja zahtijevaju veći kapacitet.

Nemotron 3 Nano: prozor od 1 milijun tokena i ograničeni troškovi

Nemotron 3 Nano

Nemotron 3 Nano je, od danas, praktični predvodnik obiteljiNVIDIA ga opisuje kao računalno najisplativiji model u ponudi, optimiziran za maksimalne performanse u višeagentnim tijekovima rada i intenzivnim, ali repetitivnim zadacima.

Među njegovim tehničkim značajkama ističu se sljedeće: kontekstni prozor do milijun tokenaTo omogućuje zadržavanje memorije za opsežne dokumente, cijele repozitorije koda ili višekoračne poslovne procese. Za europske primjene u bankarstvu, zdravstvu ili javnoj upravi, gdje zapisi mogu biti opsežni, ova dugoročna kontekstualna sposobnost je posebno vrijedna.

Mjerila neovisne organizacije Umjetna analiza smješta Nemotron 3 Nano kao jedan od najuravnoteženijih modela otvorenog koda. Kombinira inteligenciju, točnost i brzinu, s propusnošću od stotina tokena u sekundi. Ova kombinacija čini ga privlačnim integratorima umjetne inteligencije i pružateljima usluga u Španjolskoj kojima je potrebno dobro korisničko iskustvo bez vrtoglavih troškova infrastrukture.

Što se tiče slučajeva upotrebe, NVIDIA cilja na Nano. Sažetak sadržaja, otklanjanje pogrešaka u softveru, pronalaženje informacija i pomoćnici za umjetnu inteligenciju u poduzećuZahvaljujući smanjenju redundantnih tokena za zaključivanje, moguće je pokretati agente koji održavaju duge razgovore s korisnicima ili sustavima bez naglog porasta troškova zaključivanja.

Otvoreni podaci i knjižnice: NeMo Gym, NeMo RL i Evaluator

NeMo knjižnice

Jedna od najizrazitijih karakteristika Nemotrona 3 je ta što Nije ograničeno samo na objavljivanje težina modelaNVIDIA prati obitelj s opsežnim paketom otvorenih resursa za obuku, podešavanje i evaluaciju agenata.

S jedne strane, omogućuje pristup sintetičkom korpusu nekoliko bilijuna tokena podataka prije obuke, nakon obuke i pojačanjaOvi skupovi podataka, usmjereni na zaključivanje, kodiranje i višekoračne tijekove rada, omogućuju tvrtkama i istraživačkim centrima generiranje vlastitih varijanti Nemotrona specifičnih za određenu domenu (npr. pravnu, zdravstvenu ili industrijsku) bez početka od nule.

Među tim resursima ističu se sljedeći: Nemotron Agent Safety skup podatakaPrikuplja telemetrijske podatke o ponašanju agenata u stvarnim scenarijima. Cilj mu je pomoći timovima u mjerenju i jačanju sigurnosti složenih autonomnih sustava: od radnji koje agent poduzima kada naiđe na osjetljive podatke do toga kako reagira na dvosmislene ili potencijalno štetne naredbe.

Ekskluzivan sadržaj - Kliknite ovdje  Najnovije značajke koje dolaze u Windows 11: umjetna inteligencija i novi načini upravljanja računalom

Što se tiče odjeljka s alatima, NVIDIA pokreće NeMo Gym i NeMo RL kao biblioteke otvorenog koda za obuku pojačanja i naknadnu obuku, zajedno s NeMo Evaluatorom za procjenu sigurnosti i performansi. Ove biblioteke pružaju simulacijska okruženja i cjevovode spremne za upotrebu s Nemotron obitelji, ali se mogu proširiti i na druge modele.

Sav ovaj materijal - težine, skupovi podataka i kod - distribuira se putem GitHub i Hugging Face licencirani su pod NVIDIA Open Model licencom.tako da ga europski timovi mogu besprijekorno integrirati u vlastite MLO-ove. Tvrtke poput Prime Intellecta i Unslotha već uključuju NeMo Gym izravno u svoje tijekove rada kako bi pojednostavile učenje s potkrepljenjem na Nemotronu.

Dostupnost u javnim oblacima i europskom ekosustavu

Nemotron 3 Nano uređaj za grljenje lica

Nemotron 3 Nano je sada dostupan na Zagrljeno lice y GitHubkao i putem pružatelja inferencije kao što su Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI. To otvara vrata razvojnim timovima u Španjolskoj da testiraju model putem API-ja ili ga implementiraju na vlastitoj infrastrukturi bez pretjerane složenosti.

Na oblačnoj fronti, Nemotron 3 Nano se pridružuje AWS-u putem Amazon Bedrocka za zaključivanje bez poslužitelja i najavio je podršku za Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta. Za europske organizacije koje već rade na tim platformama, ovo olakšava usvajanje Nemotrona bez drastičnih promjena u njihovoj arhitekturi.

Uz javni oblak, NVIDIA promovira korištenje Nemotrona 3 Nano kao NIM mikroservis koji se može primijeniti na bilo koju infrastrukturu s NVIDIA ubrzanjemTo omogućuje hibridne scenarije: dio opterećenja u međunarodnim oblacima, a dio u lokalnim podatkovnim centrima ili u europskim oblacima koji daju prioritet boravištu podataka u EU.

Inačice Nemotron 3 Super i Ultra, usmjereni na ekstremna radna opterećenja zaključivanja i velike višeagentske sustave, su planirano za prvu polovicu 2026.Ovaj vremenski okvir omogućuje europskom istraživačkom i poslovnom ekosustavu vrijeme za eksperimentiranje s Nano tehnologijom, validaciju slučajeva upotrebe i dizajniranje strategija migracije na veće modele kada je to potrebno.

Nemotron 3 pozicionira NVIDIA-u kao jednog od vodećih dobavljača vrhunski otvoreni modeli usmjereni prema agentskoj umjetnoj inteligencijiS prijedlogom koji spaja tehničku učinkovitost (hibridni MoE, NVFP4, masivni kontekst), otvorenost (težine, skupovi podataka i dostupne biblioteke) i jasan fokus na suverenitet i transparentnost podataka, aspekte koji su posebno osjetljivi u Španjolskoj i ostatku Europe, gdje su regulacija i pritisak na reviziju umjetne inteligencije sve veći.

Microsoft Discovery IA-2
Povezani članak:
Microsoft Discovery AI potiče znanstvene i obrazovne proboje personaliziranom umjetnom inteligencijom