Nemotron 3: Malaking bukas na pusta ng NVIDIA para sa multi-agent AI

Huling pag-update: 17/12/2025

  • Ang Nemotron 3 ay isang bukas na pamilya ng mga modelo, datos, at mga aklatan na nakatuon sa agentic AI at mga sistemang multi-agent.
  • Kabilang dito ang tatlong laki ng MoE (Nano, Super at Ultra) na may hybrid architecture at mahusay na 4-bit training sa NVIDIA Blackwell.
  • Ang Nemotron 3 Nano ay makukuha na ngayon sa Europa sa pamamagitan ng Hugging Face, mga pampublikong cloud at bilang isang NIM microservice, na may palugit na 1 milyong token.
  • Ang ecosystem ay kinukumpleto gamit ang napakalaking dataset, NeMo Gym, NeMo RL at Evaluator upang sanayin, i-tune, at i-audit ang mga sovereign AI agent.

Modelo ng Artipisyal na Katalinuhan ng Nemotron 3

Ang karera para sa artificial intelligence ay lumilipat mula sa simple at nakahiwalay na mga chatbot patungo sa mga agent system na nagtutulungan sa isa't isa, namamahala ng mahahabang daloy ng trabaho, at kailangang ma-audit. Sa bagong senaryo na ito, Nagpasya ang NVIDIA na gumawa ng isang medyo malinaw na hakbang: upang buksan hindi lamang ang mga modelo, kundi pati na rin ang data at mga toolupang ang mga kumpanya, pampublikong administrasyon, at mga sentro ng pananaliksik ay makapagtayo ng sarili nilang mga plataporma ng AI na may higit na kontrol.

Ang kilusang iyon ay nagaganap sa Ang Nemotron 3, isang pamilya ng mga bukas na modelo na nakatuon sa multi-agent AI Nilalayon nitong pagsamahin ang mataas na pagganap, mababang gastos sa paghihinuha, at transparency. Ang panukala ay hindi inilaan bilang isa lamang pangkalahatang layunin na chatbot, kundi bilang isang batayan kung saan itatalaga ang mga ahente na nangangatwiran, nagpaplano, at nagsasagawa ng mga kumplikadong gawain sa mga regulated na sektorIto ay lalong mahalaga sa Europa at Espanya, kung saan mahalaga ang soberanya ng datos at pagsunod sa mga regulasyon.

Isang bukas na pamilya ng mga modelo para sa ahente at soberanong AI

Ang Nemotron 3 ay ipinakita bilang isang kumpletong ecosystem: mga modelo, dataset, library, at mga recipe ng pagsasanay sa ilalim ng mga bukas na lisensya. Ang ideya ng NVIDIA ay hindi lamang ginagamit ng mga organisasyon ang AI bilang isang hindi malinaw na serbisyo, kundi maaari rin nilang siyasatin kung ano ang nasa loob, iakma ang mga modelo sa kanilang mga domain, at i-deploy ang mga ito sa kanilang sariling imprastraktura, maging sa cloud o sa mga lokal na data center.

Binabalangkas ng kompanya ang estratehiyang ito sa loob ng pangako nito na Soberanong AIAng mga pamahalaan at kumpanya sa Europa, Timog Korea, at iba pang mga rehiyon ay naghahanap ng mga bukas na alternatibo sa mga sarado o dayuhang sistema, na kadalasang hindi naaayon sa kanilang mga batas sa proteksyon ng datos o mga kinakailangan sa pag-audit. Nilalayon ng Nemotron 3 na maging teknikal na pundasyon kung saan bubuo ng mga pambansa, sektoral, o korporasyong modelo na may mas malawak na kakayahang makita at kontrol.

Kahanay, Pinalalakas ng NVIDIA ang posisyon nito lampas sa hardwareHanggang ngayon, ito ay pangunahing isang reference GPU provider; gamit ang Nemotron 3, inilalagay din nito ang sarili sa modeling at training tools layer, na mas direktang nakikipagkumpitensya sa mga manlalaro tulad ng OpenAI, Google, Anthropic, o kahit Meta, at laban sa mga premium na modelo tulad ng SuperGrok MabigatBinabawasan na ng Meta ang pangako nito sa open source sa mga nakaraang henerasyon ng Llama.

Para sa European research at startup ecosystem—na lubos na umaasa sa mga open model na naka-host sa mga platform tulad ng Hugging Face—ang pagkakaroon ng mga weight, synthetic data, at mga library sa ilalim ng mga open license ay kumakatawan sa isang makapangyarihang alternatibo sa Mga modelong Tsino at mga Amerikano na nangingibabaw sa popularidad at mga ranggo sa benchmark.

Eksklusibong nilalaman - Mag-click Dito  Paano gamitin ang Microsoft Copilot sa Telegram: kumpletong gabay

Arkitektura ng Hybrid MoE: kahusayan para sa malalaking ahente

Ang pangunahing teknikal na katangian ng Nemotron 3 ay isang Hybrid na arkitektura ng nakatagong pinaghalong-ng-mga-eksperto (MoE)Sa halip na i-activate ang lahat ng parameter ng modelo sa bawat hinuha, isang bahagi lamang ng mga ito ang naka-on, ang subset ng mga eksperto na pinaka-may kaugnayan sa gawain o token na pinag-uusapan.

Ang pamamaraang ito ay nagpapahintulot lubhang binabawasan ang gastos sa pagkalkula at pagkonsumo ng memoryaPinapataas din nito ang token throughput. Para sa mga arkitekturang multi-agent, kung saan dose-dosenang o daan-daang ahente ang patuloy na nagpapalitan ng mga mensahe, ang kahusayang ito ay susi upang maiwasan ang pagiging hindi napapanatiling sistema sa mga tuntunin ng mga gastos sa GPU at cloud.

Ayon sa datos na ibinahagi ng NVIDIA at mga independiyenteng benchmark, nakakamit ng Nemotron 3 Nano ang hanggang apat na beses na mas maraming token kada segundo Kung ikukumpara sa hinalinhan nito, ang Nemotron 2 Nano, binabawasan nito ang pagbuo ng mga hindi kinakailangang token sa pangangatwiran nang humigit-kumulang 60%. Sa pagsasagawa, nangangahulugan ito ng pantay o mas tumpak na mga sagot, ngunit may mas kaunting "kabigatan ng salita" at mas mababang gastos sa bawat query.

Ang hybrid na arkitektura ng MoE, na sinamahan ng mga partikular na pamamaraan sa pagsasanay, ay humantong sa Marami sa mga pinaka-advanced na open model ay gumagamit ng mga expert schemeSumasali ang Nemotron 3 sa trend na ito, ngunit partikular na nakatuon sa agentic AI: mga panloob na ruta na idinisenyo para sa koordinasyon sa pagitan ng mga ahente, paggamit ng mga tool, paghawak ng mahahabang estado, at sunud-sunod na pagpaplano.

Tatlong laki: Nano, Super, at Ultra para sa iba't ibang workload

Arkitektura ng modelo ng Nemotron 3

Ang pamilyang Nemotron 3 ay nakaayos sa tatlong pangunahing sukat ng modelong MoE, lahat ng mga ito ay bukas at may mga pinababang aktibong parameter salamat sa arkitektura ng eksperto:

  • Nemotron 3 Nano: humigit-kumulang 30.000 bilyong kabuuang mga parameter, na may humigit-kumulang 3.000 bilyong asset bawat tokenIto ay dinisenyo para sa mga naka-target na gawain kung saan mahalaga ang kahusayan: pag-debug ng software, pagbubuod ng dokumento, pagkuha ng impormasyon, pagsubaybay sa sistema, o mga espesyalisadong AI assistant.
  • Nemotron 3 Super: humigit-kumulang 100.000 bilyong parametro, na may 10.000 bilyong ari-arian sa bawat hakbang. Ito ay nakatuon sa Mas mataas na pangangatwiran sa mga arkitekturang multi-agentna may mababang latency kahit na maraming ahente ang nagtutulungan upang malutas ang mga kumplikadong daloy.
  • Nemotron 3 Ultra: ang itaas na antas, na may humigit-kumulang 500.000 bilyong mga parameter at hanggang sa 50.000 bilyong asset bawat tokenIto ay gumagana bilang isang makapangyarihang makinang pangangatwiran para sa pananaliksik, pagpaplanong estratehiko, suporta sa desisyon sa mataas na antas, at partikular na mga hinihinging sistema ng AI.

Sa pagsasagawa, pinapayagan nito ang mga organisasyon Pumili ng laki ng modelo ayon sa iyong badyet at mga pangangailanganNano para sa napakalaki at masinsinang workload at masisikip na gastos; Super kapag kailangan ng mas malalim na pangangatwiran kasama ang maraming nakikipagtulungang ahente; at Ultra para sa mga pagkakataon kung saan ang kalidad at mahabang konteksto ay mas malaki kaysa sa gastos ng GPU.

Eksklusibong nilalaman - Mag-click Dito  Paano gamitin ang Autoruns upang alisin ang mga program na awtomatikong nagsisimula nang walang pahintulot

Sa ngayon Tanging ang Nemotron 3 Nano lamang ang magagamit agad.Ang mga variant ng Super at Ultra ay pinaplano para sa unang kalahati ng 2026, na nagbibigay sa mga kumpanya at laboratoryo sa Europa ng oras upang mag-eksperimento muna sa Nano, magtatag ng mga pipeline at, kalaunan, ilipat ang mga kaso na nangangailangan ng mas malaking kapasidad.

Nemotron 3 Nano: 1 milyong token window at nakapaloob na gastos

Nemotron 3 Nano

Ang Nemotron 3 Nano ay, sa ngayon, ang praktikal na pinuno ng pamilyaInilalarawan ito ng NVIDIA bilang ang pinaka-matipid sa komputasyon na modelo sa hanay, na na-optimize upang makapaghatid ng pinakamataas na pagganap sa mga multi-agent workflow at masinsinan ngunit paulit-ulit na mga gawain.

Kabilang sa mga teknikal na katangian nito, ang mga sumusunod ay namumukod-tangi: window ng konteksto na may hanggang isang milyong tokenNagbibigay-daan ito para sa pagpapanatili ng memorya para sa malawak na mga dokumento, buong repositoryo ng code, o mga proseso ng negosyo na may maraming hakbang. Para sa mga aplikasyon sa Europa sa pagbabangko, pangangalagang pangkalusugan, o pampublikong administrasyon, kung saan maaaring maging marami ang mga talaan, ang pangmatagalang kakayahang ito sa konteksto ay partikular na mahalaga.

Mga pamantayan ng isang malayang organisasyon Inilalagay ng artipisyal na pagsusuri ang Nemotron 3 Nano bilang isa sa mga pinakabalanseng open-source na modelo Pinagsasama nito ang katalinuhan, katumpakan, at bilis, na may mga rate ng throughput na daan-daang token bawat segundo. Ang kombinasyong ito ay ginagawa itong kaakit-akit sa mga integrator ng AI at mga service provider sa Espanya na nangangailangan ng mahusay na karanasan ng gumagamit nang walang tumataas na gastos sa imprastraktura.

Sa mga tuntunin ng mga kaso ng paggamit, tinatarget ng NVIDIA ang Nano sa Buod ng nilalaman, pag-debug ng software, pagkuha ng impormasyon, at mga enterprise AI assistantDahil sa pagbawas ng mga paulit-ulit na pangangatwiran na token, posible nang magpatakbo ng mga ahente na nagpapanatili ng mahahabang pag-uusap sa mga gumagamit o sistema nang hindi tumataas ang singil sa hinuha.

Bukas na datos at mga aklatan: NeMo Gym, NeMo RL at Evaluator

Mga aklatan ng NeMo

Isa sa mga pinakanatatanging katangian ng Nemotron 3 ay ang Hindi ito limitado sa paglalabas ng mga timbang ng modeloSinasamahan ng NVIDIA ang pamilya ng isang komprehensibong hanay ng mga bukas na mapagkukunan para sa pagsasanay, pag-tune, at pagsusuri ng mga ahente.

Sa isang banda, nagbibigay ito ng sintetikong korpus ng ilang trilyong token ng datos bago ang pagsasanay, pagkatapos ng pagsasanay, at pampalakasAng mga dataset na ito, na nakatuon sa pangangatwiran, pagko-code, at mga daloy ng trabaho na may maraming hakbang, ay nagbibigay-daan sa mga kumpanya at mga sentro ng pananaliksik na bumuo ng sarili nilang mga variant ng Nemotron na partikular sa domain (hal., legal, pangangalagang pangkalusugan, o industriyal) nang hindi nagsisimula sa simula.

Kabilang sa mga mapagkukunang ito, ang mga sumusunod ay namumukod-tangi: Dataset ng Kaligtasan ng Nemotron AgenticNangongolekta ito ng datos ng telemetrya tungkol sa pag-uugali ng ahente sa mga totoong sitwasyon sa mundo. Ang layunin nito ay tulungan ang mga pangkat na sukatin at palakasin ang seguridad ng mga kumplikadong autonomous system: mula sa kung anong mga aksyon ang ginagawa ng isang ahente kapag nakatagpo ito ng sensitibong datos, hanggang sa kung paano ito tumutugon sa mga hindi malinaw o potensyal na mapaminsalang utos.

Eksklusibong nilalaman - Mag-click Dito  Paano ginagamit ang speech recognition sa larangan ng automation?

Tungkol sa seksyon ng mga tool, inilulunsad ng NVIDIA Ang NeMo Gym at NeMo RL bilang mga open source library para sa reinforcement training at post-training, kasama ang NeMo Evaluator para sa pagtatasa ng kaligtasan at performance. Ang mga library na ito ay nagbibigay ng mga handa nang gamiting simulation environment at pipeline kasama ang pamilyang Nemotron, ngunit maaaring palawigin sa iba pang mga modelo.

Ang lahat ng materyal na ito—mga timbang, dataset, at code—ay ipinamamahagi sa pamamagitan ng Ang GitHub at Hugging Face ay lisensyado sa ilalim ng NVIDIA Open Model License.para maayos itong maisama ng mga koponan sa Europa sa sarili nilang mga MLOp. Isinasama na ng mga kumpanyang tulad ng Prime Intellect at Unsloth ang NeMo Gym nang direkta sa kanilang mga daloy ng trabaho upang gawing simple ang reinforcement learning sa Nemotron.

Availability sa mga pampublikong ulap at sa European ecosystem

Nemotron 3 Nano na Nakayakap na Mukha

Mabibili na ngayon ang Nemotron 3 Nano sa Nakayakap sa Mukha y GitHubpati na rin sa pamamagitan ng mga tagapagbigay ng hinuha tulad ng Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, at Together AI. Binubuksan nito ang pinto para sa mga development team sa Espanya na subukan ang modelo sa pamamagitan ng API o i-deploy ito sa kanilang sariling mga imprastraktura nang walang labis na komplikasyon.

Sa harap ng ulap, Sumali ang Nemotron 3 Nano sa AWS sa pamamagitan ng Amazon Bedrock para sa serverless inference, at inanunsyo ang suporta para sa Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, at Yotta. Para sa mga organisasyong Europeo na nagtatrabaho na sa mga platform na ito, ginagawang mas madali nitong gamitin ang Nemotron nang walang malalaking pagbabago sa kanilang arkitektura.

Bukod sa pampublikong cloud, itinataguyod din ng NVIDIA ang paggamit ng Nemotron 3 Nano bilang Maaaring i-deploy ang NIM microservice sa anumang imprastraktura na pinabilis ng NVIDIANagbibigay-daan ito para sa mga hybrid na senaryo: bahagi ng load sa mga internasyonal na cloud at bahagi sa mga lokal na data center o sa mga European cloud na inuuna ang data residency sa EU.

Ang mga bersyon Nemotron 3 Super at Ultra, nakatuon sa matinding workload ng pangangatwiran at malalaking sistema ng multi-agent, ay nakaplano para sa unang kalahati ng 2026Ang timeline na ito ay nagbibigay ng oras sa pananaliksik at ecosystem ng negosyo sa Europa upang mag-eksperimento sa Nano, patunayan ang mga use case, at magdisenyo ng mga estratehiya sa paglipat sa mas malalaking modelo kung kinakailangan.

Itinatampok ng Nemotron 3 ang NVIDIA bilang isa sa mga nangungunang tagapagbigay ng mga high-end na bukas na modelo na nakatuon sa agentic AIGamit ang isang panukala na pinagsasama ang teknikal na kahusayan (hybrid MoE, NVFP4, malawakang konteksto), pagiging bukas (mga timbang, dataset at magagamit na mga library) at isang malinaw na pagtuon sa soberanya at transparency ng datos, mga aspeto na lalong sensitibo sa Espanya at sa iba pang bahagi ng Europa, kung saan ang regulasyon at presyon upang i-audit ang AI ay lalong tumitindi.

Microsoft Discovery IA-2
Kaugnay na artikulo:
Ang Microsoft Discovery AI ay nagtutulak ng mga pang-agham at pang-edukasyon na tagumpay gamit ang personalized na artificial intelligence