Nemotron 3: Dau kubwa la wazi la NVIDIA kwa AI ya mawakala wengi

Sasisho la mwisho: 17/12/2025

  • Nemotron 3 ni familia huria ya mifumo, data, na maktaba zinazolenga mifumo ya kielektroniki ya AI na mifumo ya mawakala wengi.
  • Inajumuisha ukubwa tatu wa MoE (Nano, Super na Ultra) pamoja na usanifu mseto na mafunzo bora ya biti 4 kwenye NVIDIA Blackwell.
  • Nemotron 3 Nano sasa inapatikana Ulaya kupitia Hugging Face, public clouds na kama huduma ndogo ya NIM, ikiwa na dirisha la tokeni milioni 1.
  • Mfumo ikolojia umekamilika na seti kubwa za data, NeMo Gym, NeMo RL na Mtathmini ili kutoa mafunzo, kurekebisha na kukagua mawakala huru wa AI.

Mfano wa Akili Bandia wa Nemotron 3

Kinyang'anyiro cha akili bandia kinahama kutoka kwa viroboti rahisi, vilivyotengwa hadi mifumo ya mawakala inayoshirikiana, inayosimamia mtiririko mrefu wa kazi, na inayohitaji kukaguliwa. Katika hali hii mpya, NVIDIA imeamua kuchukua hatua iliyo wazi kabisa: kufungua sio tu mifumo, lakini pia data na zanaili makampuni, tawala za umma na vituo vya utafiti viweze kujenga majukwaa yao wenyewe ya AI kwa udhibiti zaidi.

Harakati hiyo hutokea katika Nemotron 3, familia ya mifumo iliyo wazi inayolenga AI ya mawakala wengi Inatafuta kuchanganya utendaji wa juu, gharama za chini za makadirio, na uwazi. Pendekezo hilo halikusudiwi kama boti nyingine ya gumzo yenye madhumuni ya jumla, bali kama msingi wa kupeleka mawakala wanaofikiria, kupanga na kutekeleza kazi ngumu katika sekta zinazodhibitiwaHili ni muhimu hasa barani Ulaya na Uhispania, ambapo uhuru wa data na kufuata sheria ni muhimu.

Familia wazi ya mifumo ya AI ya kiofisi na ya kujitegemea

Nemotron 3 imewasilishwa kama mfumo kamili wa ikolojia: mifumo, seti za data, maktaba, na mapishi ya mafunzo chini ya leseni zilizo wazi. Wazo la NVIDIA ni kwamba mashirika hayatumii tu AI kama huduma isiyoonekana, lakini yanaweza kukagua kilicho ndani, kurekebisha mifumo kulingana na vikoa vyao, na kuisambaza kwenye miundombinu yao wenyewe, iwe katika wingu au katika vituo vya data vya ndani.

Kampuni inaweka mkakati huu katika ahadi yake ya AI mkuuSerikali na makampuni barani Ulaya, Korea Kusini, na maeneo mengine yanatafuta njia mbadala zilizo wazi badala ya mifumo iliyofungwa au ya kigeni, ambayo mara nyingi haiendani vyema na sheria zao za ulinzi wa data au mahitaji ya ukaguzi. Nemotron 3 inalenga kuwa msingi wa kiufundi ambapo tunaweza kujenga mifumo ya kitaifa, kisekta, au ya makampuni yenye mwonekano na udhibiti zaidi.

Sambamba, NVIDIA inaimarisha msimamo wake zaidi ya vifaaHadi sasa, kimsingi ilikuwa mtoa huduma wa GPU wa marejeleo; ikiwa na Nemotron 3, pia inajiweka katika safu ya zana za uundaji wa modeli na mafunzo, ikishindana moja kwa moja zaidi na wachezaji kama OpenAI, Google, Anthropic, au hata Meta, na dhidi ya mifumo ya hali ya juu kama vile SuperGrok NzitoMeta imekuwa ikipunguza kujitolea kwake kwa programu huria katika vizazi vya hivi karibuni vya Llama.

Kwa mfumo ikolojia wa utafiti na biashara changa barani Ulaya—unaotegemea sana mifumo huria inayohifadhiwa kwenye mifumo kama vile Hugging Face—upatikanaji wa uzito, data ya sintetiki, na maktaba chini ya leseni huria unawakilisha mbadala wenye nguvu wa Mifumo ya Kichina na Wamarekani wanaotawala umaarufu na viwango vya ubora.

Maudhui ya kipekee - Bofya Hapa  Duka la Microsoft halitafunguka au linaendelea kufungwa: suluhu za kina

Usanifu wa MoE mseto: ufanisi kwa mawakala wakubwa

Kipengele kikuu cha kiufundi cha Nemotron 3 ni Usanifu mseto wa mchanganyiko fiche wa wataalam (MoE)Badala ya kuwasha vigezo vyote vya modeli katika kila hitimisho, ni sehemu ndogo tu kati yao huwashwa, kundi la wataalamu wanaofaa zaidi kwa kazi au tokeni husika.

Mbinu hii inaruhusu hupunguza kwa kiasi kikubwa gharama ya kompyuta na matumizi ya kumbukumbuHii pia huongeza upitishaji wa tokeni. Kwa usanifu wa mawakala wengi, ambapo mawakala kadhaa au mamia hubadilishana ujumbe kila mara, ufanisi huu ni muhimu katika kuzuia mfumo kutokuwa endelevu kwa upande wa gharama za GPU na wingu.

Kulingana na data iliyoshirikiwa na NVIDIA na vipimo huru, Nemotron 3 Nano inafanikiwa hadi tokeni mara nne zaidi kwa sekunde Ikilinganishwa na mtangulizi wake, Nemotron 2 Nano, inapunguza uzalishaji wa ishara zisizo za lazima kwa karibu 60%. Kwa vitendo, hii ina maana majibu sawa au hata sahihi zaidi, lakini kwa "maneno" machache na gharama ya chini kwa kila swali.

Usanifu mseto wa MoE, pamoja na mbinu maalum za mafunzo, umesababisha Mifumo mingi ya hali ya juu zaidi iliyo wazi hutumia mipango ya kitaalamuNemotron 3 inajiunga na mwelekeo huu, lakini inalenga hasa AI ya kikali: njia za ndani zilizoundwa kwa ajili ya uratibu kati ya mawakala, matumizi ya zana, utunzaji wa hali ndefu, na upangaji wa hatua kwa hatua.

Saizi tatu: Nano, Super, na Ultra kwa mzigo tofauti wa kazi

Usanifu wa modeli za Nemotron 3

Familia ya Nemotron 3 imepangwa katika ukubwa tatu kuu wa modeli ya MoE, zote zimefunguliwa na zina vigezo amilifu vilivyopunguzwa kutokana na usanifu wa kitaalamu:

  • Nemotron 3 Nano: takriban vigezo bilioni 30.000, vikiwa na takriban Mali bilioni 3.000 kwa kila tokeniImeundwa kwa ajili ya kazi zinazolengwa ambapo ufanisi ni muhimu: utatuzi wa programu, muhtasari wa hati, urejeshaji taarifa, ufuatiliaji wa mfumo, au wasaidizi maalum wa AI.
  • Nemotron 3 Super: takriban vigezo bilioni 100.000, pamoja na Mali bilioni 10.000 katika kila hatua. Imeelekezwa kuelekea Hoja ya hali ya juu katika usanifu wa mawakala wengiyenye ucheleweshaji mdogo hata wakati mawakala wengi wanashirikiana kutatua mtiririko tata.
  • Nemotron 3 Ultra: ngazi ya juu, yenye takriban vigezo bilioni 500.000 na hadi Mali bilioni 50.000 kwa kila tokeniInafanya kazi kama injini yenye nguvu ya hoja kwa ajili ya utafiti, mipango ya kimkakati, usaidizi wa maamuzi ya kiwango cha juu, na mifumo ya AI inayohitaji sana.

Kwa vitendo, hii inaruhusu mashirika Chagua ukubwa wa modeli kulingana na bajeti na mahitaji yakoNano kwa mzigo mkubwa wa kazi na gharama ndogo; Bora wakati hoja ya kina zaidi inahitajika na mawakala wengi wanaoshirikiana; na Ultra kwa hali ambapo ubora na muktadha mrefu huzidi gharama ya GPU.

Maudhui ya kipekee - Bofya Hapa  TAG Heuer Connected Caliber E5: kiwango cha juu cha programu ya umiliki na toleo la New Balance

Kwa sasa Ni Nemotron 3 Nano pekee inayopatikana kwa matumizi ya haraka.Aina za Super na Ultra zimepangwa kwa nusu ya kwanza ya 2026, na kuzipa kampuni na maabara za Ulaya muda wa kujaribu kwanza na Nano, kuanzisha mabomba na, baadaye, kuhamisha kesi zinazohitaji uwezo mkubwa zaidi.

Nemotron 3 Nano: dirisha la tokeni milioni 1 na gharama iliyohifadhiwa

Nemotron 3 Nano

Nemotron 3 Nano, hadi leo, ni kiongozi wa vitendo wa familiaNVIDIA inaielezea kama modeli yenye ufanisi zaidi wa kihesabu katika masafa mbalimbali, iliyoboreshwa ili kutoa utendaji wa hali ya juu katika mtiririko wa kazi wa mawakala wengi na kazi nzito lakini zinazojirudia.

Miongoni mwa sifa zake za kiufundi, zifuatazo zinajitokeza: dirisha la muktadha la hadi tokeni milioni mojaHii inaruhusu uhifadhi wa kumbukumbu kwa ajili ya hati nyingi, hazina nzima za misimbo, au michakato ya biashara ya hatua nyingi. Kwa matumizi ya Ulaya katika benki, huduma ya afya, au utawala wa umma, ambapo rekodi zinaweza kuwa nyingi, uwezo huu wa muktadha wa muda mrefu ni muhimu sana.

Vigezo vya shirika huru Uchambuzi bandia unaiweka Nemotron 3 Nano kama mojawapo ya mifumo huria yenye usawa zaidi Inachanganya akili, usahihi, na kasi, pamoja na viwango vya upitishaji katika mamia ya tokeni kwa sekunde. Mchanganyiko huu unaifanya ivutie waunganishaji wa AI na watoa huduma nchini Uhispania ambao wanahitaji uzoefu mzuri wa mtumiaji bila gharama kubwa za miundombinu.

Kwa upande wa matumizi, NVIDIA inalenga Nano katika Muhtasari wa maudhui, utatuzi wa programu, urejeshaji taarifa, na wasaidizi wa AI wa biasharaShukrani kwa kupungua kwa tokeni za hoja zisizo za lazima, inawezekana kuendesha mawakala wanaodumisha mazungumzo marefu na watumiaji au mifumo bila muswada wa makadirio kuongezeka kwa kasi.

Data na maktaba huria: NeMo Gym, NeMo RL na Mtathmini

Maktaba za NeMo

Mojawapo ya sifa tofauti zaidi za Nemotron 3 ni kwamba Haizuiliwi tu kutoa uzito wa modeliNVIDIA huambatana na familia na seti kamili ya rasilimali huria kwa ajili ya mafunzo, urekebishaji, na tathmini za mawakala.

Kwa upande mmoja, hutoa corpus ya sintetiki ya tokeni trilioni kadhaa za data ya kabla ya mafunzo, baada ya mafunzo, na uimarishajiSeti hizi za data, zinazolenga hoja, usimbaji msimbo, na mtiririko wa kazi wa hatua nyingi, huruhusu kampuni na vituo vya utafiti kutoa aina zao maalum za Nemotron (k.m., kisheria, huduma ya afya, au viwanda) bila kuanza kutoka mwanzo.

Miongoni mwa rasilimali hizi, zifuatazo zinajitokeza: Seti ya data ya Usalama wa Wakala wa NemotronInakusanya data ya telemetri kuhusu tabia ya mawakala katika hali halisi. Lengo lake ni kusaidia timu kupima na kuimarisha usalama wa mifumo tata inayojiendesha: kuanzia hatua ambazo mawakala huchukua wanapokutana na data nyeti, hadi jinsi wanavyoitikia amri zisizoeleweka au zinazoweza kuwa na madhara.

Maudhui ya kipekee - Bofya Hapa  Vipengele vya hivi punde vinavyokuja kwenye Windows 11: akili ya bandia na njia mpya za kudhibiti Kompyuta yako

Kuhusu sehemu ya zana, NVIDIA inazinduliwa Gym ya NeMo na NeMo RL kama maktaba huria kwa ajili ya mafunzo ya kuimarisha na mafunzo ya baada ya mafunzo, pamoja na Mtathmini wa NeMo kwa ajili ya kutathmini usalama na utendaji. Maktaba hizi hutoa mazingira na mifumo ya uigaji iliyo tayari kutumika na familia ya Nemotron, lakini inaweza kupanuliwa hadi kwa mifumo mingine.

Nyenzo hizi zote—uzito, seti za data, na msimbo—zinasambazwa kupitia GitHub na Kukumbatiana Face zina leseni chini ya Leseni ya NVIDIA Open Model.ili timu za Ulaya ziweze kuiunganisha bila shida katika MLOps zao wenyewe. Makampuni kama Prime Intellect na Unsloth tayari yanajumuisha NeMo Gym moja kwa moja kwenye mtiririko wao wa kazi ili kurahisisha ujifunzaji wa kuimarisha kwenye Nemotron.

Upatikanaji katika mawingu ya umma na mfumo ikolojia wa Ulaya

Uso wa Nemotron 3 Nano Unaokumbatiana

Nemotron 3 Nano sasa inapatikana katika Uso wa kukumbatiana y GitHubna pia kupitia watoa huduma za hitimisho kama vile Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, na Together AI. Hii inafungua mlango kwa timu za maendeleo nchini Uhispania kujaribu modeli kupitia API au kuipeleka kwenye miundombinu yao wenyewe bila ugumu mwingi.

Kwenye upande wa wingu, Nemotron 3 Nano inajiunga na AWS kupitia Amazon Bedrock kwa ajili ya hitimisho lisilotumia seva, na imetangaza kuunga mkono Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, na Yotta. Kwa mashirika ya Ulaya ambayo tayari yanafanya kazi kwenye mifumo hii, hii hurahisisha kutumia Nemotron bila mabadiliko makubwa katika usanifu wao.

Mbali na wingu la umma, NVIDIA inakuza matumizi ya Nemotron 3 Nano kama Huduma ndogo ya NIM inayoweza kutumika kwenye miundombinu yoyote inayoharakishwa na NVIDIAHii inaruhusu hali mseto: sehemu ya mzigo katika mawingu ya kimataifa na sehemu katika vituo vya data vya ndani au katika mawingu ya Ulaya ambayo yanapa kipaumbele ukaazi wa data katika EU.

Matoleo Nemotron 3 Super na Ultra, zinazolenga mzigo mkubwa wa kazi wa kufikiri na mifumo mikubwa ya mawakala wengi, ni imepangwa kwa nusu ya kwanza ya 2026Muda huu wa matukio huruhusu utafiti wa Ulaya na mfumo ikolojia wa biashara kujaribu Nano, kuthibitisha matumizi, na kubuni mikakati ya uhamiaji hadi mifumo mikubwa inapohitajika.

Nemotron 3 inaiweka NVIDIA katika nafasi ya mmoja wa watoa huduma wakuu wa modeli za hali ya juu zilizo wazi zinazolenga AI ya kikaliPamoja na pendekezo linalochanganya ufanisi wa kiufundi (MoE mseto, NVFP4, muktadha mkubwa), uwazi (uzito, seti za data na maktaba zinazopatikana) na mkazo wazi juu ya uhuru wa data na uwazi, vipengele ambavyo ni nyeti hasa nchini Uhispania na sehemu nyingine za Ulaya, ambapo kanuni na shinikizo la ukaguzi wa AI linazidi kuwa kubwa.

Ugunduzi wa Microsoft IA-2
Nakala inayohusiana:
Ugunduzi wa Microsoft AI huleta mafanikio ya kisayansi na kielimu kwa kutumia akili bandia iliyobinafsishwa