Nemotron 3: NVIDIA atvērtie modeļi daudzaģentu mākslīgajam intelektam

Nemotron 3 ir atvērta modeļu, datu un bibliotēku saime, kas koncentrējas uz aģentūru mākslīgo intelektu un daudzaģentu sistēmām.
Tas ietver trīs MoE izmērus (Nano, Super un Ultra) ar hibrīda arhitektūru un efektīvu 4 bitu apmācību NVIDIA Blackwell vidē.
Nemotron 3 Nano tagad ir pieejams Eiropā, izmantojot Hugging Face, publiskos mākoņus un kā NIM mikropakalpojums, ar 1 miljona tokenu logu.
Ekosistēma ir papildināta ar milzīgiem datu kopumiem, NeMo Gym, NeMo RL un Evaluator, lai apmācītu, noregulētu un auditētu suverēnus mākslīgā intelekta aģentus.

Nemotron 3 mākslīgā intelekta modelis

Sacensība mākslīgā intelekta jomā virzās no vienkāršiem, izolētiem tērzēšanas robotiem uz aģentu sistēmām, kas sadarbojas savā starpā, pārvalda garas darbplūsmas un kurām jābūt auditējamām. Šajā jaunajā scenārijā, NVIDIA ir nolēmusi spert diezgan skaidru soli: atvērt ne tikai modeļus, bet arī datus un rīkus.lai uzņēmumi, valsts pārvaldes iestādes un pētniecības centri varētu veidot savas mākslīgā intelekta platformas ar lielāku kontroli.

Šī kustība materializējas Nemotron 3, atvērto modeļu saime, kas paredzēta daudzaģentu mākslīgajam intelektam Tā mērķis ir apvienot augstu veiktspēju, zemas secinājumu izmaksas un pārredzamību. Priekšlikums nav paredzēts tikai kā vēl viens vispārējas nozīmes tērzēšanas robots, bet gan kā bāze, uz kuras izvietot aģentus, kas spriež, plāno un izpilda sarežģītus uzdevumus regulētās nozarēsTas ir īpaši aktuāli Eiropā un Spānijā, kur datu suverenitāte un atbilstība normatīvajiem aktiem ir svarīga.

Atvērta modeļu saime aģentīvam un suverēnam mākslīgajam intelektam

Nemotron 3 tiek prezentēts kā pilnīga ekosistēma: modeļi, datu kopas, bibliotēkas un apmācības receptes saskaņā ar atvērtajām licencēm. NVIDIA ideja ir tāda, ka organizācijas ne tikai patērē mākslīgo intelektu kā necaurspīdīgu pakalpojumu, bet arī var pārbaudīt tā saturu, pielāgot modeļus savām jomām un izvietot tos savā infrastruktūrā — vai nu mākonī, vai vietējos datu centros.

Uzņēmums veido šo stratēģiju atbilstoši savām saistībām Suverēns AIValdības un uzņēmumi Eiropā, Dienvidkorejā un citos reģionos meklē atvērtas alternatīvas slēgtām vai ārvalstu sistēmām, kas bieži vien neatbilst to datu aizsardzības likumiem vai audita prasībām. Nemotron 3 mērķis ir būt tehniskajam pamatam, uz kura veidot nacionālus, nozaru vai korporatīvus modeļus ar lielāku pārredzamību un kontroli.

Paralēli, NVIDIA nostiprina savas pozīcijas ārpus aparatūrasLīdz šim tas galvenokārt bija atsauces GPU nodrošinātājs; ar Nemotron 3 tas sevi pozicionē arī modelēšanas un apmācības rīku slānī, tiešāk konkurējot ar tādiem spēlētājiem kā OpenAI, Google, Anthropic vai pat Meta, un ar premium modeļiem, piemēram, SuperGrok HeavyMeta pēdējās Llama paaudzēs ir samazinājusi savu apņemšanos attiecībā uz atvērtā pirmkoda programmatūru.

Eiropas pētniecības un jaunuzņēmumu ekosistēmai, kas ir ļoti atkarīga no atvērtiem modeļiem, kas tiek mitināti tādās platformās kā Hugging Face, svaru, sintētisko datu un bibliotēku pieejamība saskaņā ar atvērtajām licencēm ir spēcīga alternatīva Ķīniešu modeļi un amerikāņi, kas dominē popularitātes un etalonu reitingos.

Ekskluzīvs saturs — noklikšķiniet šeit Microsoft Store neatveras vai tiek pastāvīgi aizvērts: detalizēti risinājumi

Hibrīda MoE arhitektūra: efektivitāte liela mēroga aģentiem

Nemotron 3 galvenā tehniskā iezīme ir Latentas ekspertu kombinācijas (MoE) hibrīdarhitektūraTā vietā, lai katrā secinājumā aktivizētu visus modeļa parametrus, tiek ieslēgta tikai daļa no tiem — ekspertu apakškopa, kas ir visatbilstošākā attiecīgajam uzdevumam vai marķierim.

Šī pieeja ļauj ievērojami samazināt skaitļošanas izmaksas un atmiņas patēriņuTas arī palielina marķieru caurlaidspēju. Vairāku aģentu arhitektūrās, kur desmitiem vai simtiem aģentu nepārtraukti apmainās ar ziņojumiem, šī efektivitāte ir galvenais, lai novērstu sistēmas neilgtspējību GPU un mākoņa izmaksu ziņā.

Saskaņā ar NVIDIA un neatkarīgu etalonu datiem, Nemotron 3 Nano sasniedz līdz pat četrām reizēm vairāk žetonu sekundē Salīdzinot ar tā priekšgājēju Nemotron 2 Nano, tas samazina nevajadzīgu spriešanas žetonu ģenerēšanu par aptuveni 60 %. Praksē tas nozīmē tikpat vai pat precīzākas atbildes, bet ar mazāku "vārdu garumu" un zemākām izmaksām par vaicājumu.

Hibrīda MoE arhitektūra apvienojumā ar īpašām apmācības metodēm ir novedusi pie Daudzi no vismodernākajiem atvērtajiem modeļiem izmanto ekspertu shēmas.Nemotron 3 pievienojas šai tendencei, bet īpaši koncentrējas uz aģentu mākslīgo intelektu: iekšējie maršruti, kas paredzēti koordinācijai starp aģentiem, rīku izmantošanai, garu stāvokļu apstrādei un pakāpeniskai plānošanai.

Trīs izmēri: Nano, Super un Ultra dažādām darba slodzēm

Nemotron 3 modeļa arhitektūra

Nemotron 3 saime ir organizēta šādi: Trīs galvenie Izglītības ministrijas modeļa izmēri, visi no tiem ir atvērti un ar samazinātiem aktīvajiem parametriem, pateicoties ekspertu arhitektūrai:

Nemotron 3 Nanoaptuveni 30.000 miljardi parametru kopā, ar aptuveni 3.000 miljardi aktīvu uz vienu žetonuTas ir paredzēts mērķtiecīgiem uzdevumiem, kuros svarīga ir efektivitāte: programmatūras atkļūdošana, dokumentu apkopošana, informācijas izguve, sistēmas uzraudzība vai specializēti mākslīgā intelekta asistenti.
Nemotron 3 Superaptuveni 100.000 miljardi parametru ar 10.000 miljardi aktīvu ik uz soļa. Tas ir vērsts uz Paplašināta spriešana daudzaģentu arhitektūrāsar zemu latentumu pat tad, ja vairāki aģenti sadarbojas, lai atrisinātu sarežģītas plūsmas.
Nemotron 3 Ultraaugšējais līmenis ar aptuveni 500.000 miljardiem parametru un līdz pat 50.000 miljardi aktīvu uz vienu žetonuTas darbojas kā spēcīgs spriešanas dzinējspēks pētniecībai, stratēģiskajai plānošanai, augsta līmeņa lēmumu atbalstam un īpaši prasīgām mākslīgā intelekta sistēmām.

Praksē tas ļauj organizācijām Izvēlieties modeļa izmēru atbilstoši savam budžetam un prasībāmNano — paredzēts lielām, intensīvām darba slodzēm un ierobežotām izmaksām; Super — paredzēts, ja nepieciešams dziļāks spriešanas process ar daudziem sadarbības aģentiem; un Ultra — paredzēts gadījumiem, kad kvalitāte un garš konteksts atsver GPU izmaksas.

Ekskluzīvs saturs — noklikšķiniet šeit TAG Heuer Connected Caliber E5: lēciens uz patentētu programmatūru un New Balance izdevumu

Tagad Tikai Nemotron 3 Nano ir pieejams tūlītējai lietošanai.Super un Ultra varianti ir plānoti 2026. gada pirmajā pusē, dodot Eiropas uzņēmumiem un laboratorijām laiku vispirms eksperimentēt ar Nano, izveidot cauruļvadus un vēlāk migrēt gadījumus, kuriem nepieciešama lielāka jauda.

Nemotron 3 Nano: 1 miljona žetonu logs un ierobežotas izmaksas

Nemotron 3 Nano, sākot ar šodienu, ir ģimenes praktiskais līderisNVIDIA to raksturo kā skaitļošanas ziņā izmaksu ziņā visefektīvāko modeli šajā klāstā, kas ir optimizēts, lai nodrošinātu maksimālu veiktspēju vairāku aģentu darbplūsmās un intensīvos, bet atkārtotos uzdevumos.

Starp tā tehniskajām īpašībām izceļas šādas īpašības: konteksta logs līdz vienam miljonam žetonuTas ļauj saglabāt atmiņā plašus dokumentus, veselus koda krātuves vai daudzpakāpju biznesa procesus. Eiropas lietojumprogrammām banku, veselības aprūpes vai valsts pārvaldes jomā, kur ierakstu apjoms var būt liels, šī ilgtermiņa konteksta iespēja ir īpaši vērtīga.

Neatkarīgās organizācijas kritēriji Mākslīgā analīze Nemotron 3 Nano ierindo kā vienu no līdzsvarotākajiem atvērtā koda modeļiem. Tas apvieno intelektu, precizitāti un ātrumu ar caurlaidspēju simtiem žetonu sekundē. Šī kombinācija padara to pievilcīgu mākslīgā intelekta integratoriem un pakalpojumu sniedzējiem Spānijā, kuriem nepieciešama laba lietotāja pieredze bez strauji augošām infrastruktūras izmaksām.

Runājot par lietošanas gadījumiem, NVIDIA mērķē uz Nano. Satura kopsavilkums, programmatūras atkļūdošana, informācijas izguve un uzņēmuma mākslīgā intelekta palīgiPateicoties lieko spriešanas žetonu samazināšanai, ir iespējams palaist aģentus, kas uztur ilgas sarunas ar lietotājiem vai sistēmām, strauji nepalielinot secinājumu izmaksas.

Atvērtie dati un bibliotēkas: NeMo Gym, NeMo RL un Evaluator

NeMo bibliotēkas

Viena no Nemotron 3 raksturīgākajām iezīmēm ir tā, ka Tas neaprobežojas tikai ar modeļu svaru izlaišanuNVIDIA papildina saimi ar visaptverošu atvērto resursu komplektu aģentu apmācībai, regulēšanai un novērtēšanai.

No vienas puses, tas padara pieejamu sintētisku korpusu vairāki triljoni žetonu pirmsapmācības, pēcapmācības un pastiprināšanas datuŠie datu kopumi, kas koncentrējas uz spriešanu, kodēšanu un daudzpakāpju darbplūsmām, ļauj uzņēmumiem un pētniecības centriem ģenerēt savas jomai specifiskas Nemotrona variantus (piemēram, juridiskos, veselības aprūpes vai rūpniecības), nesākot no nulles.

Starp šiem resursiem izceļas sekojošais: Nemotron Agentic drošības datu kopaTā apkopo telemetrijas datus par aģentu uzvedību reālās pasaules situācijās. Tās mērķis ir palīdzēt komandām izmērīt un stiprināt sarežģītu autonomo sistēmu drošību: sākot ar darbībām, ko aģents veic, saskaroties ar sensitīviem datiem, līdz pat reakcijai uz neskaidrām vai potenciāli kaitīgām komandām.

Ekskluzīvs saturs — noklikšķiniet šeit Jaunākās Windows 11 funkcijas: mākslīgais intelekts un jauni datora pārvaldības veidi

Runājot par rīku sadaļu, NVIDIA laiž klajā… NeMo Gym un NeMo RL kā atvērtā pirmkoda bibliotēkas pastiprināšanas apmācībai un pēcapmācībai, kā arī NeMo Evaluator drošības un veiktspējas novērtēšanai. Šīs bibliotēkas nodrošina lietošanai gatavas simulācijas vides un cauruļvadus ar Nemotron saimi, bet tās var paplašināt uz citiem modeļiem.

Viss šis materiāls — svari, datu kopas un kods — tiek izplatīts, izmantojot GitHub un Hugging Face ir licencēti saskaņā ar NVIDIA Open Model License.lai Eiropas komandas to varētu nemanāmi integrēt savās MLOp darbībās. Uzņēmumi, piemēram, Prime Intellect un Unsloth, jau integrē NeMo Gym tieši savās darbplūsmās, lai vienkāršotu pastiprinājuma mācīšanos Nemotron platformā.

Pieejamība publiskajos mākoņos un Eiropas ekosistēmā

Nemotron 3 Nano apskaujošā seja

Nemotron 3 Nano tagad ir pieejams vietnē Apskāviena seja y GitHubkā arī izmantojot secinājumu sniedzējus, piemēram, Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter un Together AI. Tas paver iespējas izstrādes komandām Spānijā testēt modeli, izmantojot API, vai izvietot to savās infrastruktūrās bez pārmērīgas sarežģītības.

Mākoņu frontē Nemotron 3 Nano pievienojas AWS, izmantojot Amazon Bedrock bezserveru secinājumiem un ir paziņojis par atbalstu Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale un Yotta. Eiropas organizācijām, kas jau strādā uz šīm platformām, tas atvieglo Nemotron ieviešanu bez krasām izmaiņām to arhitektūrā.

Papildus publiskajam mākonim NVIDIA veicina Nemotron 3 Nano izmantošanu kā NIM mikropakalpojums, ko var izvietot jebkurā NVIDIA paātrinātā infrastruktūrāTas pieļauj hibrīdscenārijus: daļa slodzes starptautiskos mākoņos un daļa vietējos datu centros vai Eiropas mākoņos, kuros prioritāte ir datu glabātuve ES.

Versijas Nemotron 3 Super un Ultra, kas ir orientēti uz ārkārtīgi lielām spriešanas darba slodzēm un liela mēroga daudzaģentu sistēmām, ir plānots 2026. gada pirmajā pusēŠis laika grafiks dod Eiropas pētniecības un biznesa ekosistēmai laiku eksperimentēt ar Nano, validēt lietošanas gadījumus un vajadzības gadījumā izstrādāt migrācijas stratēģijas uz lielākiem modeļiem.

Nemotron 3 pozicionē NVIDIA kā vienu no vadošajiem pakalpojumu sniedzējiem. augstas klases atvērtie modeļi, kas orientēti uz aģentūru mākslīgo intelektuAr priekšlikumu, kas apvieno tehnisko efektivitāti (hibrīda Izglītības ministrija, NVFP4, masveida konteksts), atvērtību (svari, datu kopas un pieejamās bibliotēkas) un skaidru uzsvaru uz datu suverenitāti un pārredzamību – aspektiem, kas ir īpaši jutīgi Spānijā un pārējā Eiropā, kur regulējums un spiediens uz mākslīgā intelekta auditu kļūst arvien lielāks.

saistīto rakstu:

Microsoft Discovery AI veicina zinātniskus un izglītojošus sasniegumus ar personalizētu mākslīgo intelektu

Alberto navarro

Esmu tehnoloģiju entuziasts, kurš savas "geek" intereses ir pārvērtis profesijā. Es esmu pavadījis vairāk nekā 10 gadus no savas dzīves, izmantojot jaunākās tehnoloģijas un tīri ziņkārības vadīts ar visu veidu programmām. Tagad esmu specializējies datortehnoloģijās un videospēlēs. Tas ir tāpēc, ka vairāk nekā 5 gadus esmu rakstījis dažādām tīmekļa vietnēm par tehnoloģijām un videospēlēm, veidojot rakstus, kuru mērķis ir sniegt jums nepieciešamo informāciju ikvienam saprotamā valodā.

Ja jums ir kādi jautājumi, manas zināšanas svārstās no visa, kas saistīts ar Windows operētājsistēmu, kā arī Android mobilajiem tālruņiem. Un mana apņemšanās ir jums, es vienmēr esmu gatavs veltīt dažas minūtes un palīdzēt jums atrisināt visus jautājumus, kas jums varētu rasties šajā interneta pasaulē.