„Nemotron 3“: NVIDIA atviri modeliai daugiaagentiniam dirbtiniam intelektui

„Nemotron 3“ yra atvira modelių, duomenų ir bibliotekų šeima, skirta agentiniam dirbtiniam intelektui ir daugiaagentėms sistemoms.
Jame yra trys MoE dydžiai („Nano“, „Super“ ir „Ultra“) su hibridine architektūra ir efektyviu 4 bitų mokymu „NVIDIA Blackwell“ aplinkoje.
„Nemotron 3 Nano“ dabar galima įsigyti Europoje per „Hugging Face“, viešuosius debesis ir kaip NIM mikropaslaugą, o jo langas yra 1 milijonas žetonų.
Ekosistemą papildo didžiuliai duomenų rinkiniai, „NeMo Gym“, „NeMo RL“ ir „Evaluator“, skirti apmokyti, derinti ir audituoti suverenius dirbtinio intelekto agentus.

„Nemotron 3“ dirbtinio intelekto modelis

Dirbtinio intelekto lenktynės pereina nuo paprastų, izoliuotų pokalbių robotų prie agentinių sistemų, kurios bendradarbiauja tarpusavyje, valdo ilgus darbo eigą ir turi būti audituojamos. Šiame naujame scenarijuje, NVIDIA nusprendė žengti gana aiškų žingsnį: atverti ne tik modelius, bet ir duomenis bei įrankius.kad įmonės, viešojo administravimo institucijos ir tyrimų centrai galėtų kurti savo dirbtinio intelekto platformas su didesne kontrole.

Tas judėjimas materializuojasi „Nemotron 3“ – atvirų modelių šeima, skirta daugiaagentiniam dirbtiniam intelektui Juo siekiama suderinti aukštą našumą, mažas išvadų darymo išlaidas ir skaidrumą. Pasiūlymas nėra skirtas kaip dar vienas bendrosios paskirties pokalbių robotas, o kaip bazė, ant kurios dislokuoti agentus, kurie reguliuojamuose sektoriuose samprotauja, planuoja ir vykdo sudėtingas užduotisTai ypač aktualu Europoje ir Ispanijoje, kur svarbus duomenų suverenitetas ir atitiktis reglamentams.

Atvira agentinio ir suverenaus dirbtinio intelekto modelių šeima

„Nemotron 3“ pristatomas kaip visa ekosistema: modeliai, duomenų rinkiniai, bibliotekos ir mokymo receptai pagal atviras licencijas. NVIDIA idėja yra ta, kad organizacijos ne tik naudoja dirbtinį intelektą kaip neskaidrią paslaugą, bet ir gali patikrinti, kas yra viduje, pritaikyti modelius savo sritims ir diegti juos savo infrastruktūroje – debesyje arba vietiniuose duomenų centruose.

Bendrovė šią strategiją įgyvendina atsižvelgdama į savo įsipareigojimą Suvereni AIEuropos, Pietų Korėjos ir kitų regionų vyriausybės ir įmonės ieško atvirų alternatyvų uždaroms ar užsienio sistemoms, kurios dažnai neatitinka jų duomenų apsaugos įstatymų ar audito reikalavimų. „Nemotron 3“ siekia būti techniniu pagrindu, ant kurio būtų galima kurti nacionalinius, sektorinius ar įmonių modelius, užtikrinančius didesnį matomumą ir kontrolę.

Lygiagrečiai, NVIDIA stiprina savo pozicijas ne tik aparatinės įrangos srityjeIki šiol ji daugiausia buvo referencinių GPU tiekėja; su „Nemotron 3“ ji taip pat užima pozicijas modeliavimo ir mokymo įrankių lygmenyje, tiesiogiai konkuruodama su tokiais žaidėjais kaip „OpenAI“, „Google“, „Anthropic“ ar net „Meta“, ir su aukščiausios klasės modeliais, tokiais kaip SuperGrok Heavy„Meta“ sumažino savo įsipareigojimą atvirojo kodo programoms pastarosiose „Llama“ kartose.

Europos mokslinių tyrimų ir startuolių ekosistemai, kuri labai priklauso nuo atvirųjų modelių, talpinamų tokiose platformose kaip „Hugging Face“, svorių, sintetinių duomenų ir bibliotekų prieinamumas pagal atviras licencijas yra galinga alternatyva... kinų modeliai ir amerikiečiai, kurie dominuoja populiarumo ir etalonų reitinguose.

Išskirtinis turinys – spustelėkite čia „Microsoft Store“ neatsidaro arba nuolat užsidaro: išsamūs sprendimai

Hibridinė MoE architektūra: efektyvumas didelio masto agentams

Svarbiausias „Nemotron 3“ techninis bruožas yra Latentinio ekspertų mišinio hibridinė architektūra (MoE)Užuot aktyvavus visus modelio parametrus kiekvienoje išvadoje, įjungiama tik jų dalis – ekspertų pogrupis, labiausiai susijęs su atitinkama užduotimi ar žetonu.

Šis metodas leidžia drastiškai sumažinti skaičiavimo sąnaudas ir atminties sunaudojimąTai taip pat padidina žetonų pralaidumą. Daugiaagentėse architektūrose, kuriose dešimtys ar šimtai agentų nuolat keičiasi pranešimais, šis efektyvumas yra labai svarbus siekiant užkirsti kelią sistemos netvarumui GPU ir debesijos sąnaudų atžvilgiu.

Remiantis NVIDIA ir nepriklausomų etalonų duomenimis, „Nemotron 3 Nano“ pasiekia iki keturių kartų daugiau žetonų per sekundę Palyginti su savo pirmtaku „Nemotron 2 Nano“, jis sumažina nereikalingų samprotavimo žetonų generavimą apie 60 %. Praktiškai tai reiškia tokius pat ar net tikslesnius atsakymus, tačiau su mažiau „žodžių“ ir mažesne užklausos kaina.

Hibridinė MoE architektūra kartu su specifiniais mokymo metodais lėmė Daugelyje pažangiausių atvirųjų modelių naudojamos ekspertų schemos.„Nemotron 3“ prisijungia prie šios tendencijos, tačiau daugiausia dėmesio skiria agentiniam dirbtiniam intelektui: vidiniams maršrutams, skirtiems agentų koordinavimui, įrankių naudojimui, ilgų būsenų tvarkymui ir nuosekliam planavimui.

Trys dydžiai: „Nano“, „Super“ ir „Ultra“, skirti skirtingiems darbo krūviams

Nemotron 3 modelio architektūra

„Nemotron 3“ šeima yra suskirstyta į Trys pagrindiniai MoE modelio dydžiai, visi jie atviri ir su sumažintais aktyviais parametrais dėl ekspertų architektūros:

Nemotron 3 Nanoapie 30.000 milijardų parametrų, iš viso apie 3.000 milijardų aktyvų vienam žetonuiJis skirtas tikslinėms užduotims, kur svarbus efektyvumas: programinės įrangos derinimui, dokumentų apibendrinimui, informacijos paieškai, sistemos stebėjimui arba specializuotiems dirbtinio intelekto asistentams.
Nemotron 3 Supermaždaug 100.000 milijardų parametrų su 10.000 milijardų turto kiekviename žingsnyje. Jis skirtas Pažangus samprotavimas daugiaagentėse architektūrosesu mažu vėlavimu net kai keli agentai bendradarbiauja spręsdami sudėtingus srautus.
Nemotron 3 Ultra: viršutinis lygis, turintis maždaug 500.000 milijardų parametrų ir iki 50.000 milijardų aktyvų vienam žetonuiJis veikia kaip galingas samprotavimų variklis tyrimams, strateginiam planavimui, aukšto lygio sprendimų palaikymui ir ypač sudėtingoms dirbtinio intelekto sistemoms.

Praktiškai tai leidžia organizacijoms Pasirinkite modelio dydį pagal savo biudžetą ir poreikius„Nano“ – dideliems, intensyviems darbo krūviams ir mažoms išlaidoms; „Super“, kai reikia išsamesnio mąstymo su daugeliu bendradarbiaujančių agentų; ir „Ultra“ – atvejams, kai kokybė ir ilgas kontekstas nusveria GPU sąnaudas.

Išskirtinis turinys – spustelėkite čia „TAG Heuer Connected Caliber E5“: šuolis prie patentuotos programinės įrangos ir „New Balance“ leidimo

Dabar Tik „Nemotron 3 Nano“ galima naudoti nedelsiant.„Super“ ir „Ultra“ variantai planuojami 2026 m. pirmoje pusėje, suteikdami Europos įmonėms ir laboratorijoms laiko pirmiausia eksperimentuoti su „Nano“, sukurti gamybos srautus ir vėliau perkelti atvejus, kuriems reikia didesnių pajėgumų.

„Nemotron 3 Nano“: 1 milijono žetonų langas ir ribotos išlaidos

„Nemotron 3 Nano“ nuo šiandien yra praktinis šeimos lyderis„NVIDIA“ jį apibūdina kaip skaičiavimo požiūriu ekonomiškiausią modelį šiame asortimente, optimizuotą maksimaliam našumui užtikrinti daugiaagentėse darbo eigose ir intensyviose, bet pasikartojančiose užduotyse.

Tarp techninių savybių išsiskiria šios savybės: kontekstinis langas iki vieno milijono žetonųTai leidžia išsaugoti atmintyje didelius dokumentus, ištisas kodų saugyklas arba daugiapakopius verslo procesus. Europos bankininkystės, sveikatos priežiūros ar viešojo administravimo srityse, kur įrašų gali būti daug, ši ilgalaikio konteksto galimybė yra ypač vertinga.

Nepriklausomos organizacijos kriterijai Dirbtinė analizė „Nemotron 3 Nano“ laiko vienu subalansuotų atvirojo kodo modelių. Jis pasižymi intelektu, tikslumu ir greičiu, o pralaidumas siekia šimtus žetonų per sekundę. Šis derinys daro jį patrauklų dirbtinio intelekto integratoriams ir paslaugų teikėjams Ispanijoje, kuriems reikia geros naudotojo patirties be didelių infrastruktūros išlaidų.

Kalbant apie naudojimo atvejus, NVIDIA taikosi į „Nano“ Turinio santrauka, programinės įrangos derinimas, informacijos paieška ir įmonės dirbtinio intelekto asistentaiSumažinus nereikalingų samprotavimo žetonų skaičių, galima paleisti agentus, kurie palaiko ilgus pokalbius su vartotojais ar sistemomis, o išvadų sąskaitų dydis neišauga.

Atviri duomenys ir bibliotekos: „NeMo Gym“, „NeMo RL“ ir „Evaluator“

NeMo bibliotekos

Vienas išskirtiniausių „Nemotron 3“ bruožų yra tas, kad Tai neapsiriboja vien modelių svorių išleidimu„NVIDIA“ lydi šeimą teikdama išsamų atvirų išteklių rinkinį, skirtą agentų mokymui, derinimui ir vertinimui.

Viena vertus, tai suteikia prieigą prie sintetinio korpuso keli trilijonai žetonų prieš mokymą, po mokymo ir sustiprinimo duomenųŠie duomenų rinkiniai, orientuoti į samprotavimus, kodavimą ir daugiapakopius darbo eigą, leidžia įmonėms ir tyrimų centrams generuoti savo sričiai būdingus „Nemotron“ variantus (pvz., teisinius, sveikatos priežiūros ar pramonės) nepradedant nuo nulio.

Tarp šių išteklių išsiskiria šie: „Nemotron Agentic Safety“ duomenų rinkinysJis renka telemetrijos duomenis apie agentų elgesį realiose situacijose. Jo tikslas – padėti komandoms įvertinti ir sustiprinti sudėtingų autonominių sistemų saugumą: nuo veiksmų, kuriuos agentas atlieka susidūręs su jautriais duomenimis, iki reakcijos į dviprasmiškas ar potencialiai žalingas komandas.

Išskirtinis turinys – spustelėkite čia Naujausios „Windows 11“ funkcijos: dirbtinis intelektas ir nauji kompiuterio valdymo būdai

Kalbant apie įrankių skyrių, NVIDIA pradeda „NeMo Gym“ ir „NeMo RL“ kaip atvirojo kodo bibliotekos sustiprintiems mokymams ir po jų, kartu su „NeMo Evaluator“ saugos ir našumo vertinimui. Šios bibliotekos teikia paruoštas naudoti modeliavimo aplinkas ir srautus su „Nemotron“ šeima, tačiau jas galima išplėsti ir kitiems modeliams.

Visa ši medžiaga – svoriai, duomenų rinkiniai ir kodas – yra platinami per „GitHub“ ir „Hugging Face“ licencijuojami pagal „NVIDIA Open Model License“.kad Europos komandos galėtų sklandžiai integruoti ją į savo MLOp procesus. Tokios įmonės kaip „Prime Intellect“ ir „Unsloth“ jau tiesiogiai integruoja „NeMo Gym“ į savo darbo eigas, siekdamos supaprastinti sustiprintą mokymąsi „Nemotron“ platformoje.

Prieinamumas viešuosiuose debesyse ir Europos ekosistemoje

„Nemotron 3 Nano“ apkabinantis veidas

„Nemotron 3 Nano“ dabar galima įsigyti adresu Apsikabinęs veidas y GitHubtaip pat per išvadų teikėjus, tokius kaip „Baseten“, „DeepInfra“, „Fireworks“, „FriendliAI“, „OpenRouter“ ir „Together AI“. Tai atveria duris Ispanijos kūrimo komandoms išbandyti modelį per API arba diegti jį savo infrastruktūrose be pernelyg didelio sudėtingumo.

Debesų fronte, „Nemotron 3 Nano“ prisijungia prie AWS per „Amazon Bedrock“ beserverėms išvados ir paskelbė palaikanti „Google Cloud“, „CoreWeave“, „Crusoe“, „Microsoft Foundry“, „Nebius“, „Nscale“ ir „Yotta“. Europos organizacijoms, jau dirbančioms su šiomis platformomis, tai leidžia lengviau diegti „Nemotron“ be drastiškų architektūros pakeitimų.

Be viešojo debesies, NVIDIA skatina „Nemotron 3 Nano“ naudojimą kaip NIM mikropaslauga, diegiama bet kurioje NVIDIA spartintoje infrastruktūrojeTai leidžia taikyti hibridinius scenarijus: dalis apkrovos tarptautiniuose debesyse, o dalis – vietiniuose duomenų centruose arba Europos debesyse, kuriuose pirmenybė teikiama duomenų laikymui ES.

Versijos „Nemotron 3 Super“ ir „Ultra“, orientuotos į didelius mąstymo darbo krūvius ir didelio masto daugiaagentes sistemas, yra planuojama 2026 m. pirmąjį pusmetįŠis terminas suteikia Europos mokslinių tyrimų ir verslo ekosistemai laiko eksperimentuoti su nanotechnologijomis, patvirtinti naudojimo atvejus ir prireikus parengti migracijos į didesnius modelius strategijas.

„Nemotron 3“ leidžia NVIDIAi tapti viena iš pirmaujančių tiekėjų. aukštos klasės atviri modeliai, orientuoti į agentinį DIPasiūlymu, kuris apjungia techninį efektyvumą (hibridinis Švietimo ministerijos (ŠMM), NVFP4, masinis kontekstas), atvirumą (svorius, duomenų rinkinius ir prieinamas bibliotekas) ir aiškų dėmesį duomenų suverenitetui bei skaidrumui – aspektus, kurie yra ypač jautrūs Ispanijoje ir likusioje Europoje, kur reguliavimas ir spaudimas audituoti dirbtinį intelektą vis didėja.

Susijęs straipsnis:

„Microsoft Discovery AI“ skatina mokslinius ir edukacinius proveržius naudodama suasmenintą dirbtinį intelektą

Alberto navarro

Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.

Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.