Nemotron 3: Marele pariu deschis al NVIDIA pentru inteligența artificială multi-agent

Ultima actualizare: 17/12/2025

  • Nemotron 3 este o familie deschisă de modele, date și biblioteci axate pe inteligența artificială agentivă și sistemele multi-agent.
  • Include trei dimensiuni MoE (Nano, Super și Ultra) cu arhitectură hibridă și antrenament eficient pe 4 biți pe NVIDIA Blackwell.
  • Nemotron 3 Nano este acum disponibil în Europa prin Hugging Face, cloud public și ca microserviciu NIM, cu o fereastră de 1 milion de token-uri.
  • Ecosistemul este completat cu seturi masive de date, NeMo Gym, NeMo RL și Evaluator pentru antrenarea, reglarea și auditarea agenților IA suverani.

Modelul de inteligență artificială Nemotron 3

Cursa pentru inteligența artificială se mută de la chatboți simpli, izolați, la sisteme de agenți care colaborează între ei, gestionează fluxuri de lucru lungi și trebuie să fie auditabile. În acest nou scenariu, NVIDIA a decis să facă un pas destul de clar: să deschidă nu doar modele, ci și date și instrumente.astfel încât companiile, administrațiile publice și centrele de cercetare să își poată construi propriile platforme de inteligență artificială cu mai mult control.

Această mișcare se materializează în Nemotron 3, o familie de modele deschise orientate spre inteligența artificială multi-agent Acesta urmărește să combine performanța ridicată, costurile reduse ale inferenței și transparența. Propunerea nu este concepută ca un simplu chatbot de uz general, ci ca... o bază pe care să se desfășoare agenți care raționează, planifică și execută sarcini complexe în sectoare reglementateAcest lucru este relevant în special în Europa și Spania, unde suveranitatea datelor și conformitatea cu reglementările sunt importante.

O familie deschisă de modele pentru IA agentială și suverană

Nemotron 3 este prezentat ca un ecosistem complet: modele, seturi de date, biblioteci și rețete de antrenament sub licențe deschise. Ideea NVIDIA este ca organizațiile nu doar să consume inteligența artificială ca serviciu opac, ci să poată inspecta ce se află în interior, să adapteze modelele la domeniile lor și să le implementeze pe propria infrastructură, fie în cloud, fie în centre de date locale.

Compania își încadrează această strategie în angajamentul său de a AI suveranGuvernele și companiile din Europa, Coreea de Sud și alte regiuni caută alternative deschise la sistemele închise sau străine, care adesea nu se aliniază bine cu legile lor privind protecția datelor sau cu cerințele de audit. Nemotron 3 își propune să fie fundamentul tehnic pe care să se construiască modele naționale, sectoriale sau corporative cu o vizibilitate și un control sporite.

În paralel, NVIDIA își consolidează poziția dincolo de hardwarePână acum, a fost în primul rând un furnizor de GPU de referință; cu Nemotron 3, se poziționează și în stratul de instrumente de modelare și antrenament, concurând mai direct cu jucători precum OpenAI, Google, Anthropic sau chiar Meta, și împotriva modelelor premium precum SuperGrok HeavyMeta și-a redus angajamentul față de open source în generațiile recente de Llama.

Pentru ecosistemul european de cercetare și startup-uri – care se bazează în mare măsură pe modele deschise găzduite pe platforme precum Hugging Face – disponibilitatea ponderilor, a datelor sintetice și a bibliotecilor sub licențe deschise reprezintă o alternativă puternică la... modele chinezești și americani care domină clasamentele de popularitate și de referință.

Conținut exclusiv - Faceți clic aici  Microsoft Store nu se deschide sau se închide încontinuu: soluții detaliate

Arhitectură hibridă MoE: eficiență pentru agenți la scară largă

Caracteristica tehnică centrală a Nemotron 3 este Arhitectură hibridă a unui amestec latent de experți (MoE)În loc să se activeze toți parametrii modelului în fiecare inferență, doar o fracțiune dintre ei sunt activați, subsetul de experți cei mai relevanți pentru sarcina sau token-ul în cauză.

Această abordare permite reduce drastic costul de calcul și consumul de memorieAcest lucru crește, de asemenea, debitul tokenurilor. Pentru arhitecturile multi-agent, unde zeci sau sute de agenți schimbă continuu mesaje, această eficiență este esențială pentru a preveni nesustenabilitatea sistemului în ceea ce privește costurile GPU și cloud.

Conform datelor furnizate de NVIDIA și de teste de performanță independente, Nemotron 3 Nano atinge... de până la patru ori mai multe token-uri pe secundă Comparativ cu predecesorul său, Nemotron 2 Nano, acesta reduce generarea de jetoane de raționament inutile cu aproximativ 60%. În practică, aceasta înseamnă răspunsuri la fel de precise sau chiar mai precise, dar cu mai puțină „verbalitate” și un cost per interogare mai mic.

Arhitectura hibridă a Ministerului Educației, combinată cu tehnici specifice de instruire, a condus la Multe dintre cele mai avansate modele deschise adoptă scheme de expertNemotron 3 se alătură acestei tendințe, dar se concentrează în mod specific pe inteligența artificială agentivă: rute interne concepute pentru coordonarea între agenți, utilizarea instrumentelor, gestionarea stărilor lungi și planificarea pas cu pas.

Trei dimensiuni: Nano, Super și Ultra pentru diferite sarcini de lucru

Arhitectura modelului Nemotron 3

Familia Nemotron 3 este organizată în trei dimensiuni principale ale modelului MoE, toate deschise și cu parametri activi reduși datorită arhitecturii experte:

  • Nemotron 3 Nanoaproximativ 30.000 de miliarde de parametri totali, cu aproximativ 3.000 de miliarde de active per tokenEste conceput pentru sarcini specifice în care eficiența contează: depanare software, sumarizarea documentelor, regăsirea informațiilor, monitorizarea sistemului sau asistenți specializați în inteligență artificială.
  • Nemotron 3 Superaproximativ 100.000 de miliarde de parametri, cu 10.000 miliarde în active la fiecare pas. Este orientat către Raționament avansat în arhitecturi multi-agentcu latență redusă chiar și atunci când mai mulți agenți cooperează pentru a rezolva fluxuri complexe.
  • Nemotron 3 Ultranivelul superior, cu aproximativ 500.000 de miliarde de parametri și până la 50.000 de miliarde de active per tokenFuncționează ca un motor puternic de raționament pentru cercetare, planificare strategică, suport decizional la nivel înalt și sisteme de inteligență artificială deosebit de solicitante.

În practică, acest lucru permite organizațiilor Alegeți mărimea modelului în funcție de bugetul și cerințele dumneavoastrăNano pentru sarcini de lucru masive și intensive și costuri reduse; Super atunci când este nevoie de o profunzime mai mare a raționamentului cu mulți agenți colaboratori; și Ultra pentru cazurile în care calitatea și contextul lung depășesc costul GPU-ului.

Conținut exclusiv - Faceți clic aici  TAG Heuer Connected Calibre E5: saltul către software-ul proprietar și o ediție New Balance

Deocamdata Doar Nemotron 3 Nano este disponibil pentru utilizare imediată.Variantele Super și Ultra sunt planificate pentru prima jumătate a anului 2026, oferind companiilor și laboratoarelor europene timp să experimenteze mai întâi cu Nano, să stabilească proiecte în curs de dezvoltare și, ulterior, să migreze cazurile care necesită o capacitate mai mare.

Nemotron 3 Nano: fereastră de 1 milion de tokenuri și cost controlat

Nemotron 3 Nano

Nemotron 3 Nano este, începând de astăzi, vârful de lance practic al familieiNVIDIA îl descrie ca fiind cel mai eficient din punct de vedere al costurilor de calcul din gamă, optimizat pentru a oferi performanțe maxime în fluxuri de lucru cu mai mulți agenți și în sarcini intensive, dar repetitive.

Printre caracteristicile sale tehnice, se remarcă următoarele: fereastră contextuală de până la un milion de token-uriAcest lucru permite păstrarea memoriei pentru documente extinse, depozite de cod întregi sau procese de afaceri cu mai mulți pași. Pentru aplicațiile europene din domeniul bancar, al sănătății sau al administrației publice, unde înregistrările pot fi voluminoase, această capacitate de context pe termen lung este deosebit de valoroasă.

Reperele organizației independente Analiza artificială plasează Nemotron 3 Nano ca unul dintre cele mai echilibrate modele open-source Combină inteligența, precizia și viteza, cu rate de debit de ordinul sutelor de token-uri pe secundă. Această combinație îl face atractiv pentru integratorii de inteligență artificială și furnizorii de servicii din Spania, care au nevoie de o experiență bună pentru utilizatori, fără costuri exorbitante ale infrastructurii.

În ceea ce privește cazurile de utilizare, NVIDIA vizează Nano la Rezumatul conținutului, depanarea software-ului, recuperarea informațiilor și asistenți AI pentru întreprinderiDatorită reducerii numărului de token-uri de raționament redundante, este posibil să se ruleze agenți care mențin conversații lungi cu utilizatorii sau sistemele fără ca factura la inferențe să crească vertiginos.

Date deschise și biblioteci: NeMo Gym, NeMo RL și Evaluator

Biblioteci NeMo

Una dintre cele mai distinctive caracteristici ale Nemotron 3 este că Nu se limitează la publicarea ponderilor modeluluiNVIDIA însoțește familia cu o suită completă de resurse deschise pentru instruirea, optimizarea și evaluarea agenților.

Pe de o parte, pune la dispoziție un corpus sintetic de câteva trilioane de jetoane de date pre-antrenament, post-antrenament și de consolidareAceste seturi de date, axate pe raționament, codare și fluxuri de lucru în mai mulți pași, permit companiilor și centrelor de cercetare să genereze propriile variante specifice domeniului de Nemotron (de exemplu, juridic, medical sau industrial) fără a porni de la zero.

Printre aceste resurse, se remarcă următoarele: Set de date privind siguranța agenților NemotronColectează date telemetrice despre comportamentul agenților în scenarii din lumea reală. Scopul său este de a ajuta echipele să măsoare și să consolideze securitatea sistemelor autonome complexe: de la acțiunile întreprinse de un agent atunci când întâlnește date sensibile, până la modul în care reacționează la comenzi ambigue sau potențial dăunătoare.

Conținut exclusiv - Faceți clic aici  Cele mai recente funcții care vin în Windows 11: inteligență artificială și noi modalități de a gestiona PC-ul

În ceea ce privește secțiunea de instrumente, NVIDIA lansează NeMo Gym și NeMo RL ca biblioteci open source pentru antrenament de consolidare și post-antrenament, împreună cu NeMo Evaluator pentru evaluarea siguranței și performanței. Aceste biblioteci oferă medii de simulare și conducte gata de utilizare cu familia Nemotron, dar pot fi extinse la alte modele.

Toate aceste materiale — ponderi, seturi de date și cod — sunt distribuite prin GitHub și Hugging Face sunt licențiate sub licența NVIDIA Open Model.astfel încât echipele europene să îl poată integra perfect în propriile lor MLO-uri. Companii precum Prime Intellect și Unsloth încorporează deja NeMo Gym direct în fluxurile lor de lucru pentru a simplifica învățarea prin consolidare pe Nemotron.

Disponibilitatea în cloud-urile publice și în ecosistemul european

Nemotron 3 Nano Față Îmbrățișătoare

Nemotron 3 Nano este acum disponibil la Fata îmbrățișată y GitHubprecum și prin intermediul furnizorilor de inferențe precum Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter și Together AI. Acest lucru deschide calea echipelor de dezvoltare din Spania pentru a testa modelul prin API sau pentru a-l implementa pe propriile infrastructuri fără o complexitate excesivă.

Pe frontul norilor, Nemotron 3 Nano se alătură AWS prin intermediul Amazon Bedrock pentru inferențe fără server și a anunțat suport pentru Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale și Yotta. Pentru organizațiile europene care lucrează deja pe aceste platforme, acest lucru facilitează adoptarea Nemotron fără modificări drastice ale arhitecturii lor.

Pe lângă cloudul public, NVIDIA promovează utilizarea Nemotron 3 Nano ca Microserviciu NIM implementabil pe orice infrastructură accelerată de NVIDIAAcest lucru permite scenarii hibride: o parte din încărcătură în cloud-uri internaționale și o parte în centre de date locale sau în cloud-uri europene care prioritizează rezidența datelor în UE.

Versiuni Nemotron 3 Super și Ultra, orientate către sarcini de lucru extreme de raționament și sisteme multi-agent la scară largă, sunt planificat pentru prima jumătate a anului 2026Această cronologie oferă ecosistemului european de cercetare și afaceri timp pentru a experimenta cu Nano, a valida cazurile de utilizare și a concepe strategii de migrare către modele mai mari, atunci când este necesar.

Nemotron 3 poziționează NVIDIA ca unul dintre principalii furnizori de modele deschise de înaltă performanță orientate către inteligența artificială agentivăCu o propunere care combină eficiența tehnică (MoE hibrid, NVFP4, context masiv), deschiderea (pondere, seturi de date și biblioteci disponibile) și o concentrare clară pe suveranitatea și transparența datelor, aspecte deosebit de sensibile în Spania și în restul Europei, unde reglementarea și presiunea de a audita IA sunt din ce în ce mai mari.

Microsoft Discovery IA-2
Articol asociat:
Microsoft Discovery AI stimulează descoperiri științifice și educaționale cu ajutorul inteligenței artificiale personalizate