Nemotron 3: Bast i madh i hapur i NVIDIA-s për IA me shumë agjentë

Përditësimi i fundit: 17/12/2025

  • Nemotron 3 është një familje e hapur modelesh, të dhënash dhe bibliotekash të fokusuara në IA agjentike dhe sistemet shumë-agjente.
  • Përfshin tre madhësi MoE (Nano, Super dhe Ultra) me arkitekturë hibride dhe trajnim efikas 4-bit në NVIDIA Blackwell.
  • Nemotron 3 Nano është tani i disponueshëm në Evropë nëpërmjet Hugging Face, cloud-eve publike dhe si një mikroshërbim NIM, me një dritare prej 1 milion token-ash.
  • Ekosistemi është i kompletuar me grupe të dhënash masive, NeMo Gym, NeMo RL dhe Evaluator për të trajnuar, akorduar dhe audituar agjentët sovranë të IA-së.

Modeli i Inteligjencës Artificiale Nemotron 3

Gara për inteligjencën artificiale po zhvendoset nga chatbot-e të thjeshtë dhe të izoluar në sisteme agjentësh që bashkëpunojnë me njëri-tjetrin, menaxhojnë rrjedha të gjata pune dhe duhet të jenë të auditueshme. Në këtë skenar të ri, NVIDIA ka vendosur të ndërmarrë një hap mjaft të qartë: të hapë jo vetëm modelet, por edhe të dhënat dhe mjetetnë mënyrë që kompanitë, administratat publike dhe qendrat kërkimore të mund të ndërtojnë platformat e tyre të inteligjencës artificiale me më shumë kontroll.

Kjo lëvizje materializohet në Nemotron 3, një familje modelesh të hapura të orientuara drejt inteligjencës artificiale me shumë agjentë Ai synon të kombinojë performancën e lartë, kostot e ulëta të nxjerrjes së përfundimeve dhe transparencën. Propozimi nuk është menduar si një tjetër chatbot për qëllime të përgjithshme, por si një bazë mbi të cilën mund të vendosen agjentë që arsyetojnë, planifikojnë dhe ekzekutojnë detyra komplekse në sektorët e rregulluarKjo është veçanërisht e rëndësishme në Evropë dhe Spanjë, ku sovraniteti i të dhënave dhe përputhshmëria rregullatore janë të rëndësishme.

Një familje e hapur modelesh për IA agjente dhe sovrane

Nemotron 3 paraqitet si një ekosistem i plotë: modele, grupe të dhënash, biblioteka dhe receta trajnimi sipas licencave të hapura. Ideja e NVIDIA-s është që organizatat jo vetëm që konsumojnë IA-në si një shërbim të errët, por mund të inspektojnë atë që ndodhet brenda, t'i përshtatin modelet në domenet e tyre dhe t'i vendosin ato në infrastrukturën e tyre, qoftë në cloud apo në qendrat lokale të të dhënave.

Kompania e përafron këtë strategji brenda angazhimit të saj për të AI sovraneQeveritë dhe kompanitë në Evropë, Korenë e Jugut dhe rajone të tjera po kërkojnë alternativa të hapura ndaj sistemeve të mbyllura ose të huaja, të cilat shpesh nuk përputhen mirë me ligjet e tyre për mbrojtjen e të dhënave ose kërkesat e auditimit. Nemotron 3 synon të jetë themeli teknik mbi të cilin do të ndërtohen modele kombëtare, sektoriale ose të korporatave me dukshmëri dhe kontroll më të madh.

Paralelisht, NVIDIA forcon pozicionin e saj përtej pajisjeveDeri më tani, ishte kryesisht një ofrues reference i GPU-ve; me Nemotron 3, ai gjithashtu pozicionohet në shtresën e mjeteve të modelimit dhe trajnimit, duke konkurruar më drejtpërdrejt me lojtarë si OpenAI, Google, Anthropic, apo edhe Meta, dhe kundër modeleve premium si SuperGrok HeavyMeta ka zvogëluar angazhimin e saj ndaj kodit të hapur në gjeneratat e fundit të Llama-s.

Për ekosistemin evropian të kërkimit dhe startup-eve - i cili mbështetet shumë në modelet e hapura të vendosura në platforma si Hugging Face - disponueshmëria e peshave, të dhënave sintetike dhe bibliotekave sipas licencave të hapura përfaqëson një alternativë të fuqishme ndaj... Modele kineze dhe amerikanët që dominojnë popullaritetin dhe renditjen e pikëve të referimit.

Përmbajtje ekskluzive - Kliko këtu  Microsoft Store nuk hapet ose mbyllet vazhdimisht: zgjidhje të hollësishme

Arkitektura hibride e MoE: efikasitet për agjentë në shkallë të gjerë

Karakteristika kryesore teknike e Nemotron 3 është një Arkitektura hibride e përzierjes latente të ekspertëve (MoE)Në vend që të aktivizohen të gjithë parametrat e modelit në secilin përfundim, vetëm një pjesë e tyre aktivizohet, nëngrupi i ekspertëve më të rëndësishëm për detyrën ose tokenin në fjalë.

Kjo qasje lejon ul ndjeshëm koston llogaritëse dhe konsumin e memoriesKjo gjithashtu rrit rendimentin e token-ave. Për arkitekturat me shumë agjentë, ku dhjetëra ose qindra agjentë shkëmbejnë vazhdimisht mesazhe, kjo efikasitet është thelbësor për të parandaluar që sistemi të bëhet i paqëndrueshëm për sa i përket kostove të GPU-së dhe cloud-it.

Sipas të dhënave të ndara nga NVIDIA dhe teste të pavarura, Nemotron 3 Nano arrin deri në katër herë më shumë tokena për sekondë Krahasuar me paraardhësin e tij, Nemotron 2 Nano, ai zvogëlon gjenerimin e tokenëve të panevojshëm të arsyetimit me rreth 60%. Në praktikë, kjo do të thotë përgjigje po aq ose edhe më të sakta, por me më pak "fjalëzim" dhe një kosto më të ulët për pyetje.

Arkitektura hibride e MoE-së, e kombinuar me teknika specifike trajnimi, ka çuar në Shumë nga modelet më të përparuara të hapura përdorin skema ekspertësh.Nemotron 3 i bashkohet këtij trendi, por përqendrohet posaçërisht në IA-në agjentike: rrugë të brendshme të dizajnuara për koordinim midis agjentëve, përdorimin e mjeteve, trajtimin e gjendjeve të gjata dhe planifikimin hap pas hapi.

Tre madhësi: Nano, Super dhe Ultra për ngarkesa të ndryshme pune

Arkitektura e modelit Nemotron 3

Familja Nemotron 3 është e organizuar në tre madhësi kryesore të modelit të MoE-së, të gjitha të hapura dhe me parametra aktivë të reduktuar falë arkitekturës së ekspertëve:

  • Nemotron 3 Nanorreth 30.000 miliardë parametra gjithsej, me rreth 3.000 miliardë asete për tokenËshtë projektuar për detyra të synuara ku efikasiteti ka rëndësi: debugging i softuerit, përmbledhje e dokumenteve, rikthim informacioni, monitorim i sistemit ose asistentë të specializuar të IA-së.
  • Nemotron 3 Super: afërsisht 100.000 miliardë parametra, me 10.000 miliardë në asete në çdo hap. Është e orientuar drejt Arsyetim i avancuar në arkitekturat me shumë agjentëme latencë të ulët edhe kur agjentë të shumtë bashkëpunojnë për të zgjidhur rrjedha komplekse.
  • Nemotron 3 Ultraniveli i sipërm, me afërsisht 500.000 miliardë parametra dhe deri në 50.000 miliardë asete për tokenAi funksionon si një motor i fuqishëm arsyetimi për kërkimin, planifikimin strategjik, mbështetjen e vendimeve të nivelit të lartë dhe sistemet e inteligjencës artificiale që kërkojnë shumë vëmendje.

Në praktikë, kjo u lejon organizatave Zgjidhni madhësinë e modelit sipas buxhetit dhe nevojave tuajaNano për ngarkesa pune masive dhe intensive dhe kosto të ulëta; Super kur nevojitet më shumë thellësi arsyetimi me shumë agjentë bashkëpunues; dhe Ultra për rastet kur cilësia dhe konteksti i gjatë tejkalojnë koston e GPU-së.

Përmbajtje ekskluzive - Kliko këtu  TAG Heuer Connected Calibre E5: kalimi drejt softuerit të patentuar dhe një edicioni New Balance

Për tani Vetëm Nemotron 3 Nano është i disponueshëm për përdorim të menjëhershëm.Variantet Super dhe Ultra janë planifikuar për gjysmën e parë të vitit 2026, duke u dhënë kompanive dhe laboratorëve evropianë kohë për të eksperimentuar së pari me Nano, për të krijuar tubacione dhe, më vonë, për të migruar rastet që kërkojnë kapacitet më të madh.

Nemotron 3 Nano: dritare prej 1 milion tokenësh dhe kosto e përmbajtur

Nemotron 3 Nano

Nemotron 3 Nano është, që nga sot, maja praktike e familjesNVIDIA e përshkruan atë si modelin më efikas në aspektin llogaritës të kostos në gamën e tij, të optimizuar për të ofruar performancë maksimale në flukset e punës me shumë agjentë dhe detyrat intensive, por të përsëritura.

Ndër karakteristikat e tij teknike, dallohen këto: dritare konteksti me deri në një milion tokenaKjo lejon ruajtjen e kujtesës për dokumente të gjera, depo të tëra kodi ose procese biznesi me shumë hapa. Për aplikimet evropiane në banka, kujdes shëndetësor ose administratë publike, ku të dhënat mund të jenë voluminoze, kjo aftësi e kontekstit afatgjatë është veçanërisht e vlefshme.

Standardet e organizatës së pavarur Analiza artificiale e vendos Nemotron 3 Nano si një nga modelet më të balancuara me burim të hapur. Kombinon inteligjencën, saktësinë dhe shpejtësinë, me shkallë përpunimi në qindra tokena për sekondë. Ky kombinim e bën atë tërheqës për integruesit e inteligjencës artificiale dhe ofruesit e shërbimeve në Spanjë, të cilët kanë nevojë për një përvojë të mirë përdoruesi pa rritur ndjeshëm kostot e infrastrukturës.

Për sa i përket rasteve të përdorimit, NVIDIA synon Nano në Përmbledhje e përmbajtjes, debugging i softuerit, rikthim informacioni dhe asistentë të inteligjencës artificiale të ndërmarrjesFalë reduktimit të tokenëve të tepërt të arsyetimit, është e mundur të ekzekutohen agjentë që mbajnë biseda të gjata me përdoruesit ose sistemet pa u rritur ndjeshëm kostot e nxjerrjes së përfundimeve.

Të dhëna dhe biblioteka të hapura: NeMo Gym, NeMo RL dhe Evaluator

Bibliotekat NeMo

Një nga karakteristikat më dalluese të Nemotron 3 është se Nuk kufizohet vetëm në publikimin e peshave të modelitNVIDIA shoqëron familjen me një suitë gjithëpërfshirëse burimesh të hapura për trajnimin, akordimin dhe vlerësimin e agjentëve.

Nga njëra anë, ajo vë në dispozicion një korpus sintetik të disa trilionë tokena të të dhënave para-trajnimit, pas-trajnimit dhe përforcimitKëto grupe të dhënash, të përqendruara në arsyetim, kodim dhe rrjedha pune me shumë hapa, u lejojnë kompanive dhe qendrave kërkimore të gjenerojnë variantet e tyre specifike të Nemotron për domenin (p.sh., ligjore, të kujdesit shëndetësor ose industriale) pa filluar nga e para.

Midis këtyre burimeve, dallohen sa vijon: Seti i të dhënave të sigurisë së agjentit NemotronAi mbledh të dhëna telemetrike mbi sjelljen e agjentëve në skenarë të botës reale. Qëllimi i tij është të ndihmojë ekipet të matin dhe forcojnë sigurinë e sistemeve komplekse autonome: nga veprimet që ndërmerr një agjent kur has të dhëna të ndjeshme, deri te mënyra se si reagon ndaj komandave të paqarta ose potencialisht të dëmshme.

Përmbajtje ekskluzive - Kliko këtu  Karakteristikat më të fundit që vijnë në Windows 11: inteligjenca artificiale dhe mënyra të reja për të menaxhuar PC-në tuaj

Lidhur me seksionin e mjeteve, NVIDIA po lançon NeMo Gym dhe NeMo RL si biblioteka me burim të hapur për trajnim përforcues dhe trajnim pas-trajnimit, së bashku me NeMo Evaluator për vlerësimin e sigurisë dhe performancës. Këto biblioteka ofrojnë mjedise simulimi dhe tubacione të gatshme për përdorim me familjen Nemotron, por mund të zgjerohen edhe në modele të tjera.

I gjithë ky material - peshat, grupet e të dhënave dhe kodi - shpërndahet përmes GitHub dhe Hugging Face janë të licencuara sipas Licencës NVIDIA Open Model.në mënyrë që ekipet evropiane të mund ta integrojnë atë pa probleme në MLOps-et e tyre. Kompani si Prime Intellect dhe Unsloth tashmë po e përfshijnë NeMo Gym direkt në rrjedhat e tyre të punës për të thjeshtuar të mësuarit me përforcime në Nemotron.

Disponueshmëria në retë publike dhe ekosistemin evropian

Nemotron 3 Nano përqafuese e fytyrës

Nemotron 3 Nano është tani në dispozicion në Përqafimi i fytyrës y GitHubsi dhe përmes ofruesve të inferencës si Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter dhe Together AI. Kjo hap derën për ekipet e zhvillimit në Spanjë për të testuar modelin nëpërmjet API-t ose për ta vendosur atë në infrastrukturat e tyre pa kompleksitet të tepërt.

Në frontin e reve, Nemotron 3 Nano i bashkohet AWS nëpërmjet Amazon Bedrock për inferencë pa server, dhe ka njoftuar mbështetje për Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale dhe Yotta. Për organizatat evropiane që tashmë punojnë në këto platforma, kjo e bën më të lehtë përvetësimin e Nemotron pa ndryshime drastike në arkitekturën e tyre.

Përveç cloud-it publik, NVIDIA po promovon përdorimin e Nemotron 3 Nano si Mikroshërbimi NIM i zbatueshëm në çdo infrastrukturë të përshpejtuar nga NVIDIAKjo lejon skenarë hibridë: një pjesë e ngarkesës në cloud-et ndërkombëtare dhe një pjesë në qendrat lokale të të dhënave ose në cloud-et evropiane që i japin përparësi qëndrimit të të dhënave në BE.

Versionet Nemotron 3 Super dhe Ultra, të orientuara drejt ngarkesave të punës me arsyetim ekstrem dhe sistemeve shumë-agjentëshe në shkallë të gjerë, janë planifikuar për gjysmën e parë të vitit 2026Ky afat kohor i jep ekosistemit evropian të kërkimit dhe biznesit kohë për të eksperimentuar me Nano, për të validuar rastet e përdorimit dhe për të hartuar strategji migrimi në modele më të mëdha kur është e nevojshme.

Nemotron 3 e pozicionon NVIDIA-n si një nga ofruesit kryesorë të modele të hapura të nivelit të lartë të orientuara drejt inteligjencës artificiale agjentikeMe një propozim që përzien efikasitetin teknik (MoE hibrid, NVFP4, kontekst masiv), hapjen (peshat, grupet e të dhënave dhe bibliotekat e disponueshme) dhe një fokus të qartë në sovranitetin dhe transparencën e të dhënave, aspekte që janë veçanërisht të ndjeshme në Spanjë dhe pjesën tjetër të Evropës, ku rregullimi dhe presioni për të audituar IA-në janë gjithnjë e më të mëdha.

Microsoft Discovery IA-2
Artikulli i lidhur:
Microsoft Discovery AI nxit përparime shkencore dhe arsimore me inteligjencë artificiale të personalizuar