Nemotron 3: NVIDIA se groot oop weddenskap vir multi-agent KI

Laaste opdatering: 17/12/2025

  • Nemotron 3 is 'n oop familie van modelle, data en biblioteke wat fokus op agentiese KI en multi-agent stelsels.
  • Dit sluit drie MoE-groottes (Nano, Super en Ultra) met hibriede argitektuur en doeltreffende 4-bis-opleiding op NVIDIA Blackwell in.
  • Nemotron 3 Nano is nou in Europa beskikbaar via Hugging Face, publieke wolke en as 'n NIM-mikrodiens, met 'n venster van 1 miljoen tokens.
  • Die ekosisteem word voltooi met massiewe datastelle, NeMo Gym, NeMo RL en Evaluator om soewereine KI-agente op te lei, af te stem en te oudit.

Nemotron 3 Kunsmatige Intelligensie Model

Die wedloop vir kunsmatige intelligensie beweeg van eenvoudige, geïsoleerde kletsbotte na agentstelsels wat met mekaar saamwerk, lang werkvloeie bestuur en ouditeerbaar moet wees. In hierdie nuwe scenario, NVIDIA het besluit om 'n redelik duidelike stap te neem: om nie net modelle oop te maak nie, maar ook data en gereedskapsodat maatskappye, openbare administrasies en navorsingsentrums hul eie KI-platforms met meer beheer kan bou.

Daardie beweging materialiseer in Nemotron 3, 'n familie van oop modelle gerig op multi-agent KI Dit poog om hoë werkverrigting, lae afleidingskoste en deursigtigheid te kombineer. Die voorstel is nie bedoel as net nog 'n algemene kletsbot nie, maar as 'n basis waarop agente ontplooi kan word wat komplekse take in gereguleerde sektore redeneer, beplan en uitvoerDit is veral relevant in Europa en Spanje, waar datasoewereiniteit en regulatoriese nakoming belangrik is.

'n Oop familie van modelle vir agentiese en soewereine KI

Nemotron 3 word aangebied as 'n volledige ekosisteem: modelle, datastelle, biblioteke en opleidingsresepte onder oop lisensies. NVIDIA se idee is dat organisasies nie net KI as 'n ondeursigtige diens verbruik nie, maar ook kan inspekteer wat binne is, die modelle by hul domeine aanpas en dit op hul eie infrastruktuur ontplooi, hetsy in die wolk of in plaaslike datasentrums.

Die maatskappy raam hierdie strategie binne sy verbintenis tot Soewereine KIRegerings en maatskappye in Europa, Suid-Korea en ander streke soek oop alternatiewe vir geslote of buitelandse stelsels, wat dikwels nie goed ooreenstem met hul databeskermingswette of ouditvereistes nie. Nemotron 3 poog om die tegniese fondament te wees waarop nasionale, sektorale of korporatiewe modelle met groter sigbaarheid en beheer gebou kan word.

In parallel, NVIDIA versterk sy posisie buite hardewareTot nou toe was dit hoofsaaklik 'n verwysings-GPU-verskaffer; met Nemotron 3 posisioneer dit homself ook in die modellerings- en opleidingsgereedskaplaag, en kompeteer meer direk met spelers soos OpenAI, Google, Anthropic of selfs Meta, en teen premiummodelle soos SuperGrok SwaarMeta het sy verbintenis tot oopbron in onlangse generasies van Llama verminder.

Vir die Europese navorsings- en opstart-ekosisteem – wat sterk afhanklik is van oop modelle wat op platforms soos Hugging Face aangebied word – verteenwoordig die beskikbaarheid van gewigte, sintetiese data en biblioteke onder oop lisensies 'n kragtige alternatief vir die Chinese modelle en Amerikaners wat die gewildheids- en maatstafranglys oorheers.

Eksklusiewe inhoud - Klik hier  Microsoft Store maak nie oop nie of hou aan toemaak: gedetailleerde oplossings

Hibriede MoE-argitektuur: doeltreffendheid vir grootskaalse agente

Die sentrale tegniese kenmerk van Nemotron 3 is 'n Hibriede argitektuur van latente mengsel-van-kundiges (MoE)In plaas daarvan om al die model se parameters in elke afleiding te aktiveer, word slegs 'n fraksie daarvan aangeskakel, die subgroep van kundiges wat die mees relevante is vir die betrokke taak of teken.

Hierdie benadering laat toe verminder berekeningskoste en geheueverbruik drastiesDit verhoog ook die deurset van tokens. Vir multi-agent-argitekture, waar dosyne of honderde agente voortdurend boodskappe uitruil, is hierdie doeltreffendheid die sleutel om te verhoed dat die stelsel onvolhoubaar word in terme van GPU- en wolkkoste.

Volgens data wat deur NVIDIA en onafhanklike maatstawwe gedeel is, behaal die Nemotron 3 Nano tot vier keer meer tekens per sekonde In vergelyking met sy voorganger, die Nemotron 2 Nano, verminder dit die generering van onnodige redenasietekens met ongeveer 60%. In die praktyk beteken dit ewe veel of selfs meer akkurate antwoorde, maar met minder "woordigheid" en 'n laer koste per navraag.

Die hibriede MoE-argitektuur, gekombineer met spesifieke opleidingstegnieke, het gelei tot Baie van die mees gevorderde oop modelle gebruik kundige skemasNemotron 3 sluit aan by hierdie tendens, maar fokus spesifiek op agentiese KI: interne roetes ontwerp vir koördinering tussen agente, gebruik van gereedskap, hantering van lang toestande en stap-vir-stap beplanning.

Drie groottes: Nano, Super en Ultra vir verskillende werkladings

Nemotron 3 modelargitektuur

Die Nemotron 3-familie is georganiseer in drie hoofgroottes van die MoE-model, almal oop en met verminderde aktiewe parameters danksy die kundige argitektuur:

  • Nemotron 3 Nanoongeveer 30.000 miljard totale parameters, met ongeveer 3.000 miljard bates per tekenDit is ontwerp vir geteikende take waar doeltreffendheid saak maak: sagteware-ontfouting, dokumentopsomming, inligtingherwinning, stelselmonitering of gespesialiseerde KI-assistente.
  • Nemotron 3 Superongeveer 100.000 miljard parameters, met 10.000 miljard in bates by elke stap. Dit is gerig op Gevorderde redenasie in multi-agent argitekturemet lae latensie, selfs wanneer verskeie agente saamwerk om komplekse vloei op te los.
  • Nemotron 3 Ultradie boonste vlak, met ongeveer 500.000 miljard parameters en tot 50.000 miljard bates per tekenDit funksioneer as 'n kragtige redenasie-enjin vir navorsing, strategiese beplanning, hoëvlak-besluitnemingsondersteuning en veral veeleisende KI-stelsels.

In die praktyk laat dit organisasies toe Kies die modelgrootte volgens jou begroting en vereistesNano vir massiewe, intensiewe werkladings en streng kostes; Super wanneer meer diepte van redenasie nodig is met baie samewerkende agente; en Ultra vir gevalle waar kwaliteit en lang konteks swaarder weeg as GPU-koste.

Eksklusiewe inhoud - Klik hier  TAG Heuer Connected Calibre E5: die sprong na eie sagteware en 'n New Balance-uitgawe

Vir nou Slegs die Nemotron 3 Nano is beskikbaar vir onmiddellike gebruik.Die Super- en Ultra-variante word vir die eerste helfte van 2026 beplan, wat Europese maatskappye en laboratoriums tyd gee om eers met Nano te eksperimenteer, pyplyne te vestig en later gevalle te migreer wat groter kapasiteit benodig.

Nemotron 3 Nano: 1 miljoen tekenvenster en beperkte koste

Nemotron 3 Nano

Nemotron 3 Nano is, vanaf vandag, die praktiese spits van die gesinNVIDIA beskryf dit as die mees berekeningsdoeltreffende model in die reeks, geoptimaliseer om maksimum werkverrigting in multi-agent werkstrome en intensiewe maar herhalende take te lewer.

Onder sy tegniese kenmerke staan ​​die volgende uit: konteksvenster van tot een miljoen tokensDit maak voorsiening vir die behoud van geheue vir uitgebreide dokumente, volledige kodebewaarplekke of veelstap-besigheidsprosesse. Vir Europese toepassings in bankwese, gesondheidsorg of openbare administrasie, waar rekords volumineus kan wees, is hierdie langtermyn-konteksvermoë veral waardevol.

Die maatstawwe van die onafhanklike organisasie Kunsmatige analise plaas Nemotron 3 Nano as een van die mees gebalanseerde oopbronmodelle. Dit kombineer intelligensie, akkuraatheid en spoed, met deursetspoede van honderde tokens per sekonde. Hierdie kombinasie maak dit aantreklik vir KI-integreerders en diensverskaffers in Spanje wat 'n goeie gebruikerservaring benodig sonder om infrastruktuurkoste die hoogte in te skiet.

Wat gebruiksgevalle betref, teiken NVIDIA Nano by Inhoudsopsomming, sagteware-ontfouting, inligtingherwinning en ondernemings-KI-assistenteDanksy die vermindering van oorbodige redenasietokens, is dit moontlik om agente te bedryf wat lang gesprekke met gebruikers of stelsels voer sonder dat die afleidingsrekening die hoogte inskiet.

Oop data en biblioteke: NeMo Gimnasium, NeMo RL en Evaluator

NeMo-biblioteke

Een van die mees kenmerkende eienskappe van Nemotron 3 is dat Dit is nie beperk tot die vrystelling van modelgewigte nieNVIDIA vergesel die familie met 'n omvattende reeks oop hulpbronne vir die opleiding, afstemming en evaluering van agente.

Aan die een kant stel dit 'n sintetiese korpus van etlike triljoene tekens van voor-opleiding, na-opleiding en versterkingsdataHierdie datastelle, gefokus op redenasie, kodering en veelstap-werkvloeie, stel maatskappye en navorsingsentrums in staat om hul eie domeinspesifieke variante van Nemotron (bv. regs-, gesondheidsorg- of industrieel) te genereer sonder om van voor af te begin.

Onder hierdie hulpbronne staan ​​die volgende uit: Nemotron Agentic Safety-datastelDit versamel telemetrie-data oor agentgedrag in werklike scenario's. Die doel daarvan is om spanne te help om die sekuriteit van komplekse outonome stelsels te meet en te versterk: van watter aksies 'n agent neem wanneer dit sensitiewe data teëkom, tot hoe dit reageer op dubbelsinnige of potensieel skadelike bevele.

Eksklusiewe inhoud - Klik hier  Die nuutste kenmerke wat na Windows 11 kom: kunsmatige intelligensie en nuwe maniere om jou rekenaar te bestuur

Wat die gereedskapsafdeling betref, begin NVIDIA NeMo Gimnasium en NeMo RL as oopbronbiblioteke vir versterkingsopleiding en na-opleiding, tesame met NeMo Evaluator vir die assessering van veiligheid en werkverrigting. Hierdie biblioteke bied gereed-vir-gebruik simulasie-omgewings en pyplyne met die Nemotron-familie, maar kan uitgebrei word na ander modelle.

Al hierdie materiaal—gewigte, datastelle en kode—word versprei deur GitHub en Hugging Face word gelisensieer onder die NVIDIA Open Model License.sodat Europese spanne dit naatloos in hul eie MLOps kan integreer. Maatskappye soos Prime Intellect en Unsloth integreer reeds NeMo Gym direk in hul werkvloei om versterkingsleer op Nemotron te vereenvoudig.

Beskikbaarheid in openbare wolke en die Europese ekosisteem

Nemotron 3 Nano Drukkende Gesiggie

Nemotron 3 Nano is nou beskikbaar by Drukkende gesig y GitHubsowel as deur inferensieverskaffers soos Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter en Together AI. Dit maak die deur oop vir ontwikkelspanne in Spanje om die model via API te toets of dit op hul eie infrastrukture te ontplooi sonder oormatige kompleksiteit.

Aan die wolkfront, Nemotron 3 Nano sluit aan by AWS via Amazon Bedrock vir bedienerlose inferensie, en het ondersteuning aangekondig vir Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale en Yotta. Vir Europese organisasies wat reeds op hierdie platforms werk, maak dit dit makliker om Nemotron aan te neem sonder drastiese veranderinge aan hul argitektuur.

Benewens die publieke wolk, bevorder NVIDIA die gebruik van Nemotron 3 Nano as NIM-mikrodiens ontplooibaar op enige NVIDIA-versnelde infrastruktuurDit maak voorsiening vir hibriede scenario's: 'n deel van die las in internasionale wolke en 'n deel in plaaslike datasentrums of in Europese wolke wat data-residensie in die EU prioritiseer.

Die weergawes Nemotron 3 Super en Ultra, gerig op ekstreme redenasiewerkladings en grootskaalse multi-agentstelsels, is beplan vir die eerste helfte van 2026Hierdie tydlyn gee die Europese navorsings- en sake-ekosisteem tyd om met Nano te eksperimenteer, gebruiksgevalle te valideer en migrasiestrategieë na groter modelle te ontwerp wanneer nodig.

Nemotron 3 posisioneer NVIDIA as een van die toonaangewende verskaffers van hoë-end oop modelle gerig op agentiese KIMet 'n voorstel wat tegniese doeltreffendheid (hibriede MoE, NVFP4, massiewe konteks), openheid (gewigte, datastelle en beskikbare biblioteke) en 'n duidelike fokus op datasoewereiniteit en deursigtigheid kombineer, aspekte wat veral sensitief is in Spanje en die res van Europa, waar regulering en druk om KI te oudit toenemend groter is.

Microsoft Discovery IA-2
Verwante artikel:
Microsoft Discovery KI dryf wetenskaplike en opvoedkundige deurbrake met gepersonaliseerde kunsmatige intelligensie