Nemotron 3: NVIDIA's open modellen voor multi-agent AI

Nemotron 3 is een open familie van modellen, data en bibliotheken gericht op agentische AI en multi-agentsystemen.
Het omvat drie MoE-formaten (Nano, Super en Ultra) met een hybride architectuur en efficiënte 4-bits training op NVIDIA Blackwell.
Nemotron 3 Nano is nu beschikbaar in Europa via Hugging Face, publieke clouds en als een NIM-microservice, met een uitgifteperiode van 1 miljoen tokens.
Het ecosysteem wordt compleet gemaakt met enorme datasets, NeMo Gym, NeMo RL en Evaluator voor het trainen, afstemmen en controleren van soevereine AI-agenten.

Nemotron 3 Kunstmatige Intelligentie Model

De race om kunstmatige intelligentie verschuift van eenvoudige, geïsoleerde chatbots naar agentsystemen die met elkaar samenwerken, lange workflows beheren en traceerbaar moeten zijn. In dit nieuwe scenario, NVIDIA heeft een duidelijke stap gezet: niet alleen modellen, maar ook data en tools openbaar maken.zodat bedrijven, overheidsinstanties en onderzoekscentra met meer controle hun eigen AI-platforms kunnen bouwen.

Die beweging komt tot uiting in Nemotron 3, een familie van open modellen gericht op multi-agent AI. Het streeft ernaar hoge prestaties, lage inferentiekosten en transparantie te combineren. Het voorstel is niet bedoeld als zomaar een algemene chatbot, maar als... een basis waarop agenten kunnen worden ingezet die redeneren, plannen en complexe taken uitvoeren in gereguleerde sectorenDit is met name relevant in Europa en Spanje, waar gegevenssoevereiniteit en naleving van regelgeving van groot belang zijn.

Een open familie van modellen voor agentische en soevereine AI

Nemotron 3 wordt gepresenteerd als Een compleet ecosysteem: modellen, datasets, bibliotheken en trainingsrecepten. onder open licenties. NVIDIA's idee is dat organisaties AI niet alleen als een ondoorzichtige dienst afnemen, maar ook kunnen inspecteren wat erin zit, de modellen kunnen aanpassen aan hun eigen domeinen en ze kunnen implementeren op hun eigen infrastructuur, of dat nu in de cloud of in lokale datacenters is.

Het bedrijf plaatst deze strategie in het kader van zijn streven naar Soevereine AIOverheden en bedrijven in Europa, Zuid-Korea en andere regio's zoeken naar open alternatieven voor gesloten of buitenlandse systemen, die vaak niet goed aansluiten bij hun wetgeving inzake gegevensbescherming of auditvereisten. Nemotron 3 wil de technische basis vormen voor de ontwikkeling van nationale, sectorale of bedrijfsmodellen met meer transparantie en controle.

Tegelijkertijd, NVIDIA versterkt zijn positie buiten de hardware.Tot nu toe was het voornamelijk een referentie-GPU-leverancier; met Nemotron 3 positioneert het zich ook in de laag van modelleer- en trainingstools, waarmee het directer concurreert met spelers als OpenAI, Google, Anthropic of zelfs Meta, en met premiummodellen zoals SuperGrok HeavyMeta heeft in de recentere generaties van Llama zijn inzet voor open source steeds verder teruggeschroefd.

Voor het Europese onderzoeks- en startup-ecosysteem – dat sterk afhankelijk is van open modellen die worden gehost op platforms zoals Hugging Face – vormt de beschikbaarheid van gewichten, synthetische data en bibliotheken onder open licenties een krachtig alternatief voor de Chinese modellen en Amerikanen die de populariteits- en referentieranglijsten domineren.

Exclusieve inhoud - Klik hier Wat zijn genetische algoritmen?

Hybride MoE-architectuur: efficiëntie voor grootschalige agenten

Het belangrijkste technische kenmerk van Nemotron 3 is een Hybride architectuur van latente mengsels van experts (MoE)In plaats van alle modelparameters bij elke inferentie te activeren, wordt slechts een fractie ervan ingeschakeld, namelijk de subset van experts die het meest relevant zijn voor de betreffende taak of het betreffende token.

Deze aanpak maakt het mogelijk De rekenkosten en het geheugenverbruik drastisch verlagen.Dit verhoogt ook de tokendoorvoer. Voor multi-agentarchitecturen, waar tientallen of honderden agents continu berichten uitwisselen, is deze efficiëntie cruciaal om te voorkomen dat het systeem onhoudbaar wordt qua GPU- en cloudkosten.

Volgens gegevens van NVIDIA en onafhankelijke benchmarks behaalt de Nemotron 3 Nano de volgende prestaties: tot wel vier keer meer tokens per seconde Vergeleken met zijn voorganger, de Nemotron 2 Nano, genereert hij ongeveer 60% minder onnodige redeneertokens. In de praktijk betekent dit even nauwkeurige of zelfs nauwkeurigere antwoorden, maar met minder overbodige tekst en lagere kosten per zoekopdracht.

De hybride MoE-architectuur, in combinatie met specifieke trainingstechnieken, heeft geleid tot Veel van de meest geavanceerde open modellen maken gebruik van expertschema's.Nemotron 3 sluit aan bij deze trend, maar richt zich specifiek op agentische AI: interne routes ontworpen voor coördinatie tussen agenten, gebruik van tools, verwerking van lange toestanden en stapsgewijze planning.

Drie formaten: Nano, Super en Ultra voor verschillende werkzaamheden.

Architectuur van het Nemotron 3-model

De Nemotron 3-familie is georganiseerd in drie hoofdformaten van het MoE-model, die allemaal open zijn en dankzij de geavanceerde architectuur minder actieve parameters hebben:

Nemotron 3 Nano: in totaal ongeveer 30.000 miljard parameters, met ongeveer 3.000 miljard activa per tokenHet is ontworpen voor specifieke taken waarbij efficiëntie van belang is: softwarefoutopsporing, documentsamenvatting, informatieopvraging, systeemmonitoring of gespecialiseerde AI-assistenten.
Nemotron 3 Super: ongeveer 100.000 miljard parameters, met 10.000 miljard aan activa bij elke stap. Het is gericht op Geavanceerd redeneren in multi-agent architecturenmet een lage latentie, zelfs wanneer meerdere agenten samenwerken om complexe processen op te lossen.
Nemotron 3 Ultra: het bovenste niveau, met ongeveer 500.000 miljard parameters en tot 50.000 miljard activa per tokenHet fungeert als een krachtige redeneermachine voor onderzoek, strategische planning, besluitvorming op hoog niveau en met name veeleisende AI-systemen.

In de praktijk stelt dit organisaties in staat om Kies de modelgrootte die past bij uw budget en behoeften.Nano is geschikt voor enorme, intensieve workloads en krappe budgetten; Super voor situaties waarin meer diepgang in de redenering nodig is met veel samenwerkende agenten; en Ultra voor gevallen waarin kwaliteit en een lange context belangrijker zijn dan de GPU-kosten.

Exclusieve inhoud - Klik hier NASA heropent de race voor de Artemis 3 maanlander

Voorlopig, Alleen de Nemotron 3 Nano is direct beschikbaar voor gebruik.De Super- en Ultra-varianten staan gepland voor de eerste helft van 2026, waardoor Europese bedrijven en laboratoria de tijd krijgen om eerst met Nano te experimenteren, productieprocessen op te zetten en later over te stappen op systemen die een grotere capaciteit vereisen.

Nemotron 3 Nano: venster van 1 miljoen tokens en beperkte kosten

Nemotron 3 Nano is, vanaf vandaag, het praktische speerpunt van de familieNVIDIA omschrijft het als het meest rekenkundig kostenefficiënte model in het assortiment, geoptimaliseerd voor maximale prestaties in workflows met meerdere agenten en intensieve maar repetitieve taken.

Tot de technische kenmerken behoren onder meer de volgende: contextvenster van maximaal één miljoen tokensDit maakt het mogelijk om de inhoud van omvangrijke documenten, complete codearchieven of meerstaps bedrijfsprocessen te bewaren. Voor Europese toepassingen in de banksector, de gezondheidszorg of het openbaar bestuur, waar de hoeveelheid gegevens enorm kan zijn, is deze mogelijkheid om de context op lange termijn te bewaren bijzonder waardevol.

De maatstaven van de onafhankelijke organisatie Kunstmatige intelligentie wijst uit dat Nemotron 3 Nano een van de meest evenwichtige open-source modellen is. Het combineert intelligentie, nauwkeurigheid en snelheid, met doorvoersnelheden van honderden tokens per seconde. Deze combinatie maakt het aantrekkelijk voor AI-integrators en serviceproviders in Spanje die een goede gebruikerservaring nodig hebben zonder torenhoge infrastructuurkosten.

Wat betreft toepassingsmogelijkheden richt NVIDIA zich met de Nano op... Inhoudssamenvatting, softwarefoutopsporing, informatieopvraging en AI-assistenten voor bedrijvenDankzij de vermindering van overbodige redeneertokens is het mogelijk om agents te gebruiken die lange gesprekken voeren met gebruikers of systemen zonder dat de inferentiekosten de pan uit rijzen.

Open data en bibliotheken: NeMo Gym, NeMo RL en Evaluator

NeMo-bibliotheken

Een van de meest opvallende kenmerken van Nemotron 3 is dat Het is niet beperkt tot het vrijgeven van modelgewichten.NVIDIA levert bij de productfamilie een uitgebreide reeks open source-bronnen voor het trainen, afstemmen en evalueren van agents.

Enerzijds stelt het een synthetisch corpus beschikbaar van enkele biljoenen tokens aan pre-training-, post-training- en versterkingsgegevensDeze datasets, gericht op redeneren, coderen en workflows met meerdere stappen, stellen bedrijven en onderzoekscentra in staat om hun eigen domeinspecifieke varianten van Nemotron te genereren (bijvoorbeeld voor de juridische, gezondheidszorg- of industriële sector) zonder helemaal opnieuw te hoeven beginnen.

Van al deze bronnen springt het volgende eruit: Nemotron Agentic Safety datasetHet verzamelt telemetriegegevens over het gedrag van agenten in realistische scenario's. Het doel is om teams te helpen de beveiliging van complexe autonome systemen te meten en te versterken: van welke acties een agent onderneemt wanneer deze gevoelige gegevens tegenkomt, tot hoe deze reageert op ambigue of potentieel schadelijke commando's.

Exclusieve inhoud - Klik hier Wat u moet weten voordat u tekst uit afbeeldingen haalt met ChatGPT

Wat de tools betreft, lanceert NVIDIA het volgende: NeMo Gym en NeMo RL als open source bibliotheken Voor versterkingstraining en nazorg, samen met NeMo Evaluator voor het beoordelen van veiligheid en prestaties. Deze bibliotheken bieden kant-en-klare simulatieomgevingen en -pipelines met de Nemotron-familie, maar kunnen worden uitgebreid naar andere modellen.

Al dit materiaal – gewichten, datasets en code – wordt verspreid via GitHub en Hugging Face zijn gelicentieerd onder de NVIDIA Open Model License.zodat Europese teams het naadloos in hun eigen MLOps kunnen integreren. Bedrijven zoals Prime Intellect en Unsloth integreren NeMo Gym al rechtstreeks in hun workflows om reinforcement learning op Nemotron te vereenvoudigen.

Beschikbaarheid in publieke clouds en het Europese ecosysteem

De Nemotron 3 Nano is nu verkrijgbaar bij Knuffelend gezicht y GitHubEn ook via inferentieproviders zoals Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter en Together AI. Dit biedt ontwikkelteams in Spanje de mogelijkheid om het model via een API te testen of op hun eigen infrastructuur te implementeren zonder al te veel complexiteit.

Wat betreft de cloud, Nemotron 3 Nano is nu beschikbaar als AWS-apparaat via Amazon Bedrock. voor serverloze inferentie en heeft ondersteuning aangekondigd voor Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale en Yotta. Voor Europese organisaties die al met deze platforms werken, maakt dit de implementatie van Nemotron eenvoudiger zonder ingrijpende wijzigingen in hun architectuur.

Naast de publieke cloud promoot NVIDIA ook het gebruik van Nemotron 3 Nano als NIM-microservice die kan worden ingezet op elke door NVIDIA versnelde infrastructuur.Dit maakt hybride scenario's mogelijk: een deel van de belasting in internationale clouds en een deel in lokale datacenters of in Europese clouds die prioriteit geven aan dataopslag binnen de EU.

Versies Nemotron 3 Super en Ultra, gericht op extreem veeleisende redeneertaken en grootschalige multi-agentsystemen, zijn gepland voor de eerste helft van 2026Deze tijdlijn geeft het Europese onderzoeks- en bedrijfsecosysteem de tijd om met Nano te experimenteren, gebruiksscenario's te valideren en, indien nodig, migratiestrategieën naar grotere modellen te ontwerpen.

Nemotron 3 positioneert NVIDIA als een van de toonaangevende leveranciers van hoogwaardige open modellen gericht op agentische AIMet een voorstel dat technische efficiëntie (hybride MoE, NVFP4, uitgebreide context), openheid (gewichten, datasets en beschikbare bibliotheken) combineert met een duidelijke focus op datasoevereiniteit en transparantie, aspecten die vooral gevoelig liggen in Spanje en de rest van Europa, waar de regelgeving en de druk om AI te controleren steeds groter worden.

Gerelateerd artikel:

Microsoft Discovery AI stimuleert wetenschappelijke en educatieve doorbraken met gepersonaliseerde kunstmatige intelligentie

Alberto Navarro

Ik ben een technologieliefhebber die van zijn 'nerd'-interesses zijn beroep heeft gemaakt. Ik heb meer dan 10 jaar van mijn leven doorgebracht met het gebruik van de allernieuwste technologie en het sleutelen aan allerlei programma's uit pure nieuwsgierigheid. Nu heb ik mij gespecialiseerd in computertechnologie en videogames. Dit komt omdat ik al meer dan vijf jaar voor verschillende websites over technologie en videogames schrijf en artikelen heb gemaakt die proberen u de informatie te geven die u nodig heeft in een taal die voor iedereen begrijpelijk is.

Als je vragen hebt, mijn kennis strekt zich uit van alles wat te maken heeft met het Windows-besturingssysteem tot Android voor mobiele telefoons. En mijn toewijding is aan jou, ik ben altijd bereid om een paar minuten te besteden en je te helpen bij het oplossen van eventuele vragen die je hebt in deze internetwereld.