Nemotron 3: Otevřené modely NVIDIA pro multiagentní umělou inteligenci

Nemotron 3 je otevřená rodina modelů, dat a knihoven zaměřených na agentní umělou inteligenci a multiagentní systémy.
Zahrnuje tři velikosti MoE (Nano, Super a Ultra) s hybridní architekturou a efektivním 4bitovým trénováním na NVIDIA Blackwell.
Nemotron 3 Nano je nyní v Evropě k dispozici prostřednictvím Hugging Face, veřejných cloudů a jako mikroslužba NIM s možností přístupu k 1 milionu tokenů.
Ekosystém je doplněn masivními datovými sadami, NeMo Gym, NeMo RL a Evaluatorem pro trénování, ladění a audit suverénních agentů umělé inteligence.

Model umělé inteligence Nemotronu 3

Závod o umělou inteligenci se přesouvá od jednoduchých, izolovaných chatbotů k agentním systémům, které vzájemně spolupracují, řídí dlouhé pracovní postupy a musí být auditovatelné. V tomto novém scénáři, NVIDIA se rozhodla pro poměrně jasný krok: zpřístupnit nejen modely, ale i data a nástrojeaby si firmy, veřejná správa a výzkumná centra mohly vytvářet vlastní platformy umělé inteligence s větší kontrolou.

Toto hnutí se zhmotňuje v Nemotron 3, rodina otevřených modelů zaměřených na multiagentní umělou inteligenci Snaží se kombinovat vysoký výkon, nízké náklady na inferenční analýzu a transparentnost. Návrh není zamýšlen jako další univerzální chatbot, ale jako základna, na které lze nasazovat agenty, kteří uvažují, plánují a provádějí složité úkoly v regulovaných odvětvíchTo je obzvláště důležité v Evropě a Španělsku, kde je důležitá datová suverenita a dodržování předpisů.

Otevřená rodina modelů pro agentní a suverénní umělou inteligenci

Nemotron 3 je prezentován jako kompletní ekosystém: modely, datové sady, knihovny a tréninkové recepty pod otevřenými licencemi. Myšlenka společnosti NVIDIA spočívá v tom, že organizace nejen konzumují umělou inteligenci jako neprůhlednou službu, ale mohou také prozkoumávat, co je uvnitř, přizpůsobovat modely svým doménám a nasazovat je na vlastní infrastruktuře, ať už v cloudu nebo v lokálních datových centrech.

Společnost tuto strategii zasazuje do svého závazku Suverénní umělá inteligenceVlády a společnosti v Evropě, Jižní Koreji a dalších regionech hledají otevřené alternativy k uzavřeným nebo zahraničním systémům, které často nejsou v souladu s jejich zákony na ochranu osobních údajů nebo požadavky na audit. Nemotron 3 si klade za cíl stát se technickým základem, na kterém lze stavět národní, odvětvové nebo firemní modely s větší viditelností a kontrolou.

Paralelně, NVIDIA posiluje svou pozici i mimo hardwareDoposud byl primárně poskytovatelem referenčních GPU; s Nemotronem 3 se také pozicionuje na úrovni modelovacích a trénovacích nástrojů a přímočařeji konkuruje hráčům jako OpenAI, Google, Anthropic nebo dokonce Meta a prémiovým modelům jako... SuperGrok HeavyMeta v posledních generacích Llamy snižuje svůj závazek k open source.

Pro evropský výzkumný a startupový ekosystém – silně závislý na otevřených modelech hostovaných na platformách, jako je Hugging Face – představuje dostupnost vah, syntetických dat a knihoven pod otevřenými licencemi silnou alternativu k… čínské modely a Američané, kteří dominují v žebříčcích popularity a benchmarků.

Exkluzivní obsah – klikněte zde Activision čelí kritice za reklamy generované AI v Guitar Hero Mobile a Call of Duty

Hybridní architektura MoE: efektivita pro rozsáhlé agenty

Ústředním technickým prvkem Nemotronu 3 je Hybridní architektura latentní směsi expertů (MoE)Místo aktivace všech parametrů modelu v každé inferenci se zapne pouze jejich zlomek, tedy podmnožina expertů, kteří jsou pro daný úkol nebo token nejrelevantnější.

Tento přístup umožňuje drasticky snížit výpočetní náklady a spotřebu pamětiTo také zvyšuje propustnost tokenů. Pro multiagentní architektury, kde si desítky nebo stovky agentů nepřetržitě vyměňují zprávy, je tato efektivita klíčová pro prevenci neudržitelnosti systému z hlediska nákladů na GPU a cloud.

Podle údajů sdílených společností NVIDIA a nezávislých benchmarků dosahuje Nemotron 3 Nano až čtyřikrát více tokenů za sekundu Ve srovnání se svým předchůdcem, Nemotronem 2 Nano, snižuje generování zbytečných tokenů pro uvažování přibližně o 60 %. V praxi to znamená stejně nebo i přesnější odpovědi, ale s menší „rozvláčností“ a nižšími náklady na dotaz.

Hybridní architektura ministerstva školství v kombinaci se specifickými výcvikovými technikami vedla k Mnoho z nejpokročilejších otevřených modelů využívá expertní schémataNemotron 3 se k tomuto trendu připojuje, ale zaměřuje se konkrétně na agentickou umělou inteligenci: interní trasy určené pro koordinaci mezi agenty, používání nástrojů, zpracování dlouhých stavů a postupné plánování.

Tři velikosti: Nano, Super a Ultra pro různé pracovní zátěže

Architektura modelu Nemotronu 3

Rodina Nemotron 3 je rozdělena do tři hlavní velikosti modelu MoE, všechny otevřené a se sníženými aktivními parametry díky expertní architektuře:

Nemotron 3 Nanocelkem přibližně 30.000 miliard parametrů, s přibližně 3.000 miliard aktiv na tokenJe navržen pro cílené úkoly, kde záleží na efektivitě: ladění softwaru, sumarizace dokumentů, vyhledávání informací, monitorování systému nebo specializovaní asistenti s umělou inteligencí.
Nemotron 3 Superpřibližně 100.000 miliard parametrů, s 10.000 miliard aktiv v každém kroku. Je zaměřen na Pokročilé uvažování v multiagentních architekturáchs nízkou latencí, a to i v případě, že na řešení složitých toků spolupracuje více agentů.
Nemotron 3 Ultra: horní úroveň s přibližně 500.000 miliardami parametrů a až 50.000 miliard aktiv na tokenFunguje jako výkonný nástroj pro uvažování ve výzkumu, strategickém plánování, podpoře rozhodování na vysoké úrovni a obzvláště náročných systémech umělé inteligence.

V praxi to umožňuje organizacím Vyberte si velikost modelu dle vašeho rozpočtu a požadavkůNano pro masivní, intenzivní pracovní zátěže a nízké náklady; Super, když je potřeba hlubší argumentace s mnoha spolupracujícími agenty; a Ultra pro případy, kdy kvalita a dlouhý kontext převažují nad náklady na GPU.

Exkluzivní obsah – klikněte zde 9 nejlepších nástrojů pro Excel s umělou inteligencí

Prozatím, K okamžitému použití je k dispozici pouze Nemotron 3 Nano.Varianty Super a Ultra jsou plánovány na první polovinu roku 2026, což dá evropským společnostem a laboratořím čas nejprve experimentovat s Nano, vybudovat výrobní postupy a později migrovat pouzdra, která vyžadují větší kapacitu.

Nemotron 3 Nano: Okno pro 1 milion tokenů a omezené náklady

Nemotron 3 Nano je od dnešního dne... praktický vůdce rodinyNVIDIA jej popisuje jako výpočetně nejefektivnější model v řadě, optimalizovaný pro maximální výkon v multiagentních pracovních postupech a náročných, ale opakujících se úlohách.

Mezi jeho technickými vlastnostmi vynikají následující: kontextové okno až jednoho milionu tokenůTo umožňuje uchování paměti pro rozsáhlé dokumenty, celá úložiště kódu nebo vícekrokové obchodní procesy. Pro evropské aplikace v bankovnictví, zdravotnictví nebo veřejné správě, kde mohou být záznamy objemné, je tato schopnost dlouhodobého kontextu obzvláště cenná.

Měřítka nezávislé organizace Umělá analýza řadí Nemotron 3 Nano mezi nejvyváženější open-source modely. Kombinuje inteligenci, přesnost a rychlost s propustností v řádu stovek tokenů za sekundu. Tato kombinace jej činí atraktivním pro integrátory umělé inteligence a poskytovatele služeb ve Španělsku, kteří potřebují dobrou uživatelskou zkušenost bez prudce rostoucích nákladů na infrastrukturu.

Pokud jde o případy použití, NVIDIA se zaměřuje na Nano. Shrnutí obsahu, ladění softwaru, vyhledávání informací a podnikoví asistenti umělé inteligenceDíky redukci redundantních tokenů pro uvažování je možné spouštět agenty, kteří udržují dlouhé konverzace s uživateli nebo systémy, aniž by náklady na inferenci prudce vzrostly.

Otevřená data a knihovny: NeMo Gym, NeMo RL a Evaluator

Knihovny NeMo

Jednou z nejvýraznějších vlastností Nemotronu 3 je, že Není omezeno pouze na zveřejňování vah modelůNVIDIA doprovází rodinu produktů komplexní sadou otevřených zdrojů pro školení, ladění a vyhodnocování agentů.

Na jedné straně zpřístupňuje syntetický korpus několik bilionů tokenů dat před tréninkem, po tréninku a posilováníTyto datové sady, zaměřené na uvažování, kódování a vícekrokové pracovní postupy, umožňují firmám a výzkumným centrem generovat vlastní varianty Nemotronu specifické pro danou oblast (např. právní, zdravotnické nebo průmyslové), aniž by musely začínat od nuly.

Mezi těmito zdroji vynikají následující: Soubor dat Nemotron Agent SafetyShromažďuje telemetrická data o chování agentů v reálných scénářích. Jeho cílem je pomoci týmům měřit a posilovat bezpečnost složitých autonomních systémů: od akcí, které agent podnikne, když narazí na citlivá data, až po reakci na nejednoznačné nebo potenciálně škodlivé příkazy.

Exkluzivní obsah – klikněte zde Jak vyhledávat na webu pomocí Claude AI

Pokud jde o sekci nástrojů, NVIDIA spouští NeMo Gym a NeMo RL jako open source knihovny pro posilovací školení a následné školení, spolu s NeMo Evaluator pro posouzení bezpečnosti a výkonu. Tyto knihovny poskytují simulační prostředí a postupy připravené k použití s rodinou Nemotron, ale lze je rozšířit i na další modely.

Veškerý tento materiál – váhy, datové sady a kód – je distribuován prostřednictvím GitHub a Hugging Face jsou licencovány pod licencí NVIDIA Open Model License.aby jej evropské týmy mohly bez problémů integrovat do svých vlastních MLOp. Společnosti jako Prime Intellect a Unsloth již začleňují NeMo Gym přímo do svých pracovních postupů, aby zjednodušily posilovací učení na Nemotronu.

Dostupnost ve veřejných cloudech a evropský ekosystém

Nemotron 3 Nano objímací obličej

Nemotron 3 Nano je nyní k dispozici na Objímající tvář y GitHuba také prostřednictvím poskytovatelů inference, jako jsou Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter a Together AI. To otevírá dveře vývojovým týmům ve Španělsku k testování modelu prostřednictvím API nebo k jeho nasazení na vlastní infrastruktury bez nadměrné složitosti.

Na oblačné frontě, Nemotron 3 Nano se připojuje k AWS prostřednictvím Amazon Bedrock pro bezserverovou inferenci a oznámila podporu pro Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale a Yotta. Pro evropské organizace, které již na těchto platformách pracují, to usnadňuje přijetí Nemotronu bez drastických změn v jejich architektuře.

Kromě veřejného cloudu propaguje NVIDIA využití Nemotronu 3 Nano jako Mikroslužba NIM nasaditelná na jakoukoli infrastrukturu akcelerovanou NVIDIATo umožňuje hybridní scénáře: část zátěže v mezinárodních cloudech a část v lokálních datových centrech nebo v evropských cloudech, které upřednostňují umístění dat v EU.

Verze Nemotron 3 Super a Ultra, zaměřené na extrémní pracovní zátěž z hlediska uvažování a rozsáhlé multiagentní systémy, jsou plánováno na první polovinu roku 2026Tato časová osa umožňuje evropskému výzkumnému a obchodnímu ekosystému experimentovat s Nano, ověřit případy užití a v případě potřeby navrhnout strategie migrace na větší modely.

Díky Nemotronu 3 se společnost NVIDIA stala jedním z předních poskytovatelů špičkové otevřené modely zaměřené na agentní umělou inteligenciS návrhem, který kombinuje technickou efektivitu (hybridní MoE, NVFP4, masivní kontext), otevřenost (váhy, datové sady a dostupné knihovny) a jasné zaměření na datovou suverenitu a transparentnost, což jsou aspekty obzvláště citlivé ve Španělsku a zbytku Evropy, kde je regulace a tlak na audit umělé inteligence stále větší.

Související článek:

Microsoft Discovery AI přináší vědecké a vzdělávací průlomy s personalizovanou umělou inteligencí

Alberto Navarro

Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.

Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.