- Nemotron 3 je otevřená rodina modelů, dat a knihoven zaměřených na agentní umělou inteligenci a multiagentní systémy.
- Zahrnuje tři velikosti MoE (Nano, Super a Ultra) s hybridní architekturou a efektivním 4bitovým trénováním na NVIDIA Blackwell.
- Nemotron 3 Nano je nyní v Evropě k dispozici prostřednictvím Hugging Face, veřejných cloudů a jako mikroslužba NIM s možností přístupu k 1 milionu tokenů.
- Ekosystém je doplněn masivními datovými sadami, NeMo Gym, NeMo RL a Evaluatorem pro trénování, ladění a audit suverénních agentů umělé inteligence.
Závod o umělou inteligenci se přesouvá od jednoduchých, izolovaných chatbotů k agentním systémům, které vzájemně spolupracují, řídí dlouhé pracovní postupy a musí být auditovatelné. V tomto novém scénáři, NVIDIA se rozhodla pro poměrně jasný krok: zpřístupnit nejen modely, ale i data a nástrojeaby si firmy, veřejná správa a výzkumná centra mohly vytvářet vlastní platformy umělé inteligence s větší kontrolou.
Toto hnutí se zhmotňuje v Nemotron 3, rodina otevřených modelů zaměřených na multiagentní umělou inteligenci Snaží se kombinovat vysoký výkon, nízké náklady na inferenční analýzu a transparentnost. Návrh není zamýšlen jako další univerzální chatbot, ale jako základna, na které lze nasazovat agenty, kteří uvažují, plánují a provádějí složité úkoly v regulovaných odvětvíchTo je obzvláště důležité v Evropě a Španělsku, kde je důležitá datová suverenita a dodržování předpisů.
Otevřená rodina modelů pro agentní a suverénní umělou inteligenci
Nemotron 3 je prezentován jako kompletní ekosystém: modely, datové sady, knihovny a tréninkové recepty pod otevřenými licencemi. Myšlenka společnosti NVIDIA spočívá v tom, že organizace nejen konzumují umělou inteligenci jako neprůhlednou službu, ale mohou také prozkoumávat, co je uvnitř, přizpůsobovat modely svým doménám a nasazovat je na vlastní infrastruktuře, ať už v cloudu nebo v lokálních datových centrech.
Společnost tuto strategii zasazuje do svého závazku Suverénní AIVlády a společnosti v Evropě, Jižní Koreji a dalších regionech hledají otevřené alternativy k uzavřeným nebo zahraničním systémům, které často nejsou v souladu s jejich zákony na ochranu osobních údajů nebo požadavky na audit. Nemotron 3 si klade za cíl stát se technickým základem, na kterém lze stavět národní, odvětvové nebo firemní modely s větší viditelností a kontrolou.
Paralelně, NVIDIA posiluje svou pozici i mimo hardwareDoposud byl primárně poskytovatelem referenčních GPU; s Nemotronem 3 se také pozicionuje na úrovni modelovacích a trénovacích nástrojů a přímočařeji konkuruje hráčům jako OpenAI, Google, Anthropic nebo dokonce Meta a prémiovým modelům jako... SuperGrok HeavyMeta v posledních generacích Llamy snižuje svůj závazek k open source.
Pro evropský výzkumný a startupový ekosystém – silně závislý na otevřených modelech hostovaných na platformách, jako je Hugging Face – představuje dostupnost vah, syntetických dat a knihoven pod otevřenými licencemi silnou alternativu k… čínské modely a Američané, kteří dominují v žebříčcích popularity a benchmarků.
Hybridní architektura MoE: efektivita pro rozsáhlé agenty
Ústředním technickým prvkem Nemotronu 3 je Hybridní architektura latentní směsi expertů (MoE)Místo aktivace všech parametrů modelu v každé inferenci se zapne pouze jejich zlomek, tedy podmnožina expertů, kteří jsou pro daný úkol nebo token nejrelevantnější.
Tento přístup umožňuje drasticky snížit výpočetní náklady a spotřebu pamětiTo také zvyšuje propustnost tokenů. Pro multiagentní architektury, kde si desítky nebo stovky agentů nepřetržitě vyměňují zprávy, je tato efektivita klíčová pro prevenci neudržitelnosti systému z hlediska nákladů na GPU a cloud.
Podle údajů sdílených společností NVIDIA a nezávislých benchmarků dosahuje Nemotron 3 Nano až čtyřikrát více tokenů za sekundu Ve srovnání se svým předchůdcem, Nemotronem 2 Nano, snižuje generování zbytečných tokenů pro uvažování přibližně o 60 %. V praxi to znamená stejně nebo i přesnější odpovědi, ale s menší „rozvláčností“ a nižšími náklady na dotaz.
Hybridní architektura ministerstva školství v kombinaci se specifickými výcvikovými technikami vedla k Mnoho z nejpokročilejších otevřených modelů využívá expertní schémataNemotron 3 se k tomuto trendu připojuje, ale zaměřuje se konkrétně na agentickou umělou inteligenci: interní trasy určené pro koordinaci mezi agenty, používání nástrojů, zpracování dlouhých stavů a postupné plánování.
Tři velikosti: Nano, Super a Ultra pro různé pracovní zátěže

Rodina Nemotron 3 je rozdělena do tři hlavní velikosti modelu MoE, všechny otevřené a se sníženými aktivními parametry díky expertní architektuře:
- Nemotron 3 Nanocelkem přibližně 30.000 miliard parametrů, s přibližně 3.000 miliard aktiv na tokenJe navržen pro cílené úkoly, kde záleží na efektivitě: ladění softwaru, sumarizace dokumentů, vyhledávání informací, monitorování systému nebo specializovaní asistenti s umělou inteligencí.
- Nemotron 3 Superpřibližně 100.000 miliard parametrů, s 10.000 miliard aktiv v každém kroku. Je zaměřen na Pokročilé uvažování v multiagentních architekturáchs nízkou latencí, a to i v případě, že na řešení složitých toků spolupracuje více agentů.
- Nemotron 3 Ultra: horní úroveň s přibližně 500.000 miliardami parametrů a až 50.000 miliard aktiv na tokenFunguje jako výkonný nástroj pro uvažování ve výzkumu, strategickém plánování, podpoře rozhodování na vysoké úrovni a obzvláště náročných systémech umělé inteligence.
V praxi to umožňuje organizacím Vyberte si velikost modelu dle vašeho rozpočtu a požadavkůNano pro masivní, intenzivní pracovní zátěže a nízké náklady; Super, když je potřeba hlubší argumentace s mnoha spolupracujícími agenty; a Ultra pro případy, kdy kvalita a dlouhý kontext převažují nad náklady na GPU.
Pro teď K okamžitému použití je k dispozici pouze Nemotron 3 Nano.Varianty Super a Ultra jsou plánovány na první polovinu roku 2026, což dá evropským společnostem a laboratořím čas nejprve experimentovat s Nano, vybudovat výrobní postupy a později migrovat pouzdra, která vyžadují větší kapacitu.
Nemotron 3 Nano: Okno pro 1 milion tokenů a omezené náklady

Nemotron 3 Nano je od dnešního dne... praktický vůdce rodinyNVIDIA jej popisuje jako výpočetně nejefektivnější model v řadě, optimalizovaný pro maximální výkon v multiagentních pracovních postupech a náročných, ale opakujících se úlohách.
Mezi jeho technickými vlastnostmi vynikají následující: kontextové okno až jednoho milionu tokenůTo umožňuje uchování paměti pro rozsáhlé dokumenty, celá úložiště kódu nebo vícekrokové obchodní procesy. Pro evropské aplikace v bankovnictví, zdravotnictví nebo veřejné správě, kde mohou být záznamy objemné, je tato schopnost dlouhodobého kontextu obzvláště cenná.
Měřítka nezávislé organizace Umělá analýza řadí Nemotron 3 Nano mezi nejvyváženější open-source modely. Kombinuje inteligenci, přesnost a rychlost s propustností v řádu stovek tokenů za sekundu. Tato kombinace jej činí atraktivním pro integrátory umělé inteligence a poskytovatele služeb ve Španělsku, kteří potřebují dobrou uživatelskou zkušenost bez prudce rostoucích nákladů na infrastrukturu.
Pokud jde o případy použití, NVIDIA se zaměřuje na Nano. Shrnutí obsahu, ladění softwaru, vyhledávání informací a podnikoví asistenti umělé inteligenceDíky redukci redundantních tokenů pro uvažování je možné spouštět agenty, kteří udržují dlouhé konverzace s uživateli nebo systémy, aniž by náklady na inferenci prudce vzrostly.
Otevřená data a knihovny: NeMo Gym, NeMo RL a Evaluator

Jednou z nejvýraznějších vlastností Nemotronu 3 je, že Není omezeno pouze na zveřejňování vah modelůNVIDIA doprovází rodinu produktů komplexní sadou otevřených zdrojů pro školení, ladění a vyhodnocování agentů.
Na jedné straně zpřístupňuje syntetický korpus několik bilionů tokenů dat před tréninkem, po tréninku a posilováníTyto datové sady, zaměřené na uvažování, kódování a vícekrokové pracovní postupy, umožňují firmám a výzkumným centrem generovat vlastní varianty Nemotronu specifické pro danou oblast (např. právní, zdravotnické nebo průmyslové), aniž by musely začínat od nuly.
Mezi těmito zdroji vynikají následující: Soubor dat Nemotron Agent SafetyShromažďuje telemetrická data o chování agentů v reálných scénářích. Jeho cílem je pomoci týmům měřit a posilovat bezpečnost složitých autonomních systémů: od akcí, které agent podnikne, když narazí na citlivá data, až po reakci na nejednoznačné nebo potenciálně škodlivé příkazy.
Pokud jde o sekci nástrojů, NVIDIA spouští NeMo Gym a NeMo RL jako open source knihovny pro posilovací školení a následné školení, spolu s NeMo Evaluator pro posouzení bezpečnosti a výkonu. Tyto knihovny poskytují simulační prostředí a postupy připravené k použití s rodinou Nemotron, ale lze je rozšířit i na další modely.
Veškerý tento materiál – váhy, datové sady a kód – je distribuován prostřednictvím GitHub a Hugging Face jsou licencovány pod licencí NVIDIA Open Model License.aby jej evropské týmy mohly bez problémů integrovat do svých vlastních MLOp. Společnosti jako Prime Intellect a Unsloth již začleňují NeMo Gym přímo do svých pracovních postupů, aby zjednodušily posilovací učení na Nemotronu.
Dostupnost ve veřejných cloudech a evropský ekosystém

Nemotron 3 Nano je nyní k dispozici na Objímání obličeje y GitHuba také prostřednictvím poskytovatelů inference, jako jsou Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter a Together AI. To otevírá dveře vývojovým týmům ve Španělsku k testování modelu prostřednictvím API nebo k jeho nasazení na vlastní infrastruktury bez nadměrné složitosti.
Na oblačné frontě, Nemotron 3 Nano se připojuje k AWS prostřednictvím Amazon Bedrock pro bezserverovou inferenci a oznámila podporu pro Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale a Yotta. Pro evropské organizace, které již na těchto platformách pracují, to usnadňuje přijetí Nemotronu bez drastických změn v jejich architektuře.
Kromě veřejného cloudu propaguje NVIDIA využití Nemotronu 3 Nano jako Mikroslužba NIM nasaditelná na jakoukoli infrastrukturu akcelerovanou NVIDIATo umožňuje hybridní scénáře: část zátěže v mezinárodních cloudech a část v lokálních datových centrech nebo v evropských cloudech, které upřednostňují umístění dat v EU.
Verze Nemotron 3 Super a Ultra, zaměřené na extrémní pracovní zátěž z hlediska uvažování a rozsáhlé multiagentní systémy, jsou plánováno na první polovinu roku 2026Tato časová osa umožňuje evropskému výzkumnému a obchodnímu ekosystému experimentovat s Nano, ověřit případy užití a v případě potřeby navrhnout strategie migrace na větší modely.
Díky Nemotronu 3 se společnost NVIDIA stala jedním z předních poskytovatelů špičkové otevřené modely zaměřené na agentní umělou inteligenciS návrhem, který kombinuje technickou efektivitu (hybridní MoE, NVFP4, masivní kontext), otevřenost (váhy, datové sady a dostupné knihovny) a jasné zaměření na datovou suverenitu a transparentnost, což jsou aspekty obzvláště citlivé ve Španělsku a zbytku Evropy, kde je regulace a tlak na audit umělé inteligence stále větší.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.
