Nemotron 3: Veľká otvorená stávka spoločnosti NVIDIA na multiagentovú umelú inteligenciu

Posledná aktualizácia: 17/12/2025

  • Nemotron 3 je otvorená rodina modelov, dát a knižníc zameraných na agentickú umelú inteligenciu a multiagentové systémy.
  • Zahŕňa tri veľkosti MoE (Nano, Super a Ultra) s hybridnou architektúrou a efektívnym 4-bitovým trénovaním na NVIDIA Blackwell.
  • Nemotron 3 Nano je teraz dostupný v Európe prostredníctvom služby Hugging Face, verejných cloudov a ako mikroslužba NIM s rozpätím 1 milióna tokenov.
  • Ekosystém je doplnený rozsiahlymi súbormi údajov, NeMo Gym, NeMo RL a Evaluatorom na trénovanie, ladenie a audit suverénnych agentov umelej inteligencie.

Model umelej inteligencie Nemotronu 3

Preteky v oblasti umelej inteligencie sa presúvajú od jednoduchých, izolovaných chatbotov k agentovým systémom, ktoré navzájom spolupracujú, riadia dlhé pracovné postupy a musia byť auditovateľné. V tomto novom scenári, NVIDIA sa rozhodla pre pomerne jasný krok: sprístupniť nielen modely, ale aj dáta a nástrojeaby si spoločnosti, verejné správy a výskumné centrá mohli vytvoriť vlastné platformy umelej inteligencie s väčšou kontrolou.

Toto hnutie sa zhmotňuje v Nemotron 3, rodina otvorených modelov zameraných na multiagentovú umelú inteligenciu Snaží sa kombinovať vysoký výkon, nízke náklady na inferenciu a transparentnosť. Návrh nie je zamýšľaný len ako ďalší univerzálny chatbot, ale ako základňa, na ktorej sa môžu nasadiť agenti, ktorí uvažujú, plánujú a vykonávajú zložité úlohy v regulovaných sektorochToto je obzvlášť dôležité v Európe a Španielsku, kde sú dôležité údaje a dodržiavanie predpisov.

Otvorená rodina modelov pre agentickú a suverénnu umelú inteligenciu

Nemotrón 3 je prezentovaný ako kompletný ekosystém: modely, súbory údajov, knižnice a tréningové recepty pod otvorenými licenciami. Myšlienka spoločnosti NVIDIA spočíva v tom, že organizácie nielenže konzumujú AI ako nepriehľadnú službu, ale môžu tiež kontrolovať, čo sa nachádza vo vnútri, prispôsobovať modely svojim doménam a nasadzovať ich na vlastnú infraštruktúru, či už v cloude alebo v lokálnych dátových centrách.

Spoločnosť zaraďuje túto stratégiu do svojho záväzku Suverénna AIVlády a spoločnosti v Európe, Južnej Kórei a ďalších regiónoch hľadajú otvorené alternatívy k uzavretým alebo zahraničným systémom, ktoré často nie sú v súlade s ich zákonmi o ochrane údajov alebo požiadavkami na audit. Cieľom Nemotron 3 je byť technickým základom, na ktorom sa budú budovať národné, sektorové alebo firemné modely s väčšou viditeľnosťou a kontrolou.

Paralelne, NVIDIA posilňuje svoju pozíciu aj mimo hardvéruDoteraz bol primárne poskytovateľom referenčných GPU; s Nemotronom 3 sa tiež etabloval vo vrstve modelovacích a tréningových nástrojov a priamejšie konkuroval hráčom ako OpenAI, Google, Anthropic alebo dokonca Meta a prémiovým modelom ako... SuperGrok HeavyMeta v posledných generáciách Llamy znižuje svoj záväzok voči open source.

Pre európsky ekosystém výskumu a startupov – ktorý je silne závislý od otvorených modelov hostovaných na platformách ako Hugging Face – predstavuje dostupnosť váh, syntetických údajov a knižníc pod otvorenými licenciami silnú alternatívu k… čínske modely a Američania, ktorí dominujú v rebríčkoch popularity a benchmarkov.

Exkluzívny obsah – kliknite sem  Obchod Microsoft Store sa neotvorí alebo sa stále zatvára: podrobné riešenia

Hybridná architektúra MoE: efektívnosť pre rozsiahlych agentov

Hlavnou technickou vlastnosťou Nemotronu 3 je Hybridná architektúra latentnej zmesi expertov (MoE)Namiesto aktivácie všetkých parametrov modelu v každej inferencii sa zapne iba ich zlomok, podmnožina expertov, ktorí sú najrelevantnejší pre danú úlohu alebo token.

Tento prístup umožňuje drasticky znížiť výpočtové náklady a spotrebu pamäteToto tiež zvyšuje priepustnosť tokenov. Pre multiagentové architektúry, kde si desiatky alebo stovky agentov nepretržite vymieňajú správy, je táto efektivita kľúčová pre zabránenie tomu, aby sa systém stal neudržateľným z hľadiska nákladov na GPU a cloud.

Podľa údajov zdieľaných spoločnosťou NVIDIA a nezávislých benchmarkov dosahuje Nemotron 3 Nano až štyrikrát viac tokenov za sekundu V porovnaní s predchodcom, Nemotronom 2 Nano, znižuje generovanie nepotrebných tokenov uvažovania približne o 60 %. V praxi to znamená rovnako alebo dokonca presnejšie odpovede, ale s menšou „rozvláčnosťou“ a nižšími nákladmi na dotaz.

Hybridná architektúra ministerstva školstva v kombinácii so špecifickými tréningovými technikami viedla k Mnohé z najpokročilejších otvorených modelov využívajú expertné schémyNemotron 3 sa pripája k tomuto trendu, ale zameriava sa konkrétne na agentickú umelú inteligenciu: interné trasy určené na koordináciu medzi agentmi, používanie nástrojov, spracovanie dlhých stavov a postupné plánovanie.

Tri veľkosti: Nano, Super a Ultra pre rôzne pracovné zaťaženia

Architektúra modelu Nemotron 3

Rodina Nemotron 3 je rozdelená do tri hlavné veľkosti modelu MoE, všetky sú otvorené a so zníženými aktívnymi parametrami vďaka expertnej architektúre:

  • Nemotron 3 Nano: približne 30.000 miliárd celkových parametrov, s približne 3.000 miliárd aktív na tokenJe určený pre cielené úlohy, kde je dôležitá efektivita: ladenie softvéru, sumarizácia dokumentov, vyhľadávanie informácií, monitorovanie systému alebo špecializovaní asistenti s umelou inteligenciou.
  • Nemotron 3 Superpribližne 100.000 miliárd parametrov, s 10.000 miliárd aktív na každom kroku. Je zameraný na Pokročilé uvažovanie v multiagentových architektúrachs nízkou latenciou, a to aj v prípade, že viacero agentov spolupracuje na riešení zložitých tokov.
  • Nemotron 3 Ultrahorná úroveň s približne 500.000 miliardami parametrov a až 50.000 miliárd aktív na tokenFunguje ako výkonný nástroj na uvažovanie pre výskum, strategické plánovanie, podporu rozhodovania na vysokej úrovni a obzvlášť náročné systémy umelej inteligencie.

V praxi to umožňuje organizáciám Vyberte si veľkosť modelu podľa vášho rozpočtu a požiadaviekNano pre masívne, intenzívne pracovné zaťaženia a nízke náklady; Super, keď je potrebná hlbšia analýza s mnohými spolupracujúcimi agentmi; a Ultra pre prípady, keď kvalita a dlhý kontext prevažujú nad nákladmi na GPU.

Exkluzívny obsah – kliknite sem  TAG Heuer Connected Calibre E5: skok k proprietárnemu softvéru a edícii New Balance

Na Teraz Na okamžité použitie je k dispozícii iba Nemotron 3 Nano.Varianty Super a Ultra sú plánované na prvú polovicu roka 2026, čo európskym spoločnostiam a laboratóriám poskytne čas najprv experimentovať s Nano, vybudovať portfólio a neskôr migrovať prípady, ktoré vyžadujú väčšiu kapacitu.

Nemotron 3 Nano: Okno pre 1 milión tokenov a obmedzené náklady

Nemotron 3 Nano

Nemotron 3 Nano je od dnešného dňa... praktický líder rodinyNVIDIA ho opisuje ako výpočtovo najefektívnejší model v rade, optimalizovaný pre maximálny výkon v multiagentových pracovných postupoch a náročných, ale opakujúcich sa úlohách.

Medzi jeho technickými vlastnosťami vynikajú: kontextové okno až do jedného milióna tokenovTo umožňuje uchovávanie pamäte pre rozsiahle dokumenty, celé úložiská kódu alebo viackrokové obchodné procesy. Pre európske aplikácie v bankovníctve, zdravotníctve alebo verejnej správe, kde môžu byť záznamy rozsiahle, je táto schopnosť dlhodobého kontextu obzvlášť cenná.

Kritériá nezávislej organizácie Umelá analýza radí Nemotron 3 Nano medzi najvyváženejšie modely s otvoreným zdrojovým kódom. Kombinuje inteligenciu, presnosť a rýchlosť s priepustnosťou v stovkách tokenov za sekundu. Táto kombinácia ho robí atraktívnym pre integrátorov umelej inteligencie a poskytovateľov služieb v Španielsku, ktorí potrebujú dobrý používateľský zážitok bez prudko rastúcich nákladov na infraštruktúru.

Pokiaľ ide o prípady použitia, NVIDIA sa zameriava na Nano. Zhrnutie obsahu, ladenie softvéru, vyhľadávanie informácií a podnikoví asistenti umelej inteligencieVďaka redukcii redundantných tokenov uvažovania je možné spúšťať agentov, ktorí udržiavajú dlhé konverzácie s používateľmi alebo systémami bez toho, aby náklady na inferenciu prudko stúpali.

Otvorené dáta a knižnice: NeMo Gym, NeMo RL a Evaluator

knižnice NeMo

Jednou z najvýraznejších vlastností Nemotronu 3 je, že Nie je to obmedzené len na zverejňovanie hmotností modelovNVIDIA dodáva rodinu produktov komplexný balík otvorených zdrojov na školenie, ladenie a hodnotenie agentov.

Na jednej strane sprístupňuje syntetický korpus niekoľko biliónov tokenov údajov pred tréningom, po tréningu a posilňovacích údajovTieto súbory údajov, zamerané na uvažovanie, kódovanie a viackrokové pracovné postupy, umožňujú spoločnostiam a výskumným centrám generovať vlastné varianty Nemotronu špecifické pre danú oblasť (napr. právne, zdravotnícke alebo priemyselné) bez toho, aby museli začínať od nuly.

Medzi týmito zdrojmi vynikajú nasledujúce: Súbor údajov o bezpečnosti agentov spoločnosti NemotronZbiera telemetrické údaje o správaní agentov v reálnych situáciách. Jeho cieľom je pomôcť tímom merať a posilňovať bezpečnosť komplexných autonómnych systémov: od toho, aké akcie agent podnikne, keď narazí na citlivé údaje, až po to, ako reaguje na nejednoznačné alebo potenciálne škodlivé príkazy.

Exkluzívny obsah – kliknite sem  Najnovšie funkcie prichádzajúce do systému Windows 11: umelá inteligencia a nové spôsoby správy počítača

Pokiaľ ide o sekciu nástrojov, NVIDIA spúšťa NeMo Gym a NeMo RL ako open source knižnice pre posilňovací tréning a následné školenie spolu s NeMo Evaluator na posudzovanie bezpečnosti a výkonu. Tieto knižnice poskytujú simulačné prostredia a kanály pripravené na použitie s rodinou Nemotron, ale je možné ich rozšíriť aj na iné modely.

Všetok tento materiál – váhy, súbory údajov a kód – je distribuovaný prostredníctvom GitHub a Hugging Face sú licencované pod licenciou NVIDIA Open Model License.aby ho európske tímy mohli bezproblémovo integrovať do svojich vlastných MLOps. Spoločnosti ako Prime Intellect a Unsloth už začleňujú NeMo Gym priamo do svojich pracovných postupov, aby zjednodušili posilňovacie učenie na Nemotrone.

Dostupnosť vo verejných cloudoch a európsky ekosystém

Nemotron 3 Nano objímajúca tvár

Nemotron 3 Nano je teraz k dispozícii na Objímajúca tvár y GitHubako aj prostredníctvom poskytovateľov inferencie, ako sú Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter a Together AI. To otvára dvere vývojovým tímom v Španielsku k testovaniu modelu prostredníctvom API alebo k jeho nasadeniu na vlastnú infraštruktúru bez nadmernej zložitosti.

Na oblačnom fronte, Nemotron 3 Nano sa pripája k AWS prostredníctvom Amazon Bedrock pre bezserverovú inferenciu a oznámila podporu pre Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale a Yotta. Pre európske organizácie, ktoré už na týchto platformách pracujú, to uľahčuje prijatie Nemotronu bez drastických zmien v ich architektúre.

Okrem verejného cloudu spoločnosť NVIDIA propaguje aj používanie Nemotronu 3 Nano ako Mikroslužba NIM je nasaditeľná na akúkoľvek infraštruktúru s akceleráciou NVIDIATo umožňuje hybridné scenáre: časť záťaže v medzinárodných cloudoch a časť v lokálnych dátových centrách alebo v európskych cloudoch, ktoré uprednostňujú umiestnenie údajov v EÚ.

Verzie Nemotron 3 Super a Ultra, zamerané na extrémne pracovné zaťaženie uvažovania a rozsiahle multiagentové systémy, sú plánované na prvú polovicu roku 2026Tento časový harmonogram poskytuje európskemu výskumnému a podnikateľskému ekosystému čas na experimentovanie s Nano, overovanie prípadov použitia a v prípade potreby navrhnutie stratégií migrácie na väčšie modely.

Nemotron 3 stavia spoločnosť NVIDIA medzi popredných poskytovateľov špičkové otvorené modely zamerané na agentickú umelú inteligenciuS návrhom, ktorý spája technickú efektívnosť (hybridné MoE, NVFP4, masívny kontext), otvorenosť (váhy, súbory údajov a dostupné knižnice) a jasné zameranie na suverenitu a transparentnosť údajov, čo sú aspekty, ktoré sú obzvlášť citlivé v Španielsku a zvyšku Európy, kde sú regulácie a tlak na audit umelej inteligencie čoraz väčšie.

Microsoft Discovery IA-2
Súvisiaci článok:
Microsoft Discovery AI prináša vedecké a vzdelávacie objavy vďaka personalizovanej umelej inteligencii