- Nemotron 3 е отворено семејство на модели, податоци и библиотеки фокусирани на агентска вештачка интелигенција и мулти-агентски системи.
- Вклучува три MoE големини (Nano, Super и Ultra) со хибридна архитектура и ефикасна 4-битна обука на NVIDIA Blackwell.
- Nemotron 3 Nano сега е достапен во Европа преку Hugging Face, јавни облаци и како NIM микросервис, со прозорец од 1 милион токени.
- Екосистемот е комплетиран со огромни збирки на податоци, NeMo Gym, NeMo RL и Evaluator за обука, подесување и ревизија на суверени агенти со вештачка интелигенција.
Трката за вештачка интелигенција се движи од едноставни, изолирани чет-ботови кон агентски системи кои соработуваат едни со други, управуваат со долги работни процеси и треба да бидат ревидирани. Во ова ново сценарио, NVIDIA одлучи да направи прилично јасен чекор: да отвори не само модели, туку и податоци и алаткитака што компаниите, јавните администрации и истражувачките центри можат да градат свои платформи за вештачка интелигенција со поголема контрола.
Тоа движење се материјализира во Nemotron 3, семејство на отворени модели насочени кон вештачка интелигенција со повеќе агенти Се стреми да комбинира високи перформанси, ниски трошоци за инференција и транспарентност. Предлогот не е наменет само како уште еден чатбот за општа намена, туку како база врз која ќе се распоредуваат агенти кои размислуваат, планираат и извршуваат сложени задачи во регулираните секториОва е особено релевантно во Европа и Шпанија, каде што суверенитетот на податоците и усогласеноста со регулативите се важни.
Отворено семејство на модели за агентска и суверена вештачка интелигенција
Немотрон 3 е претставен како комплетен екосистем: модели, бази на податоци, библиотеки и рецепти за обука под отворени лиценци. Идејата на NVIDIA е организациите не само да ја консумираат вештачката интелигенција како непроѕирна услуга, туку можат да го проверат она што е внатре, да ги адаптираат моделите на своите домени и да ги распоредат на сопствена инфраструктура, без разлика дали е во облакот или во локалните центри за податоци.
Компанијата ја врамува оваа стратегија во рамките на својата посветеност кон Суверена вештачка интелигенцијаВладите и компаниите во Европа, Јужна Кореја и други региони бараат отворени алтернативи на затворените или странските системи, кои честопати не се усогласуваат добро со нивните закони за заштита на податоци или барањата за ревизија. Nemotron 3 има за цел да биде техничка основа врз која ќе се градат национални, секторски или корпоративни модели со поголема видливост и контрола.
Паралелно, NVIDIA ја зајакнува својата позиција надвор од хардверотДосега, тоа беше првенствено референтен провајдер на графички процесор; со Nemotron 3, се позиционира и во слојот на алатки за моделирање и обука, натпреварувајќи се подиректно со играчи како OpenAI, Google, Anthropic, па дури и Meta, и против премиум модели како СуперГрок ХевиМета ја намалува својата посветеност на отворениот код во последните генерации на Llama.
За европскиот истражувачки и стартап екосистем - кој во голема мера се потпира на отворени модели хостирани на платформи како Hugging Face - достапноста на тежини, синтетички податоци и библиотеки под отворени лиценци претставува моќна алтернатива на кинески модели и Американците кои доминираат во популарноста и рангирањето на референтните вредности.
Хибридна MoE архитектура: ефикасност за агенти од голем обем
Централната техничка карактеристика на Nemotron 3 е Хибридна архитектура на латентна мешавина од експерти (MoE)Наместо да се активираат сите параметри на моделот во секој заклучок, само дел од нив се вклучени, подгрупата на експерти кои се најрелевантни за задачата или токенот за кој станува збор.
Овој пристап овозможува драстично намалување на трошоците за пресметување и потрошувачката на меморијаОва исто така го зголемува протокот на токени. За мултиагентски архитектури, каде што десетици или стотици агенти континуирано разменуваат пораки, оваа ефикасност е клучна за да се спречи системот да стане неодржлив во однос на трошоците за графички процесор и облак.
Според податоците споделени од NVIDIA и независни бенчмаркинг тестови, Nemotron 3 Nano постигнува до четири пати повеќе токени во секунда Во споредба со својот претходник, Nemotron 2 Nano, го намалува генерирањето на непотребни токени за расудување за околу 60%. Во пракса, ова значи подеднакво или дури и поточни одговори, но со помалку „зборливост“ и пониска цена по барање.
Хибридната архитектура на MoE, во комбинација со специфични техники за обука, доведе до Многу од најнапредните отворени модели прифаќаат експертски шемиNemotron 3 се приклучува на овој тренд, но се фокусира конкретно на агентската вештачка интелигенција: внатрешни рути дизајнирани за координација помеѓу агентите, употреба на алатки, ракување со долги состојби и планирање чекор-по-чекор.
Три големини: Nano, Super и Ultra за различни работни оптоварувања

Семејството Nemotron 3 е организирано во три главни големини на моделот на MoE, сите отворени и со намалени активни параметри благодарение на експертската архитектура:
- Немотрон 3 Нано: околу 30.000 милијарди вкупни параметри, со околу 3.000 милијарди средства по токенДизајниран е за целни задачи каде што ефикасноста е важна: дебагирање на софтвер, сумирање на документи, пребарување информации, следење на системот или специјализирани асистенти со вештачка интелигенција.
- Немотрон 3 Супер: приближно 100.000 милијарди параметри, со 10.000 милијарди во средства на секој чекор. Насочено е кон Напредно расудување во мултиагентски архитектурисо ниска латенција дури и кога повеќе агенти соработуваат за решавање на сложени текови.
- Немотрон 3 Ултра: горното ниво, со приближно 500.000 милијарди параметри и до 50.000 милијарди средства по токенФункционира како моќен мотор за расудување за истражување, стратешко планирање, поддршка на одлуки на високо ниво и особено тешки системи со вештачка интелигенција.
Во пракса, ова им овозможува на организациите Изберете ја големината на моделот според вашиот буџет и потребиNano за масивни, интензивни работни оптоварувања и мали трошоци; Super кога е потребно поголемо длабинско размислување со многу соработувачки агенти; и Ultra за случаи каде што квалитетот и долгиот контекст ги надминуваат трошоците за графичкиот процесор.
За сега Само Nemotron 3 Nano е достапен за непосредна употреба.Варијантите „Супер“ и „Ултра“ се планирани за првата половина на 2026 година, давајќи им време на европските компании и лаборатории прво да експериментираат со „Нано“, да воспостават цевководи, а подоцна и да мигрираат случаи што бараат поголем капацитет.
Nemotron 3 Nano: прозорец од 1 милион токени и ограничен трошок

Nemotron 3 Nano, од денес, практичниот предводник на семејствотоNVIDIA го опишува како најисплатлив модел во својата класа, оптимизиран за да испорача максимални перформанси во работни процеси со повеќе агенти и интензивни, но повторувачки задачи.
Меѓу неговите технички карактеристики, се издвојуваат следниве: контекстен прозорец со до еден милион токениОва овозможува задржување на меморијата за обемни документи, цели складишта на код или повеќечекорни деловни процеси. За европските апликации во банкарството, здравството или јавната администрација, каде што записите можат да бидат обемни, оваа долгорочна контекстуална способност е особено вредна.
Стандардите на независната организација Вештачката анализа го сместува Nemotron 3 Nano како еден од најбалансираните модели со отворен код. Комбинира интелигенција, точност и брзина, со стапки на проток од стотици токени во секунда. Оваа комбинација го прави привлечен за интеграторите на вештачка интелигенција и давателите на услуги во Шпанија на кои им е потребно добро корисничко искуство без вртоглаво зголемување на трошоците за инфраструктура.
Во однос на случаите на употреба, NVIDIA го таргетира Nano на Резиме на содржина, дебагирање на софтвер, пребарување информации и асистенти за интелигенција во претпријатијатаБлагодарение на намалувањето на редундантните токени за расудување, можно е да се извршуваат агенти кои одржуваат долги разговори со корисници или системи без сметката за инференција да расте вртоглаво.
Отворени податоци и библиотеки: NeMo Gym, NeMo RL и Evaluator

Една од најкарактеристичните карактеристики на Nemotron 3 е тоа што Не е ограничено само на објавување на тежини на моделитеNVIDIA го придружува семејството со сеопфатен пакет отворени ресурси за обука, подесување и евалуација на агенти.
Од една страна, тоа става на располагање синтетички корпус од неколку трилиони токени на податоци за претходна обука, пост-обука и засилувањеОвие бази на податоци, фокусирани на расудување, кодирање и повеќечекорни работни процеси, им овозможуваат на компаниите и истражувачките центри да генерираат свои варијанти на Nemotron специфични за доменот (на пр., правни, здравствени или индустриски) без да почнуваат од нула.
Меѓу овие ресурси, се издвојува следново: Безбедносен збир на податоци за Nemotron AgentСобира телеметриски податоци за однесувањето на агентите во сценарија од реалниот свет. Неговата цел е да им помогне на тимовите да ја измерат и зајакнат безбедноста на сложените автономни системи: од тоа какви дејствија презема агентот кога ќе наиде на чувствителни податоци, до тоа како реагира на двосмислени или потенцијално штетни команди.
Во врска со делот за алатки, NVIDIA лансира NeMo Gym и NeMo RL како библиотеки со отворен код за обука за засилување и пост-обука, заедно со NeMo Evaluator за проценка на безбедноста и перформансите. Овие библиотеки обезбедуваат готови за употреба симулациски средини и цевководи со семејството Nemotron, но можат да се прошират и на други модели.
Целиот овој материјал - тежини, бази на податоци и код - е дистрибуиран преку GitHub и Hugging Face се лиценцирани според NVIDIA Open Model License.за да можат европските тимови беспрекорно да го интегрираат во своите MLOps. Компании како Prime Intellect и Unsloth веќе го вклучуваат NeMo Gym директно во своите работни процеси за да го поедностават учењето со засилување на Nemotron.
Достапност во јавни облаци и европскиот екосистем

Nemotron 3 Nano сега е достапен на Гушкање на лицето y GitHubкако и преку даватели на инференции како што се Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter и Together AI. Ова им отвора врата на тимовите за развој во Шпанија да го тестираат моделот преку API или да го распоредат на сопствени инфраструктури без прекумерна сложеност.
На фронтот на облаците, Nemotron 3 Nano се приклучува на AWS преку Amazon Bedrock за инференција без сервер и најави поддршка за Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale и Yotta. За европските организации кои веќе работат на овие платформи, ова го олеснува усвојувањето на Nemotron без драстични промени во нивната архитектура.
Покрај јавниот облак, NVIDIA ја промовира употребата на Nemotron 3 Nano како NIM микросервис што може да се распореди на која било инфраструктура забрзана од NVIDIAОва овозможува хибридни сценарија: дел од оптоварувањето во меѓународни облаци, а дел во локални центри за податоци или во европски облаци кои даваат приоритет на престојот на податоците во ЕУ.
Верзиите Немотрон 3 Супер и Ултра, насочени кон екстремни работни оптоварувања со расудување и големи мултиагентски системи, се планирано за првата половина од 2026 годинаОваа временска рамка им овозможува на европските истражувачки и деловни екосистеми време да експериментираат со Nano, да ги потврдат случаите на употреба и да дизајнираат стратегии за миграција кон поголеми модели кога е потребно.
Nemotron 3 ја позиционира NVIDIA како еден од водечките добавувачи на отворени модели од висока класа насочени кон агентска вештачка интелигенцијаСо предлог што ги спојува техничката ефикасност (хибридно Министерство за образование, NVFP4, масивен контекст), отвореноста (тежини, бази на податоци и достапни библиотеки) и јасен фокус на суверенитетот и транспарентноста на податоците, аспекти што се особено чувствителни во Шпанија и остатокот од Европа, каде што регулативата и притисокот за ревизија на вештачката интелигенција се сè поголеми.
Јас сум технолошки ентузијаст кој своите „гикови“ интереси ги претвори во професија. Поминав повеќе од 10 години од мојот живот користејќи најсовремена технологија и непречено со сите видови програми од чиста љубопитност. Сега сум специјализиран за компјутерска технологија и видео игри. Тоа е затоа што повеќе од 5 години пишувам за различни веб-локации за технологија и видео игри, создавајќи статии кои се обидуваат да ви ги дадат потребните информации на јазик што е разбирлив за секого.
Ако имате прашања, моето знаење се движи од се што е поврзано со оперативниот систем Виндоус како и Андроид за мобилни телефони. И мојата посветеност е кон вас, јас сум секогаш подготвен да потрошам неколку минути и да ви помогнам да ги решите сите прашања што може да ги имате во овој интернет свет.
