- Nemotron 3 — гэта адкрытае сямейства мадэляў, дадзеных і бібліятэк, арыентаваных на агентны штучны інтэлект і шматагентныя сістэмы.
- Ён уключае тры памеры MoE (Nano, Super і Ultra) з гібрыднай архітэктурай і эфектыўным 4-бітным навучаннем на NVIDIA Blackwell.
- Nemotron 3 Nano цяпер даступны ў Еўропе праз Hugging Face, публічныя воблакі і ў выглядзе мікрасэрвісу NIM з акном у 1 мільён токенаў.
- Экасістэма дапоўнена велізарнымі наборамі дадзеных, NeMo Gym, NeMo RL і Evaluator для навучання, наладкі і аўдыту суверэнных агентаў штучнага інтэлекту.
Гонка за штучным інтэлектам пераходзіць ад простых, ізаляваных чат-ботаў да сістэм агентаў, якія супрацоўнічаюць адзін з адным, кіруюць працяглымі працоўнымі працэсамі і павінны быць прыдатнымі для аўдыту. У гэтым новым сцэнарыі, NVIDIA вырашыла зрабіць даволі выразны крок: адкрыць не толькі мадэлі, але і дадзеныя, і інструментыкаб кампаніі, дзяржаўныя адміністрацыі і даследчыя цэнтры маглі ствараць свае ўласныя платформы штучнага інтэлекту з большым кантролем.
Гэты рух матэрыялізуецца ў Nemotron 3, сямейства адкрытых мадэляў, арыентаваных на шматагентны штучны інтэлект Ён імкнецца спалучыць высокую прадукцыйнасць, нізкія выдаткі на высновы і празрыстасць. Прапанова не задумана як чарговы універсальны чат-бот, а як база для разгортвання агентаў, якія разважаюць, плануюць і выконваюць складаныя задачы ў рэгуляваных сектарахГэта асабліва актуальна ў Еўропе і Іспаніі, дзе суверэнітэт дадзеных і адпаведнасць заканадаўчым патрабаванням маюць важнае значэнне.
Адкрытае сямейства мадэляў для агентнага і суверэннага штучнага інтэлекту
Немотрон 3 прадстаўлены як поўная экасістэма: мадэлі, наборы дадзеных, бібліятэкі і рэцэпты навучання пад адкрытымі ліцэнзіямі. Ідэя NVIDIA заключаецца ў тым, каб арганізацыі не толькі спажывалі штучны інтэлект як непразрыстую паслугу, але і маглі праглядаць, што знаходзіцца ўнутры, адаптаваць мадэлі да сваіх абласцей і разгортваць іх на ўласнай інфраструктуры, няхай гэта будзе ў воблаку або ў лакальных цэнтрах апрацоўкі дадзеных.
Кампанія апісвае гэтую стратэгію ў рамках сваіх абавязацельстваў Суверэнны ІІУрады і кампаніі ў Еўропе, Паўднёвай Карэі і іншых рэгіёнах шукаюць адкрытыя альтэрнатывы закрытым або замежным сістэмам, якія часта не адпавядаюць іх законам аб абароне дадзеных або патрабаванням да аўдыту. Nemotron 3 імкнецца стаць тэхнічнай асновай для стварэння нацыянальных, сектаральных або карпаратыўных мадэляў з большай празрыстасцю і кантролем.
Паралельна, NVIDIA умацоўвае свае пазіцыі не толькі на апаратным узроўніДагэтуль гэта быў у асноўным пастаўшчык эталонных графічных працэсараў; з Nemotron 3 ён таксама пазіцыянуе сябе на ўзроўні інструментаў мадэлявання і навучання, канкуруючы больш непасрэдна з такімі гульцамі, як OpenAI, Google, Anthropic ці нават Meta, а таксама з прэміяльнымі мадэлямі, такімі як СуперГрок ЦяжкіУ апошніх пакаленнях Llama Meta скараціла сваю прыхільнасць да адкрытага зыходнага кода.
Для еўрапейскай даследчай і стартап-экасістэмы, якая моцна залежыць ад адкрытых мадэляў, размешчаных на такіх платформах, як Hugging Face, даступнасць вагаў, сінтэтычных дадзеных і бібліятэк па адкрытых ліцэнзіях уяўляе сабой магутную альтэрнатыву... кітайскія мадэлі і амерыканцы, якія дамінуюць у рэйтынгу папулярнасці і эталонных паказчыкаў.
Гібрыдная архітэктура MoE: эфектыўнасць для буйных агентаў
Цэнтральнай тэхнічнай асаблівасцю Nemotron 3 з'яўляецца... Гібрыдная архітэктура латэнтнай сумесі экспертаў (Mixture-of-Experts, MoE)Замест таго, каб актываваць усе параметры мадэлі ў кожным вывадзе, уключаецца толькі іх частка — падмноства экспертаў, найбольш адпаведных задачы або токену, пра які ідзе гаворка.
Гэты падыход дазваляе значна знізіць вылічальныя выдаткі і спажыванне памяціГэта таксама павялічвае прапускную здольнасць токенаў. Для шматагентных архітэктур, дзе дзясяткі ці сотні агентаў бесперапынна абменьваюцца паведамленнямі, такая эфектыўнасць з'яўляецца ключом да прадухілення таго, каб сістэма стала неўстойлівай з пункту гледжання выдаткаў на графічны працэсар і воблака.
Згодна з дадзенымі, апублікаванымі NVIDIA, і незалежнымі тэстамі, Nemotron 3 Nano дасягае да чатырох разоў больш токенаў у секунду У параўнанні са сваім папярэднікам, Nemotron 2 Nano, ён памяншае генерацыю непатрэбных токенаў разважанняў прыкладна на 60%. На практыцы гэта азначае такія ж ці нават больш дакладныя адказы, але з меншай «слоўнасцю» і меншай коштам запыту.
Гібрыдная архітэктура Міністэрства адукацыі ў спалучэнні са спецыфічнымі метадамі навучання прывяла да Многія з найбольш перадавых адкрытых мадэляў выкарыстоўваюць экспертныя схемыNemotron 3 далучаецца да гэтай тэндэнцыі, але сканцэнтраваны менавіта на агентным штучным інтэлекце: унутраных маршрутах, прызначаных для каардынацыі паміж агентамі, выкарыстання інструментаў, апрацоўкі доўгіх станаў і пакрокавага планавання.
Тры памеры: Nano, Super і Ultra для розных нагрузак

Сямейства Nemotron 3 арганізавана ў тры асноўныя памеры мадэлі Міністэрства адукацыі, усе яны адкрытыя і са зніжанымі актыўнымі параметрамі дзякуючы экспертнай архітэктуры:
- Немотрон 3 Нанакаля 30.000 мільярдаў параметраў у агульнай складанасці, з якіх каля 3.000 мільярдаў актываў на токенЁн прызначаны для мэтанакіраваных задач, дзе важная эфектыўнасць: адладка праграмнага забеспячэння, падсумаванне дакументаў, пошук інфармацыі, маніторынг сістэмы або спецыялізаваныя памочнікі са штучным інтэлектам.
- Немотрон 3 Суперпрыблізна 100.000 мільярдаў параметраў, з 10.000 мільярдаў актываў на кожным кроку. Гэта накіравана на Пашыранае мысленне ў шматагентных архітэктурахз нізкай затрымкай, нават калі некалькі агентаў супрацоўнічаюць для вырашэння складаных патокаў.
- Немотрон 3 Ультраверхні ўзровень, з прыблізна 500.000 мільярдамі параметраў і да 50.000 мільярдаў актываў на токенЁн працуе як магутны рухавік разважанняў для даследаванняў, стратэгічнага планавання, падтрымкі прыняцця рашэнняў высокага ўзроўню і асабліва патрабавальных сістэм штучнага інтэлекту.
На практыцы гэта дазваляе арганізацыям Выберыце памер мадэлі ў адпаведнасці з вашым бюджэтам і патрабаванняміNano для велізарных, інтэнсіўных нагрузак і абмежаваных выдаткаў; Super, калі патрэбна больш глыбокая аргументацыя з вялікай колькасцю супрацоўнічаючых агентаў; і Ultra для выпадкаў, калі якасць і доўгі кантэкст перавышаюць кошт графічнага працэсара.
На дадзены момант, Для неадкладнага выкарыстання даступны толькі Nemotron 3 Nano.Выпуск варыянтаў Super і Ultra запланаваны на першую палову 2026 года, што дасць еўрапейскім кампаніям і лабараторыям час спачатку паэксперыментаваць з Nano, стварыць канвееры, а пазней перанесці корпуса, якія патрабуюць большай магутнасці.
Nemotron 3 Nano: акно з 1 мільёнам токенаў і абмежаваны кошт

Nemotron 3 Nano, на сённяшні дзень, практычны кіраўнік сям'іNVIDIA апісвае яе як найбольш вылічальна эфектыўную мадэль у лінейцы, аптымізаваную для забеспячэння максімальнай прадукцыйнасці ў шматагентных працоўных працэсах і інтэнсіўных, але паўтаральных задачах.
Сярод яго тэхнічных асаблівасцей вылучаюцца наступныя: кантэкстнае акно да аднаго мільёна токенаўГэта дазваляе захоўваць памяць для вялікіх дакументаў, цэлых рэпазіторыяў кода або шматэтапных бізнес-працэсаў. Для еўрапейскіх прыкладанняў у банкаўскай сферы, ахове здароўя або дзяржаўным кіраванні, дзе запісы могуць быць вельмі аб'ёмнымі, гэтая магчымасць доўгатэрміновага кантэксту асабліва каштоўная.
Крытэрыі незалежнай арганізацыі Штучны аналіз паказвае, што Nemotron 3 Nano з'яўляецца адной з найбольш збалансаваных мадэляў з адкрытым зыходным кодам. Ён спалучае ў сабе інтэлект, дакладнасць і хуткасць з прапускной здольнасцю ў сотні токенаў у секунду. Гэта спалучэнне робіць яго прывабным для інтэгратараў штучнага інтэлекту і пастаўшчыкоў паслуг у Іспаніі, якім патрэбен добры карыстальніцкі досвед без рэзкага росту выдаткаў на інфраструктуру.
Што тычыцца выпадкаў выкарыстання, NVIDIA арыентуецца на Nano. Кароткі змест, адладка праграмнага забеспячэння, пошук інфармацыі і памочнікі карпаратыўнага штучнага інтэлектуДзякуючы скарачэнню колькасці лішніх токенаў разважанняў, можна запускаць агентаў, якія падтрымліваюць працяглыя размовы з карыстальнікамі або сістэмамі, без рэзкага павелічэння выдаткаў на высновы.
Адкрытыя даныя і бібліятэкі: NeMo Gym, NeMo RL і Evaluator

Адной з найбольш адметных асаблівасцей Nemotron 3 з'яўляецца тое, што Гэта не абмяжоўваецца толькі публікацыяй вагі мадэліNVIDIA прапануе сямейства поўны набор адкрытых рэсурсаў для навучання, налады і ацэнкі агентаў.
З аднаго боку, гэта дае доступ да сінтэтычнага корпуса некалькі трыльёнаў токенаў дадзеных да навучання, пасля навучання і падмацаванняГэтыя наборы даных, арыентаваныя на разважанні, кадаванне і шматэтапныя працоўныя працэсы, дазваляюць кампаніям і даследчым цэнтрам ствараць свае ўласныя варыянты Nemotron для канкрэтных прадметаў (напрыклад, юрыдычнай, медыцынскай або прамысловай галіны), не пачынаючы з нуля.
Сярод гэтых рэсурсаў вылучаюцца наступныя: Набор дадзеных аб бяспецы агентаў NemotronЁн збірае тэлеметрычныя дадзеныя аб паводзінах агентаў у рэальных сцэнарыях. Яго мэта — дапамагчы камандам вымяраць і ўзмацняць бяспеку складаных аўтаномных сістэм: ад дзеянняў агента пры сутыкненні з канфідэнцыйнымі дадзенымі да рэакцыі на неадназначныя або патэнцыйна небяспечныя каманды.
Што тычыцца раздзела інструментаў, NVIDIA запускае NeMo Gym і NeMo RL як бібліятэкі з адкрытым зыходным кодам для навучання падмацавання і паслявузаўскага навучання, а таксама NeMo Evaluator для ацэнкі бяспекі і прадукцыйнасці. Гэтыя бібліятэкі забяспечваюць гатовыя да выкарыстання асяроддзі мадэлявання і канвееры з сямействам Nemotron, але могуць быць пашыраны на іншыя мадэлі.
Увесь гэты матэрыял — вагі, наборы дадзеных і код — распаўсюджваецца праз GitHub і Hugging Face ліцэнзаваны паводле ліцэнзіі NVIDIA Open Model.каб еўрапейскія каманды маглі лёгка інтэграваць яго ў свае ўласныя MLO-праграмы. Такія кампаніі, як Prime Intellect і Unsloth, ужо ўключаюць NeMo Gym непасрэдна ў свае працоўныя працэсы, каб спрасціць навучанне з падмацаваннем на Nemotron.
Даступнасць у публічных воблаках і еўрапейскай экасістэме

Nemotron 3 Nano цяпер даступны па адрасе Абдымаючы твар y GitHubа таксама праз пастаўшчыкоў вывадаў, такіх як Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter і Together AI. Гэта адкрывае магчымасці для каманд распрацоўшчыкаў у Іспаніі тэставаць мадэль праз API або разгортваць яе на ўласных інфраструктурах без празмернай складанасці.
На воблачным фронце, Nemotron 3 Nano далучаецца да AWS праз Amazon Bedrock для бессервернага вываду і абвясціла аб падтрымцы Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale і Yotta. Для еўрапейскіх арганізацый, якія ўжо працуюць на гэтых платформах, гэта спрашчае ўкараненне Nemotron без кардынальных змен у іх архітэктуры.
Акрамя публічнага воблака, NVIDIA прасоўвае выкарыстанне Nemotron 3 Nano як Мікрасэрвіс NIM можна разгарнуць на любой інфраструктуры з паскарэннем NVIDIAГэта дазваляе рэалізоўваць гібрыдныя сцэнарыі: частку нагрузкі размяшчаць у міжнародных воблаках, а частку — у лакальных цэнтрах апрацоўкі дадзеных або ў еўрапейскіх воблаках, якія аддаюць прыярытэт месцазнаходжанню дадзеных у ЕС.
Версіі Немотрон 3 Супер і Ультра, арыентаваныя на экстрэмальныя нагрузкі на разважанні і маштабныя шматагентныя сістэмы, з'яўляюцца запланавана на першую палову 2026 годаГэты графік дазваляе еўрапейскай даследчай і бізнес-экасістэме эксперыментаваць з Nano, правяраць варыянты выкарыстання і распрацоўваць стратэгіі міграцыі на больш буйныя мадэлі пры неабходнасці.
Nemotron 3 ставіць NVIDIA ў лік вядучых пастаўшчыкоў высакаякасныя адкрытыя мадэлі, арыентаваныя на агентыўны штучны інтэлектЗ прапановай, якая спалучае тэхнічную эфектыўнасць (гібрыдны MoE, NVFP4, масіўны кантэкст), адкрытасць (вагі, наборы дадзеных і даступныя бібліятэкі) і выразны акцэнт на суверэнітэт і празрыстасць дадзеных, аспекты, якія асабліва адчувальныя ў Іспаніі і астатняй Еўропе, дзе рэгуляванне і ціск на аўдыт штучнага інтэлекту ўсё больш узмацняюцца.
Я энтузіяст тэхналогій, які ператварыў свае інтарэсы "гікаў" у прафесію. Я правёў больш за 10 гадоў свайго жыцця, выкарыстоўваючы перадавыя тэхналогіі і важдаючыся з рознымі праграмамі з чыстай цікаўнасці. Цяпер я спецыялізаваўся на камп'ютарных тэхналогіях і відэагульнях. Гэта таму, што больш за 5 гадоў я працаваў для розных вэб-сайтаў, прысвечаных тэхналогіям і відэагульням, ствараючы артыкулы, якія імкнуцца даць вам неабходную інфармацыю на мове, зразумелай кожнаму.
Калі ў вас ёсць якія-небудзь пытанні, я ведаю ўсё, што звязана з аперацыйнай сістэмай Windows і Android для мабільных тэлефонаў. І я перад вамі абавязаны: я заўсёды гатовы выдаткаваць некалькі хвілін і дапамагчы вам вырашыць любыя пытанні, якія могуць узнікнуць у гэтым свеце Інтэрнэту.
