Nemotron 3: велика відкрита ставка NVIDIA на багатоагентний штучний інтелект

Останнє оновлення: 17/12/2025

  • Nemotron 3 — це відкрите сімейство моделей, даних та бібліотек, орієнтованих на агентний штучний інтелект та багатоагентні системи.
  • Він включає три розміри MoE (Nano, Super та Ultra) з гібридною архітектурою та ефективним 4-бітним навчанням на NVIDIA Blackwell.
  • Nemotron 3 Nano тепер доступний у Європі через Hugging Face, публічні хмари та як мікросервіс NIM, з вікном в 1 мільйон токенів.
  • Екосистема доповнена масивними наборами даних, NeMo Gym, NeMo RL та Evaluator для навчання, налаштування та аудиту суверенних агентів штучного інтелекту.

Модель штучного інтелекту Nemotron 3

Перегони за штучний інтелект переходять від простих, ізольованих чат-ботів до агентних систем, які співпрацюють один з одним, керують тривалими робочими процесами та повинні бути доступними для аудиту. У цьому новому сценарії, NVIDIA вирішила зробити досить чіткий крок: відкрити не лише моделі, а й дані та інструментищоб компанії, державні адміністрації та дослідницькі центри могли створювати власні платформи штучного інтелекту з більшим контролем.

Цей рух матеріалізується в Nemotron 3, сімейство відкритих моделей, орієнтованих на багатоагентний штучний інтелект Він прагне поєднати високу продуктивність, низькі витрати на логічний висновок та прозорість. Пропозиція не задумана як черговий універсальний чат-бот, а як база для розгортання агентів, які міркують, планують та виконують складні завдання в регульованих секторахЦе особливо актуально в Європі та Іспанії, де важливі суверенітет даних та дотримання нормативних вимог.

Відкрита сім'я моделей для агентного та суверенного ШІ

Немотрон 3 представлений як повна екосистема: моделі, набори даних, бібліотеки та рецепти навчання за відкритими ліцензіями. Ідея NVIDIA полягає в тому, щоб організації не лише споживали ШІ як непрозорий сервіс, але й могли перевіряти, що знаходиться всередині, адаптувати моделі до своїх доменів та розгортати їх на власній інфраструктурі, чи то в хмарі, чи в локальних центрах обробки даних.

Компанія формулює цю стратегію в рамках свого зобов'язання Суверенний ШІУряди та компанії в Європі, Південній Кореї та інших регіонах шукають відкриті альтернативи закритим або іноземним системам, які часто не відповідають їхнім законам про захист даних чи вимогам аудиту. Nemotron 3 прагне стати технічною основою, на якій можна будувати національні, галузеві або корпоративні моделі з більшою прозорістю та контролем.

Паралельно, NVIDIA зміцнює свої позиції поза межами апаратного забезпеченняДосі він був переважно постачальником еталонних графічних процесорів; з Nemotron 3 він також позиціонує себе на рівні інструментів моделювання та навчання, конкуруючи більш безпосередньо з такими гравцями, як OpenAI, Google, Anthropic або навіть Meta, а також з преміальними моделями, такими як СуперГрок ВажкийВ останніх поколіннях Llama Meta зменшує свою прихильність до відкритого коду.

Для європейської дослідницької та стартап-екосистеми, яка значною мірою залежить від відкритих моделей, розміщених на таких платформах, як Hugging Face, доступність ваг, синтетичних даних та бібліотек за відкритими ліцензіями є потужною альтернативою... китайські моделі та американці, які домінують у рейтингах популярності та бенчмарків.

Ексклюзивний вміст - натисніть тут  Магазин Microsoft не відкривається або постійно закривається: детальні рішення

Гібридна архітектура MoE: ефективність для великомасштабних агентів

Центральною технічною особливістю Nemotron 3 є Гібридна архітектура латентної суміші експертів (MoE)Замість активації всіх параметрів моделі в кожному висновку, вмикається лише їх частина, тобто підмножина експертів, найбільш релевантних для даного завдання або токена.

Такий підхід дозволяє різко зменшити обчислювальні витрати та споживання пам'ятіЦе також збільшує пропускну здатність токенів. Для багатоагентних архітектур, де десятки або сотні агентів безперервно обмінюються повідомленнями, ця ефективність є ключовою для запобігання нестійкості системи з точки зору витрат на графічний процесор та хмару.

Згідно з даними, опублікованими NVIDIA, та незалежними бенчмарками, Nemotron 3 Nano досягає до чотирьох разів більше токенів за секунду Порівняно зі своїм попередником, Nemotron 2 Nano, він зменшує генерацію непотрібних токенів міркувань приблизно на 60%. На практиці це означає однаково або навіть точніші відповіді, але з меншою «багатослівністю» та нижчою вартістю за запит.

Гібридна архітектура Міністерства освіти у поєднанні зі специфічними методами навчання призвела до Багато найсучасніших відкритих моделей використовують експертні схемиNemotron 3 приєднується до цієї тенденції, але зосереджується саме на агентному ШІ: внутрішніх маршрутах, розроблених для координації між агентами, використання інструментів, обробки довгих станів та покрокового планування.

Три розміри: Nano, Super та Ultra для різних робочих навантажень

Архітектура моделі Nemotron 3

Сімейство Nemotron 3 організовано в три основні розміри моделі Міністерства освіти, всі вони відкриті та зі зниженими активними параметрами завдяки експертній архітектурі:

  • Немотрон 3 Наноблизько 30.000 мільярдів загальних параметрів, з яких приблизно 3.000 мільярдів активів на токенВін розроблений для цільових завдань, де важлива ефективність: налагодження програмного забезпечення, узагальнення документів, пошук інформації, моніторинг системи або спеціалізовані помічники зі штучним інтелектом.
  • Немотрон 3 Суперприблизно 100.000 мільярдів параметрів, з 10.000 мільярдів активів на кожному кроці. Це спрямовано на Розширене мислення в багатоагентних архітектурахз низькою затримкою, навіть коли кілька агентів співпрацюють для вирішення складних потоків.
  • Немотрон 3 Ультра: верхній рівень, з приблизно 500.000 мільярдами параметрів і до 50.000 мільярдів активів на токенВін працює як потужний механізм міркувань для досліджень, стратегічного планування, підтримки рішень високого рівня та особливо вимогливих систем штучного інтелекту.

На практиці це дозволяє організаціям Оберіть розмір моделі відповідно до вашого бюджету та вимогNano для масивних, інтенсивних робочих навантажень та обмежених витрат; Super, коли потрібна глибша аргументація з багатьма агентами, що співпрацюють; та Ultra для випадків, коли якість та тривалий контекст переважають вартість графічного процесора.

Ексклюзивний вміст - натисніть тут  TAG Heuer Connected Calibre E5: перехід до власного програмного забезпечення та видання New Balance

Зараз Для негайного використання доступний лише Nemotron 3 Nano.Випуск варіантів Super та Ultra запланований на першу половину 2026 року, що дасть європейським компаніям та лабораторіям час спочатку поекспериментувати з Nano, налагодити конвеєри, а пізніше перенести корпуси, що потребують більшої потужності.

Nemotron 3 Nano: вікно в 1 мільйон токенів та обмежена вартість

Немотрон 3 Нано

Nemotron 3 Nano, станом на сьогодні, практичний лідер сім'їNVIDIA описує її як найефективнішу з точки зору обчислювальної вартості модель у лінійці, оптимізовану для забезпечення максимальної продуктивності в багатоагентних робочих процесах та інтенсивних, але повторюваних завданнях.

Серед його технічних особливостей виділяються наступні: контекстне вікно до одного мільйона токенівЦе дозволяє зберігати пам'ять для великих документів, цілих репозиторіїв коду або багатоетапних бізнес-процесів. Для європейських застосувань у банківській справі, охороні здоров'я чи державному управлінні, де записи можуть бути об'ємними, ця можливість довгострокового контексту є особливо цінною.

Орієнтири незалежної організації Штучний аналіз ставить Nemotron 3 Nano в число найбільш збалансованих моделей з відкритим кодом. Він поєднує інтелект, точність і швидкість з пропускною здатністю в сотні токенів за секунду. Це поєднання робить його привабливим для інтеграторів штучного інтелекту та постачальників послуг в Іспанії, яким потрібен хороший користувацький досвід без стрімкого зростання витрат на інфраструктуру.

Що стосується варіантів використання, NVIDIA орієнтується на Nano. Короткий зміст, налагодження програмного забезпечення, пошук інформації та помічники корпоративного штучного інтелектуЗавдяки зменшенню надлишкових токенів міркувань, можливо запускати агентів, які підтримують тривалі розмови з користувачами або системами, без стрімкого зростання витрат на логічний висновок.

Відкриті дані та бібліотеки: NeMo Gym, NeMo RL та Evaluator

Бібліотеки NeMo

Одна з найвиразніших особливостей Nemotron 3 полягає в тому, що Це не обмежується лише випуском ваг моделіNVIDIA супроводжує сімейство продуктів комплексним набором відкритих ресурсів для навчання, налаштування та оцінки агентів.

З одного боку, це надає доступ до синтетичного корпусу кілька трильйонів токенів даних про дотренінг, післятренінг та підкріпленняЦі набори даних, зосереджені на міркуваннях, кодуванні та багатоетапних робочих процесах, дозволяють компаніям та дослідницьким центрам створювати власні варіанти Nemotron, специфічні для певної галузі (наприклад, юридичної, медичної чи промислової), не починаючи з нуля.

Серед цих ресурсів виділяються наступні: Набір даних про безпеку агентів NemotronВін збирає телеметричні дані про поведінку агентів у реальних сценаріях. Його мета — допомогти командам вимірювати та посилювати безпеку складних автономних систем: від дій, які виконує агент, коли стикається з конфіденційними даними, до реакції на неоднозначні або потенційно шкідливі команди.

Ексклюзивний вміст - натисніть тут  Найновіші функції Windows 11: штучний інтелект та нові способи керування ПК

Щодо розділу інструментів, NVIDIA запускає NeMo Gym та NeMo RL як бібліотеки з відкритим кодом для навчання з підкріплення та подальшого навчання, а також NeMo Evaluator для оцінки безпеки та продуктивності. Ці бібліотеки надають готові до використання середовища моделювання та конвеєри з сімейством Nemotron, але можуть бути розширені на інші моделі.

Весь цей матеріал — ваги, набори даних і код — поширюється через GitHub та Hugging Face ліцензовані відповідно до ліцензії NVIDIA Open Model License.щоб європейські команди могли безперешкодно інтегрувати його у власні MLO-операції. Такі компанії, як Prime Intellect та Unsloth, вже інтегрують NeMo Gym безпосередньо у свої робочі процеси, щоб спростити навчання з підкріпленням на Nemotron.

Доступність у публічних хмарах та європейській екосистемі

Обіймальний пристрій Nemotron 3 Nano

Nemotron 3 Nano тепер доступний за адресою Обіймати обличчя y GitHubа також через постачальників послуг логічного виводу, таких як Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter та Together AI. Це відкриває можливості для команд розробників в Іспанії тестувати модель через API або розгортати її на власній інфраструктурі без надмірної складності.

На хмарному фронті, Nemotron 3 Nano приєднується до AWS через Amazon Bedrock для безсерверного логічного висновку та оголосила про підтримку Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale та Yotta. Для європейських організацій, які вже працюють на цих платформах, це полегшує впровадження Nemotron без кардинальних змін у їхній архітектурі.

Окрім публічної хмари, NVIDIA просуває використання Nemotron 3 Nano як Мікросервіс NIM, який можна розгорнути на будь-якій інфраструктурі з прискоренням NVIDIAЦе дозволяє реалізувати гібридні сценарії: частину навантаження розмістити в міжнародних хмарах, а частину — в локальних центрах обробки даних або в європейських хмарах, які надають пріоритет місцезнаходженню даних у ЄС.

Версії Немотрон 3 Супер та Ультра, орієнтовані на екстремальні навантаження міркувань та великомасштабні багатоагентні системи, є заплановано на першу половину 2026 рокуЦей графік дає європейській дослідницькій та бізнес-екосистемі час для експериментів з Nano, перевірки варіантів використання та розробки стратегій міграції до більших моделей, коли це необхідно.

Nemotron 3 позиціонує NVIDIA як одного з провідних постачальників високоякісні відкриті моделі, орієнтовані на агентний ШІЗ пропозицією, яка поєднує технічну ефективність (гібридний MoE, NVFP4, масивний контекст), відкритість (ваги, набори даних та доступні бібліотеки) та чіткий акцент на суверенітеті та прозорості даних, аспектах, які є особливо чутливими в Іспанії та решті Європи, де регулювання та тиск на аудит ШІ дедалі посилюються.

Microsoft Discovery IA-2
Пов'язана стаття:
Microsoft Discovery AI здійснює наукові та освітні прориви за допомогою персоналізованого штучного інтелекту