Nemotron 3: NVIDIA のマルチエージェント AI への大きな賭け

最終更新: 17/12/2025

  • Nemotron 3 は、エージェント AI とマルチエージェント システムに重点を置いたモデル、データ、ライブラリのオープン ファミリです。
  • これには、ハイブリッド アーキテクチャと NVIDIA Blackwell での効率的な 4 ビット トレーニングを備えた 3 つの MoE サイズ (Nano、Super、Ultra) が含まれます。
  • Nemotron 3 Nano は現在、Hugging Face、パブリック クラウド、および NIM マイクロサービスを通じて、1 万トークンのウィンドウでヨーロッパでご利用いただけます。
  • エコシステムは、主権 AI エージェントをトレーニング、調整、監査するための大規模なデータセット、NeMo Gym、NeMo RL、Evaluator によって完成されています。

Nemotron 3 人工知能モデル

人工知能の競争は、単純で孤立したチャットボットから、互いに連携し、長いワークフローを管理し、監査可能なエージェントシステムへと移行しつつあります。この新しいシナリオでは、 NVIDIAは、モデルだけでなく、データやツールも公開するという、かなり明確なステップを踏むことを決定しました。企業、行政機関、研究センターが、より制御力の高い独自の AI プラットフォームを構築できるようにします。

その運動は Nemotron 3は、マルチエージェントAI向けのオープンモデルファミリーです。 高性能、低推論コスト、そして透明性を兼ね備えることを目指しています。この提案は、単なる汎用チャットボットではなく、 規制対象分野で複雑なタスクを推論、計画、実行するエージェントを展開するための基盤これは、データの主権と規制遵守が重要なヨーロッパとスペインで特に当てはまります。

エージェント型および主権型AIのためのオープンなモデルファミリー

ネモトロン3は 完全なエコシステム:モデル、データセット、ライブラリ、トレーニングレシピ オープンライセンスの下で提供されます。NVIDIA の考えは、組織が AI を単に非公開のサービスとして利用するだけでなく、その中身を検査し、モデルを自社の領域に適応させ、クラウドでもローカルデータセンターでも自社のインフラストラクチャに展開できるようにすることです。

同社はこの戦略を、 主権型AI欧州、韓国、その他の地域の政府や企業は、データ保護法や監査要件に適合しないことが多い閉鎖的または外国のシステムに代わるオープンな代替手段を求めています。Nemotron 3は、より優れた可視性と制御性を備えた国家、セクター、または企業モデルを構築するための技術基盤となることを目指しています。

並行して、 NVIDIAはハードウェア以外の分野でも地位を強化これまでは主にリファレンスGPUプロバイダーでしたが、Nemotron 3ではモデリングおよびトレーニングツールレイヤーにも位置付けられ、OpenAI、Google、Anthropic、Metaなどのプレーヤーや、次のようなプレミアムモデルと直接競合します。 スーパーグロクヘビーMeta は、最近の世代の Llama においてオープンソースへの取り組みを減らしてきました。

ハギングフェイスのようなプラットフォームでホストされているオープンモデルに大きく依存しているヨーロッパの研究およびスタートアップエコシステムにとって、オープンライセンスの下での重み、合成データ、ライブラリの利用可能性は、従来のモデルに代わる強力な代替手段となります。 中国のモデル 人気とベンチマークランキングを独占しているアメリカ人。

限定コンテンツ - ここをクリックしてください  Microsoft Store が開かない、または閉じ続ける場合の詳細な解決策

ハイブリッドMoEアーキテクチャ:大規模エージェントの効率性

ネモトロン3の中心的な技術的特徴は 潜在的な専門家の混合(MoE)のハイブリッドアーキテクチャ各推論でモデルのパラメータをすべてアクティブ化するのではなく、問題のタスクまたはトークンに最も関連性の高いエキスパートのサブセットであるパラメータの一部のみをオンにします。

このアプローチにより、 計算コストとメモリ消費を大幅に削減これにより、トークンのスループットも向上します。数十または数百のエージェントが継続的にメッセージを交換するマルチエージェントアーキテクチャでは、この効率性が、GPUとクラウドのコストの観点からシステムが持続不可能になるのを防ぐ鍵となります。

NVIDIAと独立したベンチマークによって共有されたデータによると、Nemotron 3 Nanoは 1秒あたり最大4倍のトークン 前機種のNemotron 2 Nanoと比較すると、不要な推論トークンの生成が約60%削減されています。これは、従来機種と同等、あるいはそれ以上の精度で回答が得られることを意味しますが、「冗長性」は軽減され、クエリあたりのコストも削減されます。

ハイブリッドMoEアーキテクチャと特定のトレーニングテクニックを組み合わせることで、 最も先進的なオープンモデルの多くは専門家のスキームを採用しているNemotron 3 もこのトレンドに加わっていますが、エージェント間の調整、ツールの使用、長い状態の処理、段階的な計画のために設計された内部ルートなど、エージェント AI に特に重点を置いています。

3 つのサイズ: さまざまなワークロードに対応する Nano、Super、Ultra

Nemotron 3 モデルアーキテクチャ

Nemotron 3ファミリーは、 MoEモデルの3つの主なサイズエキスパートアーキテクチャのおかげで、それらはすべてオープンで、アクティブなパラメータが削減されています。

  • ネモトロン3ナノ: 合計約30.000億のパラメータがあり、 トークンあたり3.000億資産ソフトウェアのデバッグ、ドキュメントの要約、情報の取得、システムの監視、特殊な AI アシスタントなど、効率が重要となる対象タスク向けに設計されています。
  • ネモトロン3スーパー:約100.000億のパラメータ、 資産10.000億ドル あらゆる段階で。 マルチエージェントアーキテクチャにおける高度な推論複数のエージェントが協力して複雑なフローを解決する場合でも、低レイテンシを実現します。
  • ネモトロン3ウルトラ: 上位レベルでは、約500.000億のパラメータがあり、最大 トークンあたり50.000億資産これは、研究、戦略計画、高度な意思決定サポート、特に要求の厳しい AI システム向けの強力な推論エンジンとして機能します。

実際には、組織は 予算と要件に応じてモデルサイズを選択してください大規模で集中的なワークロードと厳しいコストには Nano を使用します。多くの連携エージェントでより深い推論が必要な場合は Super を使用します。品質と長いコンテキストが GPU コストを上回る場合は Ultra を使用します。

限定コンテンツ - ここをクリックしてください  タグ・ホイヤー コネクテッド キャリバー E5:独自ソフトウェアとニューバランスエディションへの飛躍

今のところ すぐに使用できるのは Nemotron 3 Nano のみです。SuperおよびUltraバリアントは2026年前半に予定されており、欧州の企業や研究所はまずNanoで実験を行い、パイプラインを確立し、その後、より大きな容量を必要とするケースに移行する時間を持つことになります。

Nemotron 3 Nano: 1万トークンウィンドウとコストの抑制

ネモトロン3ナノ

Nemotron 3 Nanoは、今日現在、 家族の実質的な先鋒NVIDIA は、この製品をこの範囲で最も計算コスト効率の高いモデルであり、マルチエージェント ワークフローと集中的だが反復的なタスクで最高のパフォーマンスを発揮するように最適化されていると説明しています。

その技術的な特徴の中で、特に注目すべきものは次のとおりです。 最大100万トークンのコンテキストウィンドウこれにより、膨大なドキュメント、コードリポジトリ全体、あるいは複数ステップのビジネスプロセスといったメモリの保持が可能になります。記録が膨大になる可能性がある銀行、医療、行政といった欧州のアプリケーションでは、この長期コンテキスト機能は特に貴重です。

独立組織のベンチマーク 人工分析では、Nemotron 3 Nanoが最もバランスの取れたオープンソースモデルの1つであると評価されています。 インテリジェンス、精度、スピードを兼ね備え、毎秒数百トークンのスループットを実現します。この組み合わせは、インフラコストを高騰させることなく優れたユーザーエクスペリエンスを求めるスペインのAIインテグレーターやサービスプロバイダーにとって魅力的な選択肢です。

使用事例の点では、NVIDIAはNanoを次のような用途にターゲットとしています。 コンテンツ要約、ソフトウェアデバッグ、情報検索、エンタープライズAIアシスタント冗長な推論トークンの削減により、推論コストが急騰することなく、ユーザーやシステムとの長い会話を維持するエージェントを実行できるようになります。

オープンデータとライブラリ: NeMo Gym、NeMo RL、Evaluator

NeMoライブラリ

Nemotron 3の最も特徴的な機能の一つは モデルの重量を解放することに限定されないNVIDIA は、エージェントのトレーニング、チューニング、評価のための包括的なオープン リソース スイートをこのファミリに提供します。

一方で、それは次のような合成コーパスを提供する。 数兆トークンの事前トレーニング、事後トレーニング、強化データこれらのデータセットは、推論、コーディング、および複数ステップのワークフローに重点を置いており、企業や研究センターは、ゼロから始めることなく、Nemotron の独自のドメイン固有のバリアント (法律、医療、産業など) を生成できます。

これらのリソースの中で、特に注目すべきものは次のとおりです。 Nemotron Agentic Safetyデータセット現実世界のシナリオにおけるエージェントの行動に関するテレメトリデータを収集します。その目的は、複雑な自律システムのセキュリティを測定・強化するためのチームを支援することです。具体的には、エージェントが機密データに遭遇したときにどのような行動を取るか、曖昧なコマンドや潜在的に有害なコマンドにどのように反応するかなどを把握します。

限定コンテンツ - ここをクリックしてください  Windows 11 の最新機能: 人工知能と PC を管理する新しい方法

ツールセクションに関しては、NVIDIAは オープンソースライブラリとしてのNeMo GymとNeMo RL 強化訓練および事後訓練用のライブラリ、そして安全性とパフォーマンスを評価するためのNeMo Evaluatorが付属しています。これらのライブラリは、Nemotronファミリーですぐに使用できるシミュレーション環境とパイプラインを提供しますが、他のモデルにも拡張可能です。

このすべての資料(重み、データセット、コード)は、 GitHub と Hugging Face は、NVIDIA Open Model License に基づいてライセンスされています。これにより、ヨーロッパのチームは自社のMLOpsにシームレスに統合できるようになります。Prime IntellectやUnslothといった企業は、NeMo Gymを自社のワークフローに直接組み込んで、Nemotronでの強化学習を簡素化しています。

パブリッククラウドと欧州のエコシステムにおける可用性

ネモトロン3ナノハギングフェイス

Nemotron 3 Nanoは現在入手可能です ハグ顔 y GitHubまた、Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter、Together AIなどの推論プロバイダーを通じても利用可能です。これにより、スペインの開発チームはAPI経由でモデルをテストしたり、過度な複雑さを伴わずに自社のインフラにデプロイしたりすることが可能になります。

クラウドに関しては、 Nemotron 3 Nano が Amazon Bedrock 経由で AWS に参加 サーバーレス推論向けにNemotronを開発し、Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale、Yottaへのサポートを発表しました。これらのプラットフォームを既に利用している欧州の組織にとって、アーキテクチャに大きな変更を加えることなくNemotronを導入しやすくなります。

パブリッククラウドに加えて、NVIDIAはNemotron 3 Nanoを あらゆる NVIDIA アクセラレーション インフラストラクチャにデプロイ可能な NIM マイクロサービスこれにより、ハイブリッド シナリオが可能になります。つまり、負荷の一部を国際クラウドに分散し、残りをローカル データ センターまたは EU 内のデータ保存を優先するヨーロッパのクラウドに分散することができます。

バージョン ネモトロン3スーパーとウルトラ、 極限推論ワークロードと大規模マルチエージェントシステム向けに設計されており、 2026年上半期に予定このタイムラインにより、欧州の研究およびビジネス エコシステムは Nano を実験し、ユース ケースを検証し、必要に応じてより大規模なモデルへの移行戦略を設計する時間を持つことができます。

Nemotron 3により、NVIDIAは エージェントAI向けのハイエンドオープンモデルこの提案では、技術的な効率性(ハイブリッド MoE、NVFP4、大規模なコンテキスト)、オープン性(重み、データセット、利用可能なライブラリ)、そしてデータの主権と透明性への明確な焦点が組み合わされています。これらの側面は、AI の監査に対する規制と圧力がますます高まっているスペインやその他のヨーロッパ諸国では​​特に敏感な問題です。

マイクロソフト ディスカバリー IA-2
関連記事
Microsoft Discovery AI は、パーソナライズされた人工知能によって科学と教育のブレークスルーを推進します。