- Nemotron 3 是一個開放的模型、資料和函式庫系列,專注於智慧體人工智慧和多智能體系統。
- 它包含三種 MoE 尺寸(Nano、Super 和 Ultra),採用混合架構,並在 NVIDIA Blackwell 上進行高效的 4 位元訓練。
- Nemotron 3 Nano 現已在歐洲透過 Hugging Face、公有雲和 NIM 微服務提供,窗口期為 1 萬個代幣。
- 該生態系統包含海量資料集、NeMo Gym、NeMo RL 和評估器,用於訓練、調整和審核自主人工智慧代理。
人工智慧競賽正從簡單的、孤立的聊天機器人轉向能夠相互協作、管理冗長工作流程且需要可審計的代理系統。在這種新形勢下, NVIDIA 決定採取一項相當明確的措施:不僅開放模型,還開放資料和工具。這樣,企業、公共管理部門和研究中心就可以建立自己的AI平台,並擁有更大的控制權。
這項運動體現在 Nemotron 3 是一系列針對多智能體人工智慧的開放式模型。 它力求兼顧高性能、低推理成本和透明度。該方案並非旨在打造又一個通用聊天機器人,而是… 一個用於部署代理商的基礎平台,這些代理商能夠在受監管的行業中進行推理、規劃和執行複雜任務。這一點在歐洲和西班牙尤其重要,因為在這些地方,資料主權和監管合規性至關重要。
一套開放的、具有自主性和能動性的人工智慧模型。
Nemotron 3 的介紹如下: 一個完整的生態系統:模型、資料集、函式庫和訓練方案 在開放許可協議下。 NVIDIA 的理念是,企業不僅可以將 AI 作為一種不透明的服務來使用,還可以檢查其內部結構,根據自身領域調整模型,並將其部署在自己的基礎設施上,無論是在雲端還是在本地資料中心。
公司將這項策略置於其對以下方面的承諾框架內: 主權人工智慧歐洲、韓國及其他地區的政府和企業正在尋求開放的替代方案,以取代封閉或外國的系統,因為這些系統往往與本國的資料保護法律或審計要求不符。 Nemotron 3 旨在成為建立國家、產業或企業級模型的技術基礎,從而提高資料的可見度和控制力。
在平行下, NVIDIA 鞏固其在硬體以外的市場地位先前,該公司主要是一家參考GPU供應商;隨著Nemotron 3的推出,該公司也開始涉足建模和訓練工具領域,與OpenAI、Google、Anthropic甚至Meta等公司展開更直接的競爭,並與高階模型廠商展開較量。 超級格羅克重型在最近幾代 Llama 版本中,Meta 對開源的投入有所減少。
對於嚴重依賴 Hugging Face 等平台上託管的開放模式的歐洲研究和創業生態系統而言,以開放授權方式提供的權重、合成資料和函式庫代表了一種強而有力的替代方案。 中國模特兒 以及在人氣和基準排名中佔據主導地位的美國人。
混合型MoE架構:適用於大規模代理人的效率
Nemotron 3 的核心技術特點是 潛在混合專家(MoE)的混合架構每次推理時,模型不會激活所有參數,而是只激活其中的一部分,即與所討論的任務或標記最相關的專家子集。
這種方法允許 大幅降低計算成本和記憶體消耗這也有助於提高令牌吞吐量。對於多智能體架構而言,數十個甚至數百個智能體持續交換訊息,這種效率對於防止系統因GPU和雲端成本過高而難以承受至關重要。
根據NVIDIA分享的數據和獨立基準測試結果,Nemotron 3 Nano的性能達到… 每秒最多可生成四倍的令牌 與前代產品 Nemotron 2 Nano 相比,它減少了約 60% 不必要的推理標記的生成。實際上,這意味著答案的準確性相同甚至更高,但程式碼更簡潔,每次查詢的成本更低。
混合型MoE架構結合特定的訓練技術,已經取得了以下成果: 許多最先進的開放模型都採用了專家方案。Nemotron 3 也順應了這一趨勢,但更專注於智能體人工智慧:設計用於智能體之間協調的內部路徑、工具的使用、長期狀態的處理以及逐步規劃。
三種尺寸:Nano、Super 和 Ultra,分別適用於不同的工作負載。

Nemotron 3 系列產品分為以下幾類: MoE型號的三種主要尺寸得益於專家架構,它們全部開放且活動參數減少:
- Nemotron 3 Nano總共約有30.000億個參數,其中約 每個代幣包含 3.000 億資產它專為效率至關重要的特定任務而設計:軟體調試、文件摘要、資訊檢索、系統監控或專門的 AI 助理。
- Nemotron 3 Super約有100.000億個參數, 資產達10.000億美元 每一步都是如此。它旨在 多智能體架構中的高階推理即使多個智能體協作解決複雜流程,延遲也很低。
- Nemotron 3 Ultra:上層,大約有500.000億個參數,最高可達 每個代幣包含 50.000 億資產它可作為強大的推理引擎,用於研究、策略規劃、高階決策支持,以及對人工智慧系統要求特別高。
在實踐中,這使得組織能夠… 根據您的預算和需求選擇合適的型號尺寸Nano 適用於大規模、高強度工作負載和嚴格的成本控制;Super 適用於需要更多深度推理且涉及眾多協作代理的情況;Ultra 適用於品質和長時間上下文比 GPU 成本更重要的情況。
目前 目前只有 Nemotron 3 Nano 可供立即使用。Super 和 Ultra 版本計劃於 2026 年上半年推出,這將使歐洲公司和實驗室有時間先對 Nano 進行試驗,建立生產線,然後再遷移需要更大容量的案例。
Nemotron 3 Nano:1萬代幣窗口及成本控制

截至今日,Nemotron 3 Nano 是 家庭的實際先鋒NVIDIA 將其描述為該系列中計算成本效率最高的型號,經過最佳化,可在多智能體工作流程和密集型但重複性任務中提供最大性能。
在其眾多技術特點中,以下幾點尤為突出: 上下文視窗最多可達一百萬個令牌這使得記憶體能夠保存大量文件、整個程式碼庫或多步驟業務流程。對於銀行、醫療保健或公共管理等歐洲應用而言,由於記錄量可能非常龐大,因此這種長期情境記憶功能尤其重要。
獨立組織的基準 人工分析表明,Nemotron 3 Nano 是最均衡的開源模型之一。 它集智慧性、精準性和速度於一體,吞吐量高達每秒數百個代幣。這種組合使其對西班牙的AI整合商和服務提供者極具吸引力,他們既需要良好的使用者體驗,又不想承擔過高的基礎設施成本。
就應用場景而言,NVIDIA 將 Nano 的目標市場定位在… 內容摘要、軟體調試、資訊檢索和企業人工智慧助手由於減少了冗餘推理標記,因此可以運行與用戶或系統保持長時間對話的代理,而不會導致推理費用飆升。
開放資料和函式庫:NeMo Gym、NeMo RL 和 Evaluator

Nemotron 3 最顯著的特點之一是: 它不僅限於發布模型權重NVIDIA 為該系列產品提供了一套全面的開放資源,用於訓練、調優和評估代理。
一方面,它提供了一個合成語料庫 數萬億個預訓練、後訓練和強化訓練資料標記這些資料集著重於推理、編碼和多步驟工作流程,使公司和研究中心能夠產生自己的特定領域 Nemotron 變體(例如,法律、醫療保健或工業),而無需從頭開始。
在這些資源中,以下資源特別突出: Nemotron Agentic 安全資料集它收集真實場景中智能體行為的遙測資料。其目標是幫助團隊衡量和加強複雜自主系統的安全性:從智能體遇到敏感資料時採取的行動,到它如何應對模糊或潛在有害的指令。
關於工具部分,NVIDIA即將推出 NeMo Gym 和 NeMo RL 作為開源函式庫 這些庫用於強化訓練和訓練後評估,並配合 NeMo Evaluator 用於評估安全性和性能。它們為 Nemotron 系列提供了即用型模擬環境和流程,但也可以擴展到其他模型。
所有這些材料——權重、數據集和代碼——都透過以下方式分發: GitHub 和 Hugging Face 皆採用 NVIDIA 開源模式授權。這樣一來,歐洲團隊就能將其無縫整合到自己的 MLOps 中。像 Prime Intellect 和 Unsloth 這樣的公司已經將 NeMo Gym 直接整合到他們的工作流程中,以簡化 Nemotron 上的強化學習。
公有雲和歐洲生態系統的可用性

Nemotron 3 Nano 現已上市 擁抱臉 y GitHub上此外,還可以透過 Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter 和 Together AI 等推理服務提供者進行測試。這使得西班牙的開發團隊能夠透過 API 測試模型,或將其部署到自己的基礎設施上,而無需進行過於複雜的操作。
在雲層方面, Nemotron 3 Nano 透過 Amazon Bedrock 加入 AWS Nemotron 是一款用於無伺服器推理的軟體,並宣布支援 Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale 和 Yotta。對於已經在這些平台上工作的歐洲企業而言,這意味著無需對其架構進行重大更改即可輕鬆採用 Nemotron。
除了公有雲之外,NVIDIA 也正在推廣使用 Nemotron 3 Nano 作為 NIM 微服務可部署在任何 NVIDIA 加速的基礎架構上這樣就可以實現混合場景:部分負載在國際雲端中,部分負載在本地資料中心或優先考慮資料駐留歐盟的歐洲雲端。
版本 Nemotron 3 Super 和 Ultra, 專為應對極端推理工作負載和大規模多智能體系統而設計,是 計劃於2026年上半年實施這個時間表讓歐洲的研究和商業生態系統有時間對 Nano 進行試驗,驗證用例,並在必要時設計向更大模型的遷移策略。
Nemotron 3 將 NVIDIA 定位為領先的供應商之一 面向智能體的高端開放式人工智慧模型該提案融合了技術效率(混合 MoE、NVFP4、海量上下文)、開放性(權重、數據集和可用庫)以及對數據主權和透明度的明確關注,這些方面在西班牙和歐洲其他地區尤其敏感,因為這些地區的監管和對人工智慧的審計壓力越來越大。
我是一名技術愛好者,已將自己的“極客”興趣變成了職業。出於純粹的好奇心,我花了 10 多年的時間使用尖端技術並修改各種程序。現在我專攻電腦技術和電玩遊戲。這是因為五年多來,我一直在為各種技術和視頻遊戲網站撰寫文章,力求以每個人都能理解的語言為您提供所需的資訊。
如果您有任何疑問,我的知識範圍涵蓋與 Windows 作業系統以及手機 Android 相關的所有內容。我對您的承諾是,我總是願意花幾分鐘幫助您解決在這個網路世界中可能遇到的任何問題。
