- Nemotron 3 是一个开放的模型、数据和库系列,专注于智能体人工智能和多智能体系统。
- 它包含三种 MoE 尺寸(Nano、Super 和 Ultra),采用混合架构,并在 NVIDIA Blackwell 上进行高效的 4 位训练。
- Nemotron 3 Nano 现已在欧洲通过 Hugging Face、公共云和 NIM 微服务提供,窗口期为 1 万个代币。
- 该生态系统包含海量数据集、NeMo Gym、NeMo RL 和评估器,用于训练、调整和审核自主人工智能代理。
人工智能竞赛正从简单的、孤立的聊天机器人转向能够相互协作、管理冗长工作流程且需要可审计的代理系统。在这种新形势下, NVIDIA 决定采取一项相当明确的举措:不仅开放模型,还开放数据和工具。这样,企业、公共管理部门和研究中心就可以构建自己的AI平台,并拥有更大的控制权。
这一运动体现在 Nemotron 3 是一系列面向多智能体人工智能的开放模型。 它力求兼顾高性能、低推理成本和透明性。该方案并非旨在打造又一个通用聊天机器人,而是…… 一个用于部署代理的基础平台,这些代理能够在受监管的行业中进行推理、规划和执行复杂任务。这一点在欧洲和西班牙尤为重要,因为在这些地方,数据主权和监管合规性至关重要。
一套开放的、具有自主性和能动性的人工智能模型。
Nemotron 3 的介绍如下: 一个完整的生态系统:模型、数据集、库和训练方案 在开放许可协议下。NVIDIA 的理念是,企业不仅可以将 AI 作为一种不透明的服务来使用,还可以检查其内部结构,根据自身领域调整模型,并将其部署在自己的基础设施上,无论是在云端还是在本地数据中心。
公司将这一战略置于其对以下方面的承诺框架内: 主权人工智能欧洲、韩国及其他地区的政府和企业正在寻求开放的替代方案,以取代封闭或外国的系统,因为这些系统往往与本国的数据保护法律或审计要求不符。Nemotron 3 旨在成为构建国家、行业或企业级模型的技术基础,从而提高数据的可见性和控制力。
在平行下, NVIDIA 巩固其在硬件以外的市场地位此前,该公司主要是一家参考GPU供应商;随着Nemotron 3的推出,该公司也开始涉足建模和训练工具领域,与OpenAI、Google、Anthropic甚至Meta等公司展开更直接的竞争,并与高端模型厂商展开较量。 超级格罗克重型在最近几代 Llama 版本中,Meta 对开源的投入有所减少。
对于严重依赖 Hugging Face 等平台上托管的开放模型的欧洲研究和创业生态系统而言,以开放许可方式提供的权重、合成数据和库代表了一种强有力的替代方案。 中国模特 以及在人气和基准排名中占据主导地位的美国人。
混合型MoE架构:适用于大规模代理的效率
Nemotron 3 的核心技术特点是 潜在混合专家(MoE)的混合架构每次推理时,模型不会激活所有参数,而是只激活其中的一部分,即与所讨论的任务或标记最相关的专家子集。
这种方法允许 大幅降低计算成本和内存消耗这也有助于提高令牌吞吐量。对于多智能体架构而言,数十个甚至数百个智能体持续交换消息,这种效率对于防止系统因GPU和云成本过高而变得难以承受至关重要。
根据NVIDIA分享的数据和独立基准测试结果,Nemotron 3 Nano的性能达到…… 每秒可生成的令牌数量最多可达四倍 与前代产品 Nemotron 2 Nano 相比,它减少了约 60% 不必要的推理标记的生成。实际上,这意味着答案的准确性相同甚至更高,但代码更简洁,每次查询的成本更低。
混合型MoE架构结合特定的训练技术,已经取得了以下成果: 许多最先进的开放模型都采用了专家方案。Nemotron 3 也顺应了这一趋势,但更专注于智能体人工智能:设计用于智能体之间协调的内部路径、工具的使用、长期状态的处理以及逐步规划。
三种尺寸:Nano、Super 和 Ultra,分别适用于不同的工作负载。

Nemotron 3 系列产品分为以下几类: MoE模型的三种主要尺寸得益于专家架构,它们全部开放且活动参数减少:
- Nemotron 3 Nano总共约有30.000亿个参数,其中约 每个代币包含 3.000 亿资产它专为效率至关重要的特定任务而设计:软件调试、文档摘要、信息检索、系统监控或专门的 AI 助手。
- Nemotron 3 Super约有100.000亿个参数, 资产达10.000亿美元 每一步都是如此。它旨在 多智能体架构中的高级推理即使多个智能体协作解决复杂流程,延迟也很低。
- Nemotron 3 Ultra:上层,大约有500.000亿个参数,最高可达 每个代币包含 50.000 亿资产它可作为强大的推理引擎,用于研究、战略规划、高级决策支持,以及对人工智能系统要求特别高的系统。
在实践中,这使得组织能够…… 根据您的预算和需求选择合适的型号尺寸Nano 适用于大规模、高强度工作负载和严格的成本控制;Super 适用于需要更多深度推理且涉及众多协作代理的情况;Ultra 适用于质量和长时间上下文比 GPU 成本更重要的情况。
现在, 目前只有 Nemotron 3 Nano 可供立即使用。Super 和 Ultra 版本计划于 2026 年上半年推出,这将使欧洲公司和实验室有时间先对 Nano 进行试验,建立生产线,然后再迁移需要更大容量的案例。
Nemotron 3 Nano:1万代币窗口及成本控制

截至今日,Nemotron 3 Nano 是 家庭的实际先锋NVIDIA 将其描述为该系列中计算成本效率最高的型号,经过优化,可在多智能体工作流程和密集型但重复性任务中提供最大性能。
在其众多技术特点中,以下几点尤为突出: 上下文窗口最多可达一百万个令牌这使得内存能够保存大量文档、整个代码库或多步骤业务流程。对于银行、医疗保健或公共管理等欧洲应用而言,由于记录量可能非常庞大,这种长期上下文记忆功能尤为重要。
独立组织的基准 人工分析表明,Nemotron 3 Nano 是最均衡的开源模型之一。 它集智能性、精准性和速度于一体,吞吐量高达每秒数百个令牌。这种组合使其对西班牙的AI集成商和服务提供商极具吸引力,他们既需要良好的用户体验,又不想承担过高的基础设施成本。
就应用场景而言,NVIDIA 将 Nano 的目标市场定位在…… 内容摘要、软件调试、信息检索和企业人工智能助手由于减少了冗余推理标记,因此可以运行与用户或系统保持长时间对话的代理,而不会导致推理费用飙升。
开放数据和库:NeMo Gym、NeMo RL 和 Evaluator

Nemotron 3 最显著的特点之一是: 它不仅限于发布模型权重NVIDIA 为该系列产品提供了一套全面的开放资源,用于训练、调优和评估代理。
一方面,它提供了一个合成语料库 数万亿个预训练、后训练和强化训练数据标记这些数据集侧重于推理、编码和多步骤工作流程,使公司和研究中心能够生成自己的特定领域 Nemotron 变体(例如,法律、医疗保健或工业),而无需从头开始。
在这些资源中,以下资源尤为突出: Nemotron Agentic 安全数据集它收集真实场景中智能体行为的遥测数据。其目标是帮助团队衡量和加强复杂自主系统的安全性:从智能体遇到敏感数据时采取的行动,到它如何应对模糊或潜在有害的指令。
关于工具部分,NVIDIA即将推出 NeMo Gym 和 NeMo RL 作为开源库 这些库用于强化训练和训练后评估,并配合 NeMo Evaluator 用于评估安全性和性能。它们为 Nemotron 系列提供了即用型仿真环境和流程,但也可以扩展到其他模型。
所有这些材料——权重、数据集和代码——都通过以下方式分发: GitHub 和 Hugging Face 均采用 NVIDIA 开源模式许可证。这样一来,欧洲团队就能将其无缝集成到他们自己的 MLOps 中。像 Prime Intellect 和 Unsloth 这样的公司已经将 NeMo Gym 直接集成到他们的工作流程中,以简化 Nemotron 上的强化学习。
公共云和欧洲生态系统的可用性

Nemotron 3 Nano 现已上市 拥抱脸 y GitHub上此外,还可以通过 Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter 和 Together AI 等推理服务提供商进行测试。这使得西班牙的开发团队能够通过 API 测试模型,或将其部署到自己的基础设施上,而无需进行过于复杂的操作。
在云层方面, Nemotron 3 Nano 通过 Amazon Bedrock 加入 AWS Nemotron 是一款用于无服务器推理的软件,并已宣布支持 Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale 和 Yotta。对于已经在这些平台上工作的欧洲企业而言,这意味着无需对其架构进行重大更改即可轻松采用 Nemotron。
除了公有云之外,NVIDIA 还在推广使用 Nemotron 3 Nano 作为 NIM 微服务可部署在任何 NVIDIA 加速的基础架构上这样就可以实现混合场景:部分负载在国际云中,部分负载在本地数据中心或优先考虑数据驻留欧盟的欧洲云中。
版本 Nemotron 3 Super 和 Ultra, 专为应对极端推理工作负载和大规模多智能体系统而设计,是 计划于2026年上半年实施这一时间表让欧洲的研究和商业生态系统有时间对 Nano 进行试验,验证用例,并在必要时设计向更大模型的迁移策略。
Nemotron 3 将 NVIDIA 定位为领先的供应商之一 面向智能体的高端开放式人工智能模型该提案融合了技术效率(混合 MoE、NVFP4、海量上下文)、开放性(权重、数据集和可用库)以及对数据主权和透明度的明确关注,这些方面在西班牙和欧洲其他地区尤其敏感,因为这些地区的监管和对人工智能的审计压力越来越大。
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。
