- OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b 作为根据 Apache 2.0 许可证授权的开放权重语言模型。
- 它们允许本地执行、定制、商业使用,并提供接近 o3 和 o4-mini 等专有模型的性能。
- 专注于高级推理、链式思维和对自主工具的支持。
- 安全一直是首要任务,并设有独立审查和防止恶意使用的协议。

OpenAI改变了战略 并推出了 GPT-OSS-120B 和 GPT-OSS-20B,这是 开放式重量 该公司五年多来一直在发布新作品。此次发布标志着该公司打破了封闭式开发政策,并打开了 开发者、公司和个人 可以使用先进的人工智能,而无需依赖专有服务或产生大量成本。
两种型号现已上市 在 Hugging Face 平台上免费 并根据 Apache 2.0 许可证分发。这允许任何用户 在本地运行它们,使它们适应特定的任务,将它们集成到您自己的软件中,甚至将它们用于商业目的,而无需任何额外的付款或限制。 OpenAI 强调这一运动 它致力于让人工智能在全球范围内更容易获得,并在透明和问责的框架内促进创新。.
GPT-OSS-120B 的关键技术特性

GPT-OSS-120B 模型因其基于“混合专家”(MoE)的架构而脱颖而出,让您管理 117.000亿个参数 效率卓越:每个处理过的令牌仅激活 5.100 亿个令牌。这使得它尽管规模庞大,却可以在单个 80 GB 的 GPU 上运行,这对于拥有中等先进资源的研究中心和公司来说,是可承受的。与此同时,gpt-oss-20b 版本针对内存较小的设备,可以在消费级硬件甚至配备 16 GB RAM 的笔记本电脑上运行。
在这两种情况下 选择了高级推理 使用思路链技术,将每个反应分解为解释性的中间步骤。 这些模型使用以 STEM 为重点的数据进行训练、编程和常识,为他们提供 为复杂任务奠定坚实的基础 以及使用特定工具,例如网络搜索或运行 Python 代码。
性能和实际应用
对比试验表明 gpt-oss-120b 接近 o4-mini 的水平 并且在大多数编程、数学竞赛和医疗保健任务上均优于 OpenAI 的 o3-mini。gpt-oss-20b 模型更轻量,能够与 DeepSeek R1 等第三方解决方案相媲美,并在特定任务(尤其是在边缘设备上)上超越某些基准测试。
它的另一个优点是 定制能力:用户可以根据任务调整推理程度(低、中或高), 从而平衡延迟和准确性此配置以及离线和防火墙后运行模型的选项在具有隐私限制或审计需求的公司环境中特别有用。
安全、审计和社区
OpenAI 特别关注 安全和降低风险 在这些模型中,推迟发表,以便对其进行严格的内部和外部评估。他们 内置过滤器和校准协议,防止误用,例如网络安全或生物技术等领域的敏感信息的产生或身份盗窃。
另外, 该公司邀请社区参与红队挑战,配备了 500.000万美元基金鼓励发现新的漏洞 以及新出现的威胁。
至于限制, OpenAI 认识到尽管其架构先进, 开放模型的“幻觉”发生率可能比专有模型略高。,其培训主要使用英语数据进行。然而,现有的文档和控制措施有助于审计和 这些模型的不断调整,促进全球人工智能生态系统内负责任和安全的使用。
集成、许可和采用前景
两种模型的权重均以 MXFP4 格式提供,并且已提供 PyTorch 和 Apple Metal 的参考实现,并改进了对 Azure、AWS、vLLM、llama.cpp、LM Studio、Baseten 和 Cloudflare 等平台的支持。Apache 2.0 许可证允许 使用极其灵活,包括将其货币化、重新分发以及集成到第三方工具中的可能性。
对于西班牙和欧洲商界来说,gpt-oss-120b 和 gpt-oss-20b 的到来为 自动化分析,开发智能助手 y 保持对数据的控制 在自身基础设施内,同时降低成本并加快创新周期。考虑到人工智能在不同领域的潜在重要性, 这些工具允许您在 AI 中进行实验和研究,而无需依赖外部 API 或限制性许可证。,促进自身的技术发展。
这一进步使科技行业参与者能够使用更加开放、透明和适应性更强的工具,从而促进更具协作性和负责任的创新生态系统。
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。
