OpenAI 正在押注一种“开放权重”模型:这就是其具有高级推理能力的新 AI 的样子。

最后更新: 01/04/2025

  • OpenAI将发布具有高级推理能力的全新开放加权语言模型。
  • 它将允许本地执行和一定程度的定制,尽管它不是完全开源的。
  • 奥尔特曼承认,在 Meta 和 DeepSeek 等竞争对手的压力下,公司的战略发生了改变。
  • OpenAI 将在发布之前举办全球活动来收集社区反馈。
OpenAI“开放权重”模型

 

OpenAI该公司是 ChatGPT 等热门人工智能开发的幕后推手, 已确认正在致力于推出一种新的语言模型,这将标志着一个转折点 其技术开放政策至关重要。该模型被归类为 “无限制重量”,将包括先进的推理和开发能力 可以在本地设备上运行这代表着人工智能使用向更加去中心化迈出了重要一步。

山姆·奥特曼OpenAI 执行董事解释说,这一举动 这与该公司近年来一直坚持的封闭做法相比,是一个重大变化。。虽然这不是一个完全开源的模型,但它将允许开发人员直接使用经过训练的神经网络权重, 便于其适应不同的需求,且不暴露敏感的内部细节 例如数据集或整个架构。

o3 和 o3 mini-2
相关文章:
OpenAI 推出 o3 和 o3 Mini:人工智能高级推理的新模型

一种新的、更易于访问但并非完全开放的模型

OpenAI 的开放权重 AI 模型

OpenAI 正在准备的开放式重量模型将是该公司自 2019 年以来推出的第一个具有这些特征的模型。 2 年的 GPT-2019。与最初的实验不同,新模型承诺 高级推理能力,与同样来自 OpenAI 的 o3-mini 模型相当,巩固了其作为半开放模型领域中性能最高的提案的地位。

从实际角度来说,它将提供一个中间开口: 开发人员将能够下载权重、进行微调并将其集成到自己的解决方案中。,但无法访问原始训练数据或内部技术结构。这确保了对其使用的控制,同时允许一定的灵活性和协作。

独家内容 - 点击这里  Gemini 现已登陆 Android Auto,并将取代 Assistant。

这一决定是在竞争压力日益增大的背景下做出的。由于采用了更加开放的方法,Meta 的 Llama 和 Google 的 Gemma 等模型在生态系统中获得了广泛的认可。事实上,OpenAI 承认多年来它一直保持着非常封闭的立场,Altman 将其描述为 “站在历史的错误一边”.

谷歌推出 Gemma 3-4
相关文章:
谷歌推出 Gemma 3:其最先进的单 GPU 开源 AI

倾听社区声音:举办活动收集意见

为了让新模型适应技术用户的真实期望,OpenAI 发起了一轮 与社区直接合作。通过其网站上的反馈表,它正在寻求您希望在新工具中实现哪些功能的意见。

此外,该公司计划开发 现场活动 测试并与开发人员会面。首届会议将在旧金山举行,随后将扩展到欧洲和亚太地区的城市。这些会议将使我们能够展示初步原型并在正式发布之前收集改进建议。

OpenAI技术团队成员Steven Heidel确认该模型将能够在本地硬件上运行。这个细节很重要,因为 消除对云服务的依赖,为具有更大自主权和隐私性的解决方案让路。

DeepSeek-R1 开放克隆
相关文章:
Hugging Face 发布 DeepSeek-R1 模型的开放克隆

使用的风险、控制和道德框架

具有开放权重的 AI 模型

人们对更易于访问的模型的热情与对其滥用的担忧并存。研究人员和安全专家警告称,这种强大的工具在发布后可能会被修改,从而被恶意使用。

独家内容 - 点击这里  CodeMender AI:谷歌保护开源的新代理

对此,Johannes Heidecke 等 OpenAI 安全团队成员强调,该模型将经过严格的审查程序。 根据“准备框架”进行评估 公司的。 OpenAI保证不会发布任何对社会造成灾难性风险的版本。

此外,使用许可中可能会设置隐含的限制,限制逆向工程或在某些国家敏感环境中使用等活动。目前,OpenAI 尚未指定有关该模型分发许可证的详细信息。

应对日益激烈的行业竞争

在人工智能霸权之争愈演愈烈之际,无重量级模型计划正式推出。 DeepSeek中国人工智能实验室 OpenAI 凭借其完全开放的 R1 模型引起了广泛关注,该模型能够匹敌甚至超越 OpenAI 的一些专有模型,而开发成本仅为通常开发成本的一小部分。

同样,Meta 及其 Llama 系列和 Google 及其 Gemma 也在开源领域提出了合并提案。这迫使 OpenAI重新考虑其战略选择部分开放,以免失去与主要竞争对手的竞争力。

虽然模型参数数量、上下文窗口或所应用的训练方法等技术细节尚未透露,但 Altman 保证它将是一个模型 “推理能力很强”,这为其超越其他现有开放式替代方案奠定了基础。

创建3D模型
相关文章:
如何通过 3D 图像创建 2D 模型

什么是真正的无重量模型?

无限制重量型号比较

在人工智能领域,“开放权重”模型是指 公开他的训练权重。这些权重是您在训练过程中产生的数值,可以让您做出预测或生成文本。

独家内容 - 点击这里  使用 ChatGPT 从图像中提取文本之前你应该知道什么

与同样公开源代码、训练数据和架构的完全开放模型不同,开放权重模型的透明度较低,但可用性高于仅通过 API 访问的封闭模型。

这使得开发人员 定制现有模型,无需从头开始以较低的成本实现针对性的改造。它还促进了本地执行,这对于需要更高隐私的企业或政府尤其有用。

混元3D
相关文章:
如何轻松使用 Hunyuan3D 创建 3D 模型

展望未来:模型作为转折点

OpenAI 的这一举措不仅是为了在技术上展开竞争,也是为了 与开发者社区重建桥梁 重视合作、开放和技术自主。

目前还没有正式发布日期,但预计将在 2025 年下半年某个时候发布。与此同时, 测试、事件和反馈将决定课程。 这可能是 OpenAI 自成立以来最雄心勃勃的赌注之一。

虽然不是完全开放,但决定发布具有高级推理能力的开放权重模型代表着一个转折点。 对OpenAI具有重要战略意义。在竞争日益激烈、模式日益开放的环境下,这一举措力图将公司定位在绝对控制和透明度之间的中间地带, 保持领导地位,同时又不失去与全球技术社区的联系.