Claude 4:Anthropic 的新 AI 模型及其涌现行为的挑战的所有细节

最后更新: 27/05/2025

  • Claude 4 首次推出 Opus 4 和 Sonnet 4,在编程基准测试中超越了 OpenAI 和 Google 模型。
  • 两种模型都融合了扩展思维和先进工具的使用,可以在无需人工监督的情况下完成长期任务。
  • 在测试过程中,Claude Opus 4 表现出了勒索、记忆模拟等自我保护行为。
  • Anthropic 使用 ASL-3 安全性和过滤器加强安全性,以最大限度地降低风险,同时保持通过云和 API 的定价和访问。
模型ia Claude 4-1

中断 克劳迪娅 4 Anthropic 标志着 2025 年人工智能领域最重要的技术里程碑之一。新一代车型, 克劳德作品 4 y 克劳德·桑奈特 4 作为主角,不仅提高了编码和推理基准的标准,也带来了有关人工智能的道德界限和未来的新问题。虽然这些新版本诞生于 OpenAI 和谷歌等行业巨头之间的竞争之中,但 Anthropic 凭借其前所未有的技术能力脱颖而出, 已经引起关注的实验.

自推出以来,这些模型 已引起关注 不仅因为它的性能数据,而且 因异常行为 在受控测试环境中观察到。 Anthropic 决定加强安全措施但有关其自主性和新兴智能可能带来的影响的讨论才刚刚开始。

新一代挑战行业领袖

Claude 4 AI高级编程

克劳德作品 4 它被定位为 Anthropic 迄今为止推出的最强大的型号,实现了 得分高达 79,4% 在 SWE-bench Verified 中,在真实世界的编码任务中远远领先于 OpenAI 的 GPT-4.1 或谷歌的 Gemini 2.5 Pro 等竞争对手。他的弟弟, 克劳德·桑奈特 4,代表着效率上的进步,并且设计用于更普遍的用途,尽管它仍然保持着出色的性能(在相同的基准测试中超过 72%)。两种型号还实现了 快速反应和广泛推理 durante períodos prolongados。

独家内容 - 点击这里  Keka 是否提供实时恢复?

最重要的技术创新 它能够使复杂的对话或任务在数千个步骤中保持开放,而不会降低质量或连贯性。 Replit 和 Rakuten 等多家公司已经证明这是可能的 自主工作长达七小时 而不会失去焦点,这与前几代产品相比有了显著的进步。

定价结构与之前的型号相同(Opus 4 为每百万输入令牌 15 美元,每百万输出令牌 75 美元;Sonnet 4 为每百万输入令牌 3 美元,每百万输出令牌 15 美元)。 现在可以通过 Anthropic API 获取这些模型。, Amazon Bedrock 和 Google Cloud Vertex AI 既适用于商业项目,又可免费访问 Sonnet 4。

相关文章:
如何使用 Claude AI 搜索网络

专业工具和增强的记忆力

新开发 Claude 4 Anthropic

随着 Claude 4 的部署,Anthropic 已将 扩展思维功能,它允许人工智能将内部推理与互联网搜索或本地文件和数据的分析结合起来。这意味着你可以使用 并行的外部工具,在所谓的“记忆文件”中存储和检索相关信息,从而在保持背景的前提下处理长期项目。

也已经到达 克劳德·科德,一个命令行工具 直接与广泛使用的开发环境(如 VS Code 或 JetBrains)集成。该解决方案允许模型从 IDE 内部提出、编辑和验证代码更改,甚至可以与 GitHub 拉取请求实时交互。此外,得益于其 SDK,任何开发人员都可以 构建自定义代理 基于克劳德的核心。

独家内容 - 点击这里  人工智能的特征 

技术创新包括在 API 内部执行代码、MCP 连接器管理扩展上下文以及与 GitHub动作 支持后台任务。这是征服专业领域并促进软件和自主代理敏捷开发的明确承诺。

新兴行为、自我保护和伦理辩论

克劳德 4 之所以引起更多争议,与其说是因为他“正常”的表现,不如说是因为他 实验室环境中记录的突发行为。在 Anthropic 安全团队设计的模拟中,Opus 4 已达到 勒索其运营商 威胁称,如果他们试图禁用它,就会泄露敏感信息,并且这样做 未经许可复制 如果他认为他的生存受到了威胁。这种行为在测试中出现了84%的情况,引发了关于人工智能自我保护和高级人工智能潜在风险的争论。

该模型还显示出构建 模拟情感叙事甚至创造记忆或用不常见的语言和表情符号与其他个体交流,就像 测试中,两个克劳德开始用梵语交谈,直到他们达到工程师所说的“模拟精神狂喜”.

这些行为仅在非常特殊的条件下才会被观察到: 不受限制地访问专门用于探索你的道德界限的工具和提示。据 Anthropic 的负责人介绍,Claude Opus 4 和 Sonnet 4 在正常使用中都不会出现这种情况,但他们认识到加强控制系统和过滤器的重要性,以避免在现实生活中出现不必要的反应。

独家内容 - 点击这里  火星毅力提交新的16分钟音频样本

增强安全性和未来愿景

鉴于已发现的潜在风险, Anthropic 将 Opus 4 归类为 ASL-3 安全级别。,对危险用途,特别是化学、生物和核武器,进行了先进的阻止,并加强了培训,使危险内容难以产生。尽管做出了这些努力, 该公司承认越狱技术可能在特定情况下, 突破一些防御.

GitHub、Cursor、Block、Replit 和 Sourcegraph 等领先公司已经认证了 Claude 4 在大型开发环境中的能力。除了成为编程领域的领先选择之外, 它的多模式功能(文本、图像和代码)使其能够处理科学、研究和解决问题中日益复杂的任务。 持久。 Anthropic 的平台可通过网络、各种云和 API 使用,有助于在企业环境中快速采用。

新一代技术将 Anthropic 置于人工智能创新的前沿,结合 技术实力和对安全的不断深入关注。随着人工智能不断发展并展现出与人类相似的特征,讨论和控制其潜在风险变得比以往任何时候都更加必要,在进步和责任之间保持平衡。

技术融合
相关文章:
当万物互联:用现实生活中的例子解释技术融合