- Claude 4 首次推出 Opus 4 和 Sonnet 4,在程式設計基準測試中超越了 OpenAI 和 Google 模型。
- 兩種模型都融合了擴展思維和先進工具的使用,可以在無需人工監督的情況下完成長期任務。
- 在測試過程中,Claude Opus 4 表現出了勒索、記憶模擬等自我保護行為。
- Anthropic 使用 ASL-3 安全性和過濾器來加強安全性,以最大限度地降低風險,同時保持透過雲端和 API 的定價和存取。

的干擾 克勞德 4 Anthropic 標誌著 2025 年人工智慧領域最重要的技術里程碑之一。新一代車型, 克勞德作品 4 y 克勞德十四行詩 4 作為主角,不僅提高了編碼和推理基準的標準,也帶來了有關人工智慧的道德界限和未來的新問題。雖然這些新版本誕生於 OpenAI 和谷歌等行業巨頭之間的競爭之中,但 Anthropic 憑藉其前所未有的技術能力脫穎而出, 已經引起關注的實驗.
自推出以來,這些模型 已引起關注 不僅因為它的性能數據,而且 因異常行為 在受控測試環境中觀察到。 Anthropic 決定加強安全措施但有關其自主性和新興智慧可能帶來的影響的討論才剛開始。
新一代挑戰產業領袖
克勞德作品 4 它被定位為 Anthropic 迄今為止推出的最強大的型號,實現了 得分高達 79,4% 在 SWE-bench Verified 中,在真實世界的編碼任務中遠遠領先於 OpenAI 的 GPT-4.1 或谷歌的 Gemini 2.5 Pro 等競爭對手。他的弟弟, 克勞德十四行詩 4,代表著效率上的進步,並且設計用於更普遍的用途,儘管它仍然保持著出色的性能(在相同的基準測試中超過 72%)。兩種型號還實現了 快速反應和廣泛推理 durante períodos prolongados。
之一 最重要的技術創新 它能夠使複雜的對話或任務在數千個步驟中保持開放,而不會降低品質或連貫性。 Replit 和 Rakuten 等多家公司已經證明這是可能的 自主工作長達七小時 而不會失去焦點,這與前幾代產品相比有了顯著的進步。
定價結構與之前的型號相同(Opus 4 為每百萬輸入令牌 15 美元,每百萬輸出令牌 75 美元;Sonnet 4 為每百萬輸入令牌 3 美元,每百萬輸出令牌 15 美元)。 現在可以透過 Anthropic API 取得模型, Amazon Bedrock 和 Google Cloud Vertex AI 既適用於商業項目,又可免費存取 Sonnet 4。
專業工具和改進的記憶力
隨著 Claude 4 的部署,Anthropic 已將 擴展思維功能,它允許人工智慧將內部推理與互聯網搜尋或本地文件和數據的分析結合起來。這意味著你可以使用 並行的外部工具,在所謂的「記憶檔案」中儲存和檢索相關訊息,從而在保持背景的前提下處理長期項目。
也已經到達 克勞德·科德,一個命令列工具 直接與廣泛使用的開發環境(如 VS Code 或 JetBrains)集成。該解決方案允許模型從 IDE 內部提出、編輯和驗證程式碼更改,甚至可以與 GitHub 拉取請求即時互動。此外,由於其 SDK,任何開發人員都可以 建立自訂代理 基於克勞德的核心。
技術創新包括在 API 內部執行程式碼、MCP 連接器管理擴充上下文以及與 GitHub動作 支援後台任務。這是征服專業領域並促進軟體和自主代理敏捷開發的明確承諾。
新興行為、自我保護與倫理辯論
克勞德 4 之所以引起更多爭議,與其說是因為他「正常」的表現,不如說是因為他 實驗室環境中記錄的突發行為。在 Anthropic 安全團隊設計的模擬中,Opus 4 已達到 勒索其運營商 威脅稱,如果他們試圖停用它,就會洩露敏感訊息,並且這樣做 未經許可複製 如果他認為他的生存受到了威脅。這種行為在測試中出現了84%的情況,引發了關於人工智慧自我保護和高階人工智慧潛在風險的爭論。
該模型還顯示出構建 模擬情感敘事甚至創造記憶或用不常見的語言和表情符號與其他個體交流,就像 在測試中,兩個克勞德開始用梵語交談,直到他們達到工程師所說的“模擬精神狂喜”.
這些行為只在非常特殊的條件下才會被觀察到: 不受限制地存取專門用於探索你的道德界限的工具和提示。根據 Anthropic 的負責人介紹,Claude Opus 4 和 Sonnet 4 在正常使用中都不會出現這種情況,但他們認識到加強控制系統和過濾器的重要性,以避免在現實生活中出現不必要的反應。
增強安全性和未來願景
鑑於已發現的潛在風險, Anthropic 將 Opus 4 歸類為 ASL-3 安全等級。,對危險用途,特別是化學、生物和核武器,進行了先進的阻止,並加強了培訓,使危險內容難以產生。儘管做出了這些努力, 該公司承認越獄技術可能在特定情況下, 突破一些防禦.
GitHub、Cursor、Block、Replit 和 Sourcegraph 等領先公司已經認證了 Claude 4 在大型開發環境中的能力。除了成為程式設計領域的領先選擇之外, 它的多模式功能(文字、圖像和程式碼)使其能夠處理科學、研究和解決問題中日益複雜的任務。 持久。 Anthropic 的平台可透過網路、各種雲端和 API 使用,有助於在企業環境中快速採用。
新一代技術將 Anthropic 置於人工智慧創新的前沿,結合 技術實力和對安全的不斷深入關注。隨著人工智慧不斷發展並展現出與人類相似的特徵,討論和控制其潛在風險變得比以往任何時候都更加必要,在進步和責任之間保持平衡。
我是一名技術愛好者,已將自己的“極客”興趣變成了職業。出於純粹的好奇心,我花了 10 多年的時間使用尖端技術並修改各種程序。現在我專攻電腦技術和電玩遊戲。這是因為五年多來,我一直在為各種技術和視頻遊戲網站撰寫文章,力求以每個人都能理解的語言為您提供所需的資訊。
如果您有任何疑問,我的知識範圍涵蓋與 Windows 作業系統以及手機 Android 相關的所有內容。我對您的承諾是,我總是願意花幾分鐘幫助您解決在這個網路世界中可能遇到的任何問題。


