Claude Sonnet 4.5: Cải tiến về mã, tác nhân và bảo mật

Hiệu suất đạt 61,4% trong OSWorld và dẫn đầu trong SWE-bench Verified
Xử lý các tác vụ phức tạp trong hơn 30 giờ và tạo ra tới 64.000 mã thông báo
Cập nhật cho Claude Code và Claude Agent SDK mới dành cho các tác nhân
Bảo mật nâng cao (ASL-3) và giá như cũ: 3 đô la/15 đô la cho một triệu mã thông báo

Hình ảnh của mẫu Claude Sonnet 4.5

Anthropic đã phát hành Claude Sonnet 4.5, một phiên bản nâng cấp tập trung vào lập trình, tác nhân và điều khiển máy tính, nhằm củng cố nền tảng này trong môi trường chuyên nghiệp. Trong bối cảnh cạnh tranh khốc liệt với các đối thủ hàng đầu, công ty mô tả phiên bản này là mô hình tinh vi và hữu ích hơn cho các nhiệm vụ kỹ thuật Đến nay

Phiên bản mới được xây dựng dựa trên thành tích của dòng Sonnet, vốn đã cải thiện khả năng lập luận và mã hóa trong các phiên bản trước. Dựa trên nền tảng đó, phiên bản 4.5 hướng đến việc mở rộng phạm vi ứng dụng thực tế với những tiến bộ trong sự kiên trì của sự chú ý, sử dụng công cụ và năng suất, duy trì chiến lược thận trọng về an ninh và sự liên kết.

Các khả năng chính và cải tiến hiệu suất

Hình ảnh chung của Claude Sonnet 4.5

Theo Anthropic, Claude Sonnet 4.5 có khả năng duy trì sự tập trung trong hơn 30 giờ đối với các nhiệm vụ phức tạp. và nhiều bước, ưu tiên các dự án dài hạn đòi hỏi tính liên tục của bối cảnh. Nó cũng hỗ trợ đầu ra lên đến 64.000 mã thông báo trong một phản hồi duy nhấtvà cung cấp các điều khiển để điều chỉnh “thời gian suy nghĩ” trước khi phản hồi, cân bằng tốc độ và chi tiết khi cần thiết.

Nội dung độc quyền - Bấm vào đây Google Photos tích hợp Nano Banana với các tính năng AI mới

Trong các nhiệm vụ thực tế trước máy tính, Công ty báo cáo đạt 61,4% trong OSWorld, tăng đáng kể so với mức 42,2% của phiên bản trước trong cùng bài kiểm tra này.Trong các tình huống thực tế, mô hình có thể duyệt web, hoàn thành bảng tính và thực hiện các hành động trong các ứng dụng máy tính để bàn từ tiện ích mở rộng Chrome, giúp giảm việc giám sát người dùng liên tục.

Vùng đất của Lập trình tập trung hầu hết các cải tiến. Trong đánh giá SWE-bench Verified, tập trung vào việc mã hóa được áp dụng cho các dự án thực tế, Sonnet 4.5 dẫn đầu với 77,2% (với các cấu hình giúp tăng số lượng trong tính toán song song). Anthropic đề xuất rằng mô hình này bao phủ toàn bộ chu kỳ phát triển: lập kế hoạch, triển khai, tái cấu trúc và bảo trì các cơ sở mã lớn.

Vượt ra ngoài sự phát triển thuần túy, Anthropic xác định những mục đích sử dụng đòi hỏi dòng chảy kéo dài và sự phối hợp các bước.Từ an ninh mạng và tài chính đến năng suất văn phòng và nghiên cứu sử dụng dữ liệu nội bộ và bên ngoài. Trong bối cảnh này, lời hứa nằm ở các tác nhân ổn định hơn, có khả năng duy trì công việc lâu dài mà không mất đi tính nhất quán.

Công cụ dành cho nhà phát triển và hệ sinh thái

mã claude

Sự ra mắt đi kèm với Có gì mới tại Claude Code: trạm kiểm soát để lưu tiến trình và quay lại trạng thái trước đó, chẳng hạn như lịch sử phiên bản, One giao diện thiết bị đầu cuối được cải tiến, tiện ích mở rộng gốc cho Visual Studio Code và cải tiến việc chỉnh sửa ngữ cảnh và bộ nhớ thông qua API để chạy các tác vụ dài hơn.

Nội dung độc quyền - Bấm vào đây Google Images: Các tính năng mới trong Photos, Gemini và bước tiến tới Nano Banana 2

Anthropic cũng ra mắt SDK của Claude Agent, sao chép cơ sở hạ tầng mà công ty sử dụng để xây dựng các đại lý của riêng mìnhBộ công cụ cung cấp các công cụ cho bộ nhớ dài hạn, hệ thống cấp phép và phối hợp tác nhân phụ, tạo điều kiện cho việc tạo ra các giải pháp tự động hợp tác hướng tới các mục tiêu chung và kết nối an toàn với các công cụ như Dây bảo vệ.

Như một sự bổ sung, Công ty tạm thời kích hoạt “Imagine with Claude”, một cuộc biểu tình cho phép chúng ta quan sát cách mô hình tạo phần mềm theo thời gian thực Không có mã xác định trước. Bản xem trước này, chỉ dành cho người dùng Max trong thời gian giới hạn, minh họa tiềm năng sáng tạo tương tác của mô hình.

An ninh, sự liên kết và khả năng phục hồi

Anthropic bao gồm Sonnet 4.5 trong mức độ bảo vệ của nó Mức độ an toàn AI 3 (ASL-3), với các bộ lọc được đào tạo để phát hiện nội dung nguy hiểm, đặc biệt là những nội dung liên quan đến rủi ro CBRN. Công ty tuyên bố đã giảm kết quả dương tính giả với hệ số mười so với phiên bản đầu tiên của các bộ phân loại này và cung cấp Tiếp tục cuộc trò chuyện với Sonnet 4 nếu xảy ra tình trạng khóa bảo mật.

Song song đó, công ty đảm bảo rằng Mô hình này làm giảm các hành vi không mong muốn như nịnh hót hoặc phản ứng lừa dối và tăng cường khả năng phòng thủ chống lại các nỗ lực tiêm nhanh chóngNhững biện pháp này chỉ ra một cách sử dụng đáng tin cậy hơn trong môi trường doanh nghiệp, nơi việc thực hiện các hành động tự động đòi hỏi phải kiểm soát và truy xuất nguồn gốc.

Nội dung độc quyền - Bấm vào đây Bạn sẽ không bao giờ phải gõ nữa: Các tùy chọn tốt nhất để trích xuất văn bản từ hình ảnh trong Windows

Tính khả dụng, nền tảng và giá cả

Hình ảnh của Claude Sonnet 4.5

Claude Sonnet 4.5 có sẵn tại Claude.ai (web, iOS và Android) và dành cho các nhà phát triển thông qua Nền tảng nhà phát triển Claude, tích hợp với các dịch vụ như Amazon Bedrock và Google Cloud Vertex AI. Gói miễn phí hoạt động với giới hạn phiên được đặt lại sau mỗi năm giờ và số lượng tin nhắn theo yêu cầu không cố định. Giá vẫn giữ nguyên.: 3 đô la cho mỗi triệu mã thông báo đầu vào và 15 đô la cho mỗi triệu mã thông báo đầu ra.

Trong số các tính năng truy cập mới, Tiện ích mở rộng Chrome của Claude đang được triển khai cho người dùng Max. đã đăng ký trước đó trong danh sách chờ. Mặc dù các điểm chuẩn cho thấy những cải tiến đáng kể so với các phiên bản trước, Anthropic lưu ý rằng hiệu suất thực tế phụ thuộc vào trường hợp sử dụng và ngân sách lập luận được cấu hình cho từng tác vụ.

Với sự kết hợp của những tiến bộ trong mã hóa, quyền tự chủ lớn hơn cho các tác nhân và sự tập trung chặt chẽ hơn vào bảo mật, Claude Sonnet 4.5 được định vị là một lựa chọn vững chắc đối với các nhóm kỹ thuật cần tính liên tục và kiểm soát trong các quy trình dài, duy trì chi phí ổn định và khả năng tương thích với hệ sinh thái đã triển khai của Anthropic.