- Hiệu suất đạt 61,4% trong OSWorld và dẫn đầu trong SWE-bench Verified
- Xử lý các tác vụ phức tạp trong hơn 30 giờ và tạo ra tới 64.000 mã thông báo
- Cập nhật cho Claude Code và Claude Agent SDK mới dành cho các tác nhân
- Bảo mật nâng cao (ASL-3) và giá như cũ: 3 đô la/15 đô la cho một triệu mã thông báo

Anthropic đã phát hành Claude Sonnet 4.5, một phiên bản nâng cấp tập trung vào lập trình, tác nhân và điều khiển máy tính, nhằm củng cố nền tảng này trong môi trường chuyên nghiệp. Trong bối cảnh cạnh tranh khốc liệt với các đối thủ hàng đầu, công ty mô tả phiên bản này là mô hình tinh vi và hữu ích hơn cho các nhiệm vụ kỹ thuật Đến nay
Phiên bản mới được xây dựng dựa trên thành tích của dòng Sonnet, vốn đã cải thiện khả năng lập luận và mã hóa trong các phiên bản trước. Dựa trên nền tảng đó, phiên bản 4.5 hướng đến việc mở rộng phạm vi ứng dụng thực tế với những tiến bộ trong sự kiên trì của sự chú ý, sử dụng công cụ và năng suất, duy trì chiến lược thận trọng về an ninh và sự liên kết.
Các khả năng chính và cải tiến hiệu suất

Theo Anthropic, Claude Sonnet 4.5 có khả năng duy trì sự tập trung trong hơn 30 giờ đối với các nhiệm vụ phức tạp. và nhiều bước, ưu tiên các dự án dài hạn đòi hỏi tính liên tục của bối cảnh. Nó cũng hỗ trợ đầu ra lên đến 64.000 mã thông báo trong một phản hồi duy nhấtvà cung cấp các điều khiển để điều chỉnh “thời gian suy nghĩ” trước khi phản hồi, cân bằng tốc độ và chi tiết khi cần thiết.
Trong các nhiệm vụ thực tế trước máy tính, Công ty báo cáo đạt 61,4% trong OSWorld, tăng đáng kể so với mức 42,2% của phiên bản trước trong cùng bài kiểm tra này.Trong các tình huống thực tế, mô hình có thể duyệt web, hoàn thành bảng tính và thực hiện các hành động trong các ứng dụng máy tính để bàn từ tiện ích mở rộng Chrome, giúp giảm việc giám sát người dùng liên tục.
Vùng đất của Lập trình tập trung hầu hết các cải tiến. Trong đánh giá SWE-bench Verified, tập trung vào việc mã hóa được áp dụng cho các dự án thực tế, Sonnet 4.5 dẫn đầu với 77,2% (với các cấu hình giúp tăng số lượng trong tính toán song song). Anthropic đề xuất rằng mô hình này bao phủ toàn bộ chu kỳ phát triển: lập kế hoạch, triển khai, tái cấu trúc và bảo trì các cơ sở mã lớn.
Vượt ra ngoài sự phát triển thuần túy, Anthropic xác định những mục đích sử dụng đòi hỏi dòng chảy kéo dài và sự phối hợp các bước.Từ an ninh mạng và tài chính đến năng suất văn phòng và nghiên cứu sử dụng dữ liệu nội bộ và bên ngoài. Trong bối cảnh này, lời hứa nằm ở các tác nhân ổn định hơn, có khả năng duy trì công việc lâu dài mà không mất đi tính nhất quán.
Công cụ dành cho nhà phát triển và hệ sinh thái

Sự ra mắt đi kèm với Có gì mới tại Claude Code: trạm kiểm soát để lưu tiến trình và quay lại trạng thái trước đó, chẳng hạn như lịch sử phiên bản, One giao diện thiết bị đầu cuối được cải tiến, tiện ích mở rộng gốc cho Visual Studio Code và cải tiến việc chỉnh sửa ngữ cảnh và bộ nhớ thông qua API để chạy các tác vụ dài hơn.
Anthropic cũng ra mắt SDK của Claude Agent, sao chép cơ sở hạ tầng mà công ty sử dụng để xây dựng các đại lý của riêng mìnhBộ công cụ cung cấp các công cụ cho bộ nhớ dài hạn, hệ thống cấp phép và phối hợp tác nhân phụ, tạo điều kiện cho việc tạo ra các giải pháp tự động hợp tác hướng tới các mục tiêu chung và kết nối an toàn với các công cụ như Dây bảo vệ.
Như một sự bổ sung, Công ty tạm thời kích hoạt “Imagine with Claude”, một cuộc biểu tình cho phép chúng ta quan sát cách mô hình tạo phần mềm theo thời gian thực Không có mã xác định trước. Bản xem trước này, chỉ dành cho người dùng Max trong thời gian giới hạn, minh họa tiềm năng sáng tạo tương tác của mô hình.
An ninh, sự liên kết và khả năng phục hồi
Anthropic bao gồm Sonnet 4.5 trong mức độ bảo vệ của nó Mức độ an toàn AI 3 (ASL-3), với các bộ lọc được đào tạo để phát hiện nội dung nguy hiểm, đặc biệt là những nội dung liên quan đến rủi ro CBRN. Công ty tuyên bố đã giảm kết quả dương tính giả với hệ số mười so với phiên bản đầu tiên của các bộ phân loại này và cung cấp Tiếp tục cuộc trò chuyện với Sonnet 4 nếu xảy ra tình trạng khóa bảo mật.
Song song đó, công ty đảm bảo rằng Mô hình này làm giảm các hành vi không mong muốn như nịnh hót hoặc phản ứng lừa dối và tăng cường khả năng phòng thủ chống lại các nỗ lực tiêm nhanh chóngNhững biện pháp này chỉ ra một cách sử dụng đáng tin cậy hơn trong môi trường doanh nghiệp, nơi việc thực hiện các hành động tự động đòi hỏi phải kiểm soát và truy xuất nguồn gốc.
Tính khả dụng, nền tảng và giá cả

Claude Sonnet 4.5 có sẵn tại Claude.ai (web, iOS và Android) và dành cho các nhà phát triển thông qua Nền tảng nhà phát triển Claude, tích hợp với các dịch vụ như Amazon Bedrock và Google Cloud Vertex AI. Gói miễn phí hoạt động với giới hạn phiên được đặt lại sau mỗi năm giờ và số lượng tin nhắn theo yêu cầu không cố định. Giá vẫn giữ nguyên.: 3 đô la cho mỗi triệu mã thông báo đầu vào và 15 đô la cho mỗi triệu mã thông báo đầu ra.
Trong số các tính năng truy cập mới, Tiện ích mở rộng Chrome của Claude đang được triển khai cho người dùng Max. đã đăng ký trước đó trong danh sách chờ. Mặc dù các điểm chuẩn cho thấy những cải tiến đáng kể so với các phiên bản trước, Anthropic lưu ý rằng hiệu suất thực tế phụ thuộc vào trường hợp sử dụng và ngân sách lập luận được cấu hình cho từng tác vụ.
Với sự kết hợp của những tiến bộ trong mã hóa, quyền tự chủ lớn hơn cho các tác nhân và sự tập trung chặt chẽ hơn vào bảo mật, Claude Sonnet 4.5 được định vị là một lựa chọn vững chắc đối với các nhóm kỹ thuật cần tính liên tục và kiểm soát trong các quy trình dài, duy trì chi phí ổn định và khả năng tương thích với hệ sinh thái đã triển khai của Anthropic.
Tôi là một người đam mê công nghệ và đã biến sở thích “đam mê” của mình thành một nghề. Tôi đã dành hơn 10 năm cuộc đời mình để sử dụng công nghệ tiên tiến và mày mò đủ loại chương trình chỉ vì tò mò. Bây giờ tôi chuyên về công nghệ máy tính và trò chơi điện tử. Điều này là do trong hơn 5 năm, tôi đã viết cho nhiều trang web khác nhau về công nghệ và trò chơi điện tử, tạo ra các bài viết nhằm cung cấp cho bạn thông tin bạn cần bằng ngôn ngữ mà mọi người đều có thể hiểu được.
Nếu bạn có bất kỳ câu hỏi nào, kiến thức của tôi bao gồm mọi thứ liên quan đến hệ điều hành Windows cũng như Android dành cho điện thoại di động. Và cam kết của tôi là với bạn, tôi luôn sẵn sàng dành một vài phút và giúp bạn giải quyết mọi thắc mắc mà bạn có thể có trong thế giới internet này.