DeepSeek V3.2-Exp: Sự chú ý phân tán và giá giảm

DeepSeek-V3.2-Exp đã được phát hành, một bước trung gian hướng tới kiến trúc tiếp theo của nó
Cơ chế DeepSeek Sparse Attention mới cho ngữ cảnh dài và tính toán thấp hơn
Có sẵn trên ứng dụng, web và API với mức giá giảm hơn 50%.
Áp lực cạnh tranh và thích ứng với chip Trung Quốc, với sự hỗ trợ của FP8 và hoạt động trên BF16

Được xây dựng trên V3.1-Terminus, mô hình mới DeepSeek V3.2-Exp giới thiệu một cách tiếp cận chú ý phân tán nhằm mục đích giảm tải tính toán mà không ảnh hưởng đến chất lượng. Theo công ty, Giá API giảm hơn 50% có hiệu lực ngay lập tứcvà truy cập Hiện tại nó có sẵn trong ứng dụng của bạn, trên web và thông qua API, ngoài việc được cung cấp theo định dạng mã nguồn mở trên các nền tảng phát triển như Ôm mặt.

Những đổi mới kỹ thuật: sự chú ý phân tán và bối cảnh dài

Công nghệ chú ý thưa thớt trong các mô hình AI

Trái tim của bản cập nhật này là DeepSeek Sparse Attention (DSA), một cơ chế ưu tiên các phần liên quan của ngữ cảnh để xử lý chúng chính xác hơn. Công ty trình bày chi tiết việc sử dụng Chỉ số sét chọn lọc các đoạn quan trọng và một quá trình “lựa chọn mã thông báo chi tiết”, với mục tiêu bao phủ các cửa sổ ngữ cảnh lớn và xử lý nhiều dòng suy nghĩ cùng một lúc với ít thông tin phụ hơn.

Nội dung độc quyền - Bấm vào đây YouTube tăng cường chính sách chống lại các video được sản xuất hàng loạt và sử dụng công nghệ AI

Cách tiếp cận này theo đuổi cải tiến trong cả đào tạo và suy luận, tăng tốc thời gian và giảm mức tiêu thụ bộ nhớ. DeepSeek cho biết các phiên bản mới nhất của nó đã hỗ trợ FP8 và đang làm việc để tương thích với BF16, các định dạng số giúp cân bằng tốc độ và độ chính xác, và giúp dễ dàng hơn thực hiện trên phần cứng cục bộ.

Công ty nhấn mạnh rằng đây là một sự ra mắt, nghĩa là một mảnh đất thí nghiệm dự đoán kiến trúc thế hệ tiếp theo của nó. Tuy nhiên, kiểm tra nội bộ Họ chỉ ra rằng V3.2-Exp (phiên bản thử nghiệm) có hiệu suất tương đương với V3.1-Terminus trong các tác vụ như tác nhân tìm kiếm, mã hóa hoặc toán học, với lợi ích bổ sung là hiệu quả trong các tình huống ngữ cảnh dài.

Ngoài phần kỹ thuật, tính khả dụng rất rộng: mô hình có thể được thử nghiệm trong ứng dụng, web và API của công ty. Các giảm giá (hơn 50%) nhằm mục đích đẩy nhanh việc áp dụng của các nhóm sản phẩm và phòng kỹ thuật muốn giảm chi phí vận hành.

Nội dung độc quyền - Bấm vào đây Hình 03: Robot hình người nhảy từ xưởng về nhà

Về mặt cộng đồng, việc mở cửa ở Ôm mặt và GitHub Nó cho phép các nhà nghiên cứu và nhà phát triển kiểm tra, tái sử dụng và đề xuất cải tiến, củng cố vị thế của DeepSeek trong hệ sinh thái. AI nguồn mở.

Tác động thị trường và xung lực địa chính trị

Hệ sinh thái AI và cuộc thi mô hình

Mặc dù bước đi này không được mong đợi sẽ làm rung chuyển thị trường như nó đã làm R1 và V3 vào đầu năm, V3.2-Exp có thể gây áp lực lên các đối thủ trong nước như Qwen (Alibaba) và các đối thủ cạnh tranh của Mỹ như OpenAI, Nhân loại hoặc xAI. Chìa khóa sẽ là chứng minh hiệu suất cao với chi phí thấp hơn, một yếu tố đặc biệt nhạy cảm đối với việc triển khai AI quy mô lớn.

Việc ra mắt diễn ra trong bối cảnh môi trường phức tạp: một số quốc gia đã hạn chế việc sử dụng DeepSeek trong các cơ quan chính phủ (bao gồm Ý, Hoa Kỳ và Hàn Quốc), viện dẫn những lo ngại về an ninh. Những hạn chế này buộc công ty phải tăng cường quản trị và đảm bảo nếu bạn muốn có được sự hiện diện của tổ chức.

Trong lĩnh vực công nghiệp, Trung Quốc đang thúc đẩy các công ty công nghệ của mình giảm sự phụ thuộc vào chất bán dẫn nước ngoài. Kiểm soát xuất khẩu của Hoa Kỳ đối với chip Nvidia (chẳng hạn như Blackwell) và các hạn chế bổ sung—ví dụ, về RTX Pro 6000—, DeepSeek tuyên bố hợp tác với các nhà sản xuất chip Trung Quốc để tối ưu hóa thực hiện trên phần cứng cục bộ. Trong dòng này, ngành đã chỉ ra sự hỗ trợ của Huawei để cập nhật phiên bản mới nhất.

Nội dung độc quyền - Bấm vào đây Meta thúc đẩy cuộc đua siêu trí tuệ với việc thành lập Phòng thí nghiệm siêu trí tuệ

Nếu mô hình có thể duy trì hiệu suất của nó với một nửa chi phí vận hành, các trường hợp sử dụng với tài liệu dài, các cuộc trò chuyện dài hoặc các nhiệm vụ phân tích đòi hỏi nhiều công sức có thể đặc biệt có lợi. Đối với nhiều công ty, sự kết hợp hiệu quả + giá cả Nó có tính quyết định như việc có thêm một vài điểm chuẩn.

Phương pháp của DeepSeek kết hợp tính cởi mở, hiệu quả và khả năng sẵn sàng tức thì với lộ trình hứa hẹn một kiến trúc mạnh mẽ hơn. Nếu công ty hợp nhất việc cắt giảm chi phí trong khi vẫn duy trì mức độ đã được chứng minh bởi V3.1-Terminus, Mô hình mới có thể trở thành chuẩn mực thực tế cho việc triển khai AI tạo ra ở quy mô lớn mà không làm tăng chi phí quá cao.Chúng ta hãy xem liệu DeepSeek có thể biến hiệu quả không còn là khát vọng kỹ thuật nữa mà trở thành lợi thế cạnh tranh thực sự cho các công ty và nhà phát triển hay không.