- DeepSeek-V3.2-Exp dikeluarkan, satu langkah perantaraan ke arah seni bina seterusnya
- Mekanisme Perhatian Jarang DeepSeek baharu untuk konteks yang panjang dan pengiraan yang lebih rendah
- Tersedia pada apl, web dan API dengan pengurangan harga lebih daripada 50%.
- Tekanan kompetitif dan penyesuaian kepada cip Cina, dengan sokongan FP8 dan berfungsi pada BF16
Dibina pada V3.1-Terminus, model baharu DeepSeek V3.2-Exp memperkenalkan pendekatan perhatian yang tersebar yang bertujuan untuk mengurangkan beban pengkomputeran tanpa mengorbankan kualiti. Menurut syarikat itu, Harga API turun lebih daripada 50% dengan kesan serta merta, dan akses Ia kini tersedia dalam apl anda, web dan melalui API, selain ditawarkan dalam format sumber terbuka pada platform pembangunan seperti Memeluk Muka.
Inovasi teknikal: perhatian yang tersebar dan konteks yang panjang

Hati kemas kini ini adalah DeepSeek Perhatian Jarang (DSA), mekanisme yang mengutamakan bahagian konteks yang berkaitan untuk memprosesnya dengan lebih tepat. Syarikat memperincikan penggunaan a Penindeks kilat yang memilih serpihan utama dan proses “pemilihan token halus”, dengan matlamat untuk merangkumi tetingkap konteks yang besar dan mengendalikan berbilang baris pemikiran sekali gus dengan kurang maklumat overhed.
Pendekatan ini diteruskan penambahbaikan dalam kedua-dua latihan dan inferens, mempercepatkan masa dan mengurangkan penggunaan memori. DeepSeek menunjukkan bahawa versi terbaharunya sudah pun menyokong FP8 dan sedang mengusahakan keserasian dengan BF16, format nombor yang membantu mengimbangi kelajuan dan ketepatan, dan yang memudahkan untuk pelaksanaan pada perkakasan tempatan.
Syarikat menekankan bahawa ini adalah pelancaran, iaitu, a tempat ujian yang menjangkakan seni bina generasi akan datang. Namun, ia ujian dalaman Mereka menunjukkan bahawa V3.2-Exp (versi percubaan) berprestasi pada tahap V3.1-Terminus dalam tugas seperti ejen carian, pengekodan atau matematik, dengan faedah tambahan kecekapan dalam senario konteks panjang.
Sebagai tambahan kepada bahagian teknikal, ketersediaan adalah luas: model boleh diuji dalam aplikasi, web dan API syarikat itu. The pengurangan harga (lebih daripada 50%) bertujuan untuk mempercepatkan penggunaan oleh pasukan produk dan jabatan kejuruteraan yang ingin mengurangkan kos operasi.
Di hadapan komuniti, pembukaan dalam Memeluk Wajah dan GitHub Ia membolehkan penyelidik dan pembangun mengaudit, menggunakan semula dan mencadangkan penambahbaikan, mengukuhkan profil DeepSeek dalam ekosistem. AI sumber terbuka.
Kesan pasaran dan nadi geopolitik

Walaupun langkah ini dijangka tidak akan menggegarkan pasaran seperti yang berlaku R1 dan V3 pada awal tahun, V3.2-Exp boleh memberi tekanan kepada saingan domestik seperti Qwen (Alibaba) dan pesaing Amerika seperti OpenAI, Anthropic atau xAI. Kuncinya adalah untuk menunjukkan prestasi tinggi pada kos yang lebih rendah, faktor yang sangat sensitif untuk penggunaan AI yang besar.
Pelancaran dibuat di tengah-tengah persekitaran yang kompleks: beberapa negara telah mengehadkan penggunaan DeepSeek dalam agensi kerajaan (termasuk Itali, Amerika Syarikat dan Korea Selatan), memetik kebimbangan keselamatan. Sekatan ini memaksa syarikat untuk mengukuhkannya tadbir urus dan jaminan jika anda ingin mendapatkan kehadiran institusi.
Dalam sektor perindustrian, China mendorong syarikat teknologinya untuk mengurangkan pergantungan mereka kepada semikonduktor asing. Kawalan eksport AS pada cip Nvidia (seperti Blackwell) dan sekatan tambahan—contohnya, pada RTX Pro 6000—, DeepSeek mendakwa bekerjasama dengan pembuat cip China untuk mengoptimumkannya pelaksanaan pada perkakasan tempatan. Dalam baris ini, sektor ini telah menunjukkan sokongan daripada Huawei kepada kemas kini model terkini.
Jika model berjaya mengekalkan prestasinya dengan separuh daripada kos operasi, kes guna dengan dokumen panjang, sembang panjang atau tugasan analitikal yang menuntut terutamanya boleh memberi manfaat. Bagi kebanyakan syarikat, gabungan kecekapan + harga Ia sama pentingnya dengan beberapa mata tambahan dalam penanda aras.
Pendekatan DeepSeek menggabungkan keterbukaan, kecekapan dan ketersediaan segera dengan peta jalan yang menjanjikan seni bina yang lebih berkebolehan. Jika syarikat menyatukan pengurangan kos sambil mengekalkan tahap yang ditunjukkan oleh V3.1-Terminus, Model baharu ini boleh menjadi penanda aras praktikal untuk menggunakan AI generatif pada skala tanpa kos yang meningkat.Kami akan melihat sama ada DeepSeek boleh menjadikan kecekapan bukan lagi aspirasi teknikal, tetapi kelebihan daya saing sebenar untuk syarikat dan pembangun.
Saya seorang peminat teknologi yang telah menjadikan minat "geek"nya sebagai satu profesion. Saya telah menghabiskan lebih daripada 10 tahun hidup saya menggunakan teknologi canggih dan bermain-main dengan semua jenis program kerana rasa ingin tahu yang tulen. Sekarang saya mempunyai pakar dalam teknologi komputer dan permainan video. Ini kerana selama lebih daripada 5 tahun saya telah menulis untuk pelbagai laman web mengenai teknologi dan permainan video, mencipta artikel yang bertujuan untuk memberi anda maklumat yang anda perlukan dalam bahasa yang boleh difahami oleh semua orang.
Jika anda mempunyai sebarang soalan, pengetahuan saya merangkumi semua perkara yang berkaitan dengan sistem pengendalian Windows serta Android untuk telefon mudah alih. Dan komitmen saya adalah kepada anda, saya sentiasa bersedia untuk meluangkan masa beberapa minit dan membantu anda menyelesaikan sebarang soalan yang mungkin anda ada dalam dunia internet ini.