- Објавен е DeepSeek-V3.2-Exp, среден чекор кон неговата следна архитектура
- Нов механизам DeepSeek Sparse Attention за долги контексти и помала пресметка
- Достапно на апликацијата, веб и API со намалување на цената од повеќе од 50%.
- Конкурентен притисок и прилагодување кон кинеските чипови, со поддршка од FP8 и работа на BF16
Изградено на V3.1-Терминус, новиот модел DeepSeek V3.2-Exp воведува пристап на дисперзирано внимание која има за цел да го намали оптоварувањето на компјутерите без да се жртвува квалитетот. Според компанијата, Цените на API паднаа за повеќе од 50% со непосреден ефекти пристап Сега е достапно во вашата апликација, на интернет и преку API, покрај тоа што е понудено во формат на софтвер со отворен код на развојни платформи како што се Гушкање на лицето.
Технички иновации: расфрлано внимание и долг контекст

Срцето на ова ажурирање е DeepSeek Ретка Внимание (DSA), механизам што ги приоритизира релевантните делови од контекстот за да ги обработи попрецизно. Компанијата детално го опишува користењето на Индексерот на молња што избира клучни фрагменти и процес на „фино гранулирана селекција на токени“, со цел да се опфатат големи контекстуални прозорци и да се обработуваат повеќе линии на размислување одеднаш со помалку информациски товар.
Овој пристап се стреми кон подобрувања и во обуката и во инференцијата, забрзувајќи го времето и намалувајќи ја потрошувачката на меморија. DeepSeek покажува дека неговите најнови верзии веќе поддршка на FP8 и работат на компатибилност со BF16, бројни формати кои помагаат во рамнотежата на брзината и точноста и кои го олеснуваат извршување на локален хардвер.
Компанијата нагласува дека ова е лансирање, односно полигон за тестирање што ја предвидува неговата архитектура од следната генерација. Сепак, нејзината внатрешни тестови Тие истакнуваат дека V3.2-Exp (експерименталната верзија) работи на ниво на V3.1-Terminus во задачи како што се агенти за пребарување, кодирање или математика, со дополнителна предност на ефикасност во сценарија со долг контекст.
Покрај техничкиот дел, достапноста е широка: моделот може да се тестира во апликацијата, вебот и API-то на компанијата. На намалување на цената (повеќе од 50%) има за цел да го забрза усвојувањето од страна на тимовите за производи и инженерските оддели кои сакаат да ги намалат оперативните трошоци.
На општествениот план, отворањето во Прегрнувачко лице и GitHub Им овозможува на истражувачите и програмерите да ревидираат, повторно да користат и да предлагаат подобрувања, зајакнувајќи го профилот на DeepSeek во екосистемот. ВИ со отворен код.
Влијание на пазарот и геополитички пулс

Иако не се очекува овој чекор да ги потресе пазарите како што се случи R1 и V3 на почетокот на годината, V3.2-Exp може да изврши притисок врз домашните конкуренти како што се Квен (Алибаба) и американски конкуренти како што се OpenAI, Антропски или xAI. Клучот ќе биде да се демонстрира високи перформанси по пониска цена, особено чувствителен фактор за големи распоредувања на вештачка интелигенција.
Лансирањето доаѓа во услови на сложена средина: неколку земји ја ограничија употребата на DeepSeek во владини агенции (вклучувајќи ги Италија, САД и Јужна Кореја), наведувајќи безбедносни проблеми. Овие ограничувања ја принудуваат компанијата да ги зајакне своите управување и гаранции ако сакате да стекнете институционално присуство.
Во индустрискиот сектор, Кина ги притиска своите технолошки компании да ја намалат својата зависност од странски полупроводници. Контрола на извозот на чиповите на Nvidia од САД (како што е Блеквел) и дополнителни ограничувања - на пример, на RTX Pro 6000—, DeepSeek тврди дека соработува со кинески производители на чипови за да го оптимизира својот извршување на локален хардверВо оваа насока, секторот ја покажа поддршката на Huawei до најновото ажурирање на моделот.
Ако моделот успее да ги одржи своите перформанси со половина од оперативните трошоци, случаи на употреба со долги документи, долги разговори или тешки аналитички задачи би можеле особено да бидат од корист. За многу компании, комбинацијата ефикасност + цена Тоа е одлучувачко како неколку дополнителни поени во реперните тестови.
Пристапот на DeepSeek ги комбинира отвореноста, ефикасноста и моменталната достапност со план кој ветува поспособна архитектура. Доколку компанијата ги консолидира намалувањата на трошоците, а воедно го одржи нивото демонстрирано од V3.1-Terminus, Новиот модел би можел да стане практичен репер за распоредување на генеративна вештачка интелигенција на големо без вртоглаво зголемување на трошоците.Ќе видиме дали DeepSeek може да ја направи ефикасноста повеќе не техничка аспирација, туку вистинска конкурентска предност за компаниите и програмерите.
Јас сум технолошки ентузијаст кој своите „гикови“ интереси ги претвори во професија. Поминав повеќе од 10 години од мојот живот користејќи најсовремена технологија и непречено со сите видови програми од чиста љубопитност. Сега сум специјализиран за компјутерска технологија и видео игри. Тоа е затоа што повеќе од 5 години пишувам за различни веб-локации за технологија и видео игри, создавајќи статии кои се обидуваат да ви ги дадат потребните информации на јазик што е разбирлив за секого.
Ако имате прашања, моето знаење се движи од се што е поврзано со оперативниот систем Виндоус како и Андроид за мобилни телефони. И мојата посветеност е кон вас, јас сум секогаш подготвен да потрошам неколку минути и да ви помогнам да ги решите сите прашања што може да ги имате во овој интернет свет.