- Пуснат е DeepSeek-V3.2-Exp, междинна стъпка към следващата му архитектура
- Нов механизъм DeepSeek Sparse Attention за дълги контексти и по-малко изчисления
- Предлага се в приложението, уеб и API с намаление на цената от над 50%.
- Конкурентен натиск и адаптация към китайските чипове, с подкрепата на FP8 и работа по BF16
Изграден върху V3.1-Терминус, новият модел DeepSeek V3.2-Exp въвежда подход на разпръснато внимание което се стреми да намали изчислителното натоварване, без да се жертва качеството. Според компанията, Цените на API падат с повече от 50% с незабавен ефекти достъп Вече е достъпно във вашето приложение, уеб и чрез API, освен че се предлага във формата на отворен код на платформи за разработка като Прегърнато лице.
Технически иновации: разпръснато внимание и дълъг контекст

Сърцевината на тази актуализация е DeepSeek разредено внимание (DSA), механизъм, който приоритизира съответните части от контекста, за да ги обработи по-точно. Компанията подробно описва използването на Индексатор на мълнии който избира ключови фрагменти и процес на „финозърнест подбор на токени“, с цел обхващане на големи контекстни прозорци и обработка на множество линии на мислене едновременно с по-малко информационни разходи.
Този подход преследва подобрения както в обучението, така и в изводите, ускорявайки времето и намалявайки консумацията на памет. DeepSeek показва, че най-новите му версии вече подкрепа на 8РП и работят върху съвместимостта с BF16, числови формати, които помагат за балансиране на скоростта и точността и улесняват изпълнение на локален хардуер.
Компанията подчертава, че това е лансиране, т.е. полигон което предвижда архитектурата му от следващо поколение. И все пак, неговата вътрешни тестове Те посочват, че V3.2-Exp (експерименталната версия) се представя на нивото на V3.1-Terminus в задачи като търсачки, кодиране или математика, с добавеното предимство на ефективност в сценарии с дълъг контекст.
В допълнение към техническата част, наличността е широка: моделът може да бъде тестван в ап, мрежата и API-то на компанията. намаление на цената (повече от 50%) има за цел да ускори внедряването от продуктовите екипи и инженерните отдели, които се стремят да намалят оперативните разходи.
На обществения фронт, откриването в Прегръщащо лице и GitHub Това позволява на изследователите и разработчиците да извършват одити, повторно използване и предлагане на подобрения, укрепвайки профила на DeepSeek в екосистемата. AI с отворен код.
Пазарно въздействие и геополитически пулс

Въпреки че не се очаква тази стъпка да разтърси пазарите така, както се случи преди R1 и V3 в началото на годината, V3.2-Exp може да окаже натиск върху местни конкуренти като Куен (Alibaba) и американски конкуренти, като например OpenAI, Антропен или xAI. Ключът ще бъде да се демонстрира висока производителност на по-ниска цена, особено чувствителен фактор за големи внедрявания на изкуствен интелект.
Стартирането се случва на фона на сложна обстановка: няколко държави ограничиха използването на DeepSeek в правителствени агенции (включително Италия, Съединените щати и Южна Корея), позовавайки се на опасения за сигурността. Тези ограничения принуждават компанията да засили управление и гаранции ако искате да придобиете институционално присъствие.
В индустриалния сектор Китай оказва натиск върху своите технологични компании да намалят зависимостта си от чуждестранни полупроводници. Американският контрол върху износа на чипове на Nvidia (като например Блекуел) и допълнителни ограничения – например върху RTX Pro 6000—, DeepSeek твърди, че си сътрудничи с китайски производители на чипове, за да оптимизира своята изпълнение на локален хардуерВ тази връзка секторът е посочил подкрепата на Huawei към най-новата актуализация на модела.
Ако моделът успее да поддържа производителността си с наполовина по-ниски оперативни разходи, случаи на употреба с дълги документи, дългите разговори или взискателните аналитични задачи биха могли да бъдат особено полезни. За много компании комбинацията ефективност + цена Това е толкова решаващо, колкото няколко допълнителни точки в бенчмарковете.
Подходът на DeepSeek съчетава откритост, ефективност и незабавна наличност с пътна карта, която обещава по-способна архитектура. Ако компанията консолидира намаленията на разходите, като същевременно поддържа нивото, демонстрирано от V3.1-Terminus, Новият модел може да се превърне в практически еталон за внедряване на генеративен изкуствен интелект в голям мащаб, без стремглаво нарастващи разходи.Ще видим дали DeepSeek може да превърне ефективността вече не в технически стремеж, а в реално конкурентно предимство за компаниите и разработчиците.
Аз съм технологичен ентусиаст, който е превърнал своите „гийк“ интереси в професия. Прекарах повече от 10 години от живота си, използвайки авангардни технологии и бърникайки с всякакви програми от чисто любопитство. Сега съм специализирал компютърни технологии и видео игри. Това е така, защото повече от 5 години пиша за различни уебсайтове за технологии и видео игри, създавайки статии, които се стремят да ви дадат информацията, от която се нуждаете, на език, разбираем за всички.
Ако имате някакви въпроси, познанията ми варират от всичко свързано с операционната система Windows, както и с Android за мобилни телефони. И моят ангажимент е към вас, винаги съм готов да отделя няколко минути и да ви помогна да разрешите всички въпроси, които може да имате в този интернет свят.