DeepSeek натиска газта: по-ниска цена, повече контекст и неудобен конкурент за OpenAI

Последна актуализация: 02/10/2025

  • Пуснат е DeepSeek-V3.2-Exp, междинна стъпка към следващата му архитектура
  • Нов механизъм DeepSeek Sparse Attention за дълги контексти и по-малко изчисления
  • Предлага се в приложението, уеб и API с намаление на цената от над 50%.
  • Конкурентен натиск и адаптация към китайските чипове, с подкрепата на FP8 и работа по BF16
DeepSeek V3.2-Exp

Изграден върху V3.1-Терминус, новият модел DeepSeek V3.2-Exp въвежда подход на разпръснато внимание което се стреми да намали изчислителното натоварване, без да се жертва качеството. Според компанията, Цените на API падат с повече от 50% с незабавен ефекти достъп Вече е достъпно във вашето приложение, уеб и чрез API, освен че се предлага във формата на отворен код на платформи за разработка като Прегърнато лице.

Технически иновации: разпръснато внимание и дълъг контекст

Технология за разредено внимание в модели с изкуствен интелект

Сърцевината на тази актуализация е DeepSeek разредено внимание (DSA), механизъм, който приоритизира съответните части от контекста, за да ги обработи по-точно. Компанията подробно описва използването на Индексатор на мълнии който избира ключови фрагменти и процес на „финозърнест подбор на токени“, с цел обхващане на големи контекстни прозорци и обработка на множество линии на мислене едновременно с по-малко информационни разходи.

Изключително съдържание - Щракнете тук  Мета засилва надпреварата за суперинтелект със създаването на Superintelligence Labs

Този подход преследва подобрения както в обучението, така и в изводите, ускорявайки времето и намалявайки консумацията на памет. DeepSeek показва, че най-новите му версии вече подкрепа на 8РП и работят върху съвместимостта с BF16, числови формати, които помагат за балансиране на скоростта и точността и улесняват изпълнение на локален хардуер.

Компанията подчертава, че това е лансиране, т.е. полигон което предвижда архитектурата му от следващо поколение. И все пак, неговата вътрешни тестове Те посочват, че V3.2-Exp (експерименталната версия) се представя на нивото на V3.1-Terminus в задачи като търсачки, кодиране или математика, с добавеното предимство на ефективност в сценарии с дълъг контекст.

В допълнение към техническата част, наличността е широка: моделът може да бъде тестван в ап, мрежата и API-то на компанията. намаление на цената (повече от 50%) има за цел да ускори внедряването от продуктовите екипи и инженерните отдели, които се стремят да намалят оперативните разходи.

Изключително съдържание - Щракнете тук  DeepSeek R2 може да бъде пуснат през април и да отбележи нов крайъгълен камък в AI

На обществения фронт, откриването в Прегръщащо лице и GitHub Това позволява на изследователите и разработчиците да извършват одити, повторно използване и предлагане на подобрения, укрепвайки профила на DeepSeek в екосистемата. AI с отворен код.

Пазарно въздействие и геополитически пулс

Екосистема с изкуствен интелект и конкуренция на модели

Въпреки че не се очаква тази стъпка да разтърси пазарите така, както се случи преди R1 и V3 в началото на годината, V3.2-Exp може да окаже натиск върху местни конкуренти като Куен (Alibaba) и американски конкуренти, като например OpenAI, Антропен или xAI. Ключът ще бъде да се демонстрира висока производителност на по-ниска цена, особено чувствителен фактор за големи внедрявания на изкуствен интелект.

Стартирането се случва на фона на сложна обстановка: няколко държави ограничиха използването на DeepSeek в правителствени агенции (включително Италия, Съединените щати и Южна Корея), позовавайки се на опасения за сигурността. Тези ограничения принуждават компанията да засили управление и гаранции ако искате да придобиете институционално присъствие.

В индустриалния сектор Китай оказва натиск върху своите технологични компании да намалят зависимостта си от чуждестранни полупроводници. Американският контрол върху износа на чипове на Nvidia (като например Блекуел) и допълнителни ограничения – например върху RTX Pro 6000—, DeepSeek твърди, че си сътрудничи с китайски производители на чипове, за да оптимизира своята изпълнение на локален хардуерВ тази връзка секторът е посочил подкрепата на Huawei към най-новата актуализация на модела.

Изключително съдържание - Щракнете тук  Астронавти, хванати в капан на Международната космическа станция, се завръщат на Земята след девет месеца

Ако моделът успее да поддържа производителността си с наполовина по-ниски оперативни разходи, случаи на употреба с дълги документи, дългите разговори или взискателните аналитични задачи биха могли да бъдат особено полезни. За много компании комбинацията ефективност + цена Това е толкова решаващо, колкото няколко допълнителни точки в бенчмарковете.

Подходът на DeepSeek съчетава откритост, ефективност и незабавна наличност с пътна карта, която обещава по-способна архитектура. Ако компанията консолидира намаленията на разходите, като същевременно поддържа нивото, демонстрирано от V3.1-Terminus, Новият модел може да се превърне в практически еталон за внедряване на генеративен изкуствен интелект в голям мащаб, без стремглаво нарастващи разходи.Ще видим дали DeepSeek може да превърне ефективността вече не в технически стремеж, а в реално конкурентно предимство за компаниите и разработчиците.

Deepseek във VS Code
Свързана статия:
Как да използвате DeepSeek във Visual Studio Code