DeepSeek го забрзува процесот: пониска цена, повеќе контекст и незгоден конкурент за OpenAI

Последно ажурирање: 02/10/2025

  • Објавен е DeepSeek-V3.2-Exp, среден чекор кон неговата следна архитектура
  • Нов механизам DeepSeek Sparse Attention за долги контексти и помала пресметка
  • Достапно на апликацијата, веб и API со намалување на цената од повеќе од 50%.
  • Конкурентен притисок и прилагодување кон кинеските чипови, со поддршка од FP8 и работа на BF16
DeepSeek V3.2-Exp

Изградено на V3.1-Терминус, новиот модел DeepSeek V3.2-Exp воведува пристап на дисперзирано внимание која има за цел да го намали оптоварувањето на компјутерите без да се жртвува квалитетот. Според компанијата, Цените на API паднаа за повеќе од 50% со непосреден ефекти пристап Сега е достапно во вашата апликација, на интернет и преку API, покрај тоа што е понудено во формат на софтвер со отворен код на развојни платформи како што се Гушкање на лицето.

Технички иновации: расфрлано внимание и долг контекст

Технологија за ретко внимание кај моделите со вештачка интелигенција

Срцето на ова ажурирање е DeepSeek Ретка Внимание (DSA), механизам што ги приоритизира релевантните делови од контекстот за да ги обработи попрецизно. Компанијата детално го опишува користењето на Индексерот на молња што избира клучни фрагменти и процес на „фино гранулирана селекција на токени“, со цел да се опфатат големи контекстуални прозорци и да се обработуваат повеќе линии на размислување одеднаш со помалку информациски товар.

Ексклузивна содржина - Кликнете овде  Мета ја поттикнува трката за суперинтелигенција со создавањето на лаборатории за суперинтелигенција

Овој пристап се стреми кон подобрувања и во обуката и во инференцијата, забрзувајќи го времето и намалувајќи ја потрошувачката на меморија. DeepSeek покажува дека неговите најнови верзии веќе поддршка на FP8 и работат на компатибилност со BF16, бројни формати кои помагаат во рамнотежата на брзината и точноста и кои го олеснуваат извршување на локален хардвер.

Компанијата нагласува дека ова е лансирање, односно полигон за тестирање што ја предвидува неговата архитектура од следната генерација. Сепак, нејзината внатрешни тестови Тие истакнуваат дека V3.2-Exp (експерименталната верзија) работи на ниво на V3.1-Terminus во задачи како што се агенти за пребарување, кодирање или математика, со дополнителна предност на ефикасност во сценарија со долг контекст.

Покрај техничкиот дел, достапноста е широка: моделот може да се тестира во апликацијата, вебот и API-то на компанијата. На намалување на цената (повеќе од 50%) има за цел да го забрза усвојувањето од страна на тимовите за производи и инженерските оддели кои сакаат да ги намалат оперативните трошоци.

Ексклузивна содржина - Кликнете овде  DeepSeek R2 би можел да биде објавен во април и да означи нова пресвртница во вештачката интелигенција

На општествениот план, отворањето во Прегрнувачко лице и GitHub Им овозможува на истражувачите и програмерите да ревидираат, повторно да користат и да предлагаат подобрувања, зајакнувајќи го профилот на DeepSeek во екосистемот. ВИ со отворен код.

Влијание на пазарот и геополитички пулс

Екосистемот на вештачка интелигенција и конкуренцијата на модели

Иако не се очекува овој чекор да ги потресе пазарите како што се случи R1 и V3 на почетокот на годината, V3.2-Exp може да изврши притисок врз домашните конкуренти како што се Квен (Алибаба) и американски конкуренти како што се OpenAI, Антропски или xAI. Клучот ќе биде да се демонстрира високи перформанси по пониска цена, особено чувствителен фактор за големи распоредувања на вештачка интелигенција.

Лансирањето доаѓа во услови на сложена средина: неколку земји ја ограничија употребата на DeepSeek во владини агенции (вклучувајќи ги Италија, САД и Јужна Кореја), наведувајќи безбедносни проблеми. Овие ограничувања ја принудуваат компанијата да ги зајакне своите управување и гаранции ако сакате да стекнете институционално присуство.

Во индустрискиот сектор, Кина ги притиска своите технолошки компании да ја намалат својата зависност од странски полупроводници. Контрола на извозот на чиповите на Nvidia од САД (како што е Блеквел) и дополнителни ограничувања - на пример, на RTX Pro 6000—, DeepSeek тврди дека соработува со кинески производители на чипови за да го оптимизира својот извршување на локален хардверВо оваа насока, секторот ја покажа поддршката на Huawei до најновото ажурирање на моделот.

Ексклузивна содржина - Кликнете овде  Астронаутите заробени на Меѓународната вселенска станица се враќаат на Земјата по девет месеци

Ако моделот успее да ги одржи своите перформанси со половина од оперативните трошоци, случаи на употреба со долги документи, долги разговори или тешки аналитички задачи би можеле особено да бидат од корист. За многу компании, комбинацијата ефикасност + цена Тоа е одлучувачко како неколку дополнителни поени во реперните тестови.

Пристапот на DeepSeek ги комбинира отвореноста, ефикасноста и моменталната достапност со план кој ветува поспособна архитектура. Доколку компанијата ги консолидира намалувањата на трошоците, а воедно го одржи нивото демонстрирано од V3.1-Terminus, Новиот модел би можел да стане практичен репер за распоредување на генеративна вештачка интелигенција на големо без вртоглаво зголемување на трошоците.Ќе видиме дали DeepSeek може да ја направи ефикасноста повеќе не техничка аспирација, туку вистинска конкурентска предност за компаниите и програмерите.

Deepseek во VS Code
Поврзана статија:
Како да користите DeepSeek во кодот на Visual Studio