DeepSeek jout gas: legere kosten, mear kontekst, en in ûnhandige rivaal foar OpenAI

Lêste fernijing: 02/10/2025

  • DeepSeek-V3.2-Exp útbrocht, in tuskenstap nei syn folgjende arsjitektuer
  • Nij DeepSeek Sparse Attention-meganisme foar lange konteksten en legere berekkening
  • Beskikber op 'e app, web en API mei in priisreduksje fan mear as 50%.
  • Kompetitive druk en oanpassing oan Sineeske chips, mei FP8-stipe en wurk oan BF16
DeepSeek V3.2-Exp

Boud op V3.1-Terminus, it nije model DeepSeek V3.2-Exp yntrodusearret in oanpak fan fersprate oandacht dat besiket de kompjûterlêst te ferminderjen sûnder kwaliteit yn te leverjen. Neffens it bedriuw, API-prizen sakje mei mear as 50% mei direkte yngong, en tagong It is no beskikber yn jo app, it web en fia API, neist it oanbean wurde yn 'e foarm fan iepen boarne op ûntwikkelingsplatfoarms lykas Knuffeljend gesicht.

Technyske ynnovaasjes: fersprate oandacht en lange kontekst

Sparse oandachttechnology yn AI-modellen

De kearn fan dizze fernijing is DeepSeek Sparse Attention (DSA), in meganisme dat prioriteit jout oan relevante dielen fan 'e kontekst om se krekter te ferwurkjen. It bedriuw beskriuwt it gebrûk fan in Bliksem-yndeksearder dat wichtige fragminten selektearret en in proses fan "fynkorrelige token seleksje", mei it doel om grutte kontekstfinsters te dekken en meardere tinklinen tagelyk te behanneljen mei minder ynformaasje-overhead.

Eksklusive ynhâld - Klik hjir  Meta fersterket de race foar superintelliginsje mei de oprjochting fan Superintelligence Labs

Dizze oanpak folget ferbetteringen yn sawol training as ynferinsje, wêrtroch't tiden fersnelle wurde en ûnthâldferbrûk fermindere wurdt. DeepSeek jout oan dat syn meast resinte ferzjes al stipe FP8 en wurkje oan kompatibiliteit mei BF16, nûmerformaten dy't helpe om snelheid en krektens yn lykwicht te bringen, en dy't it makliker meitsje om útfiering op lokale hardware.

It bedriuw beklammet dat dit in lansearring is, dat is in test grûn dy't foarútsjocht op syn arsjitektuer fan 'e folgjende generaasje. Dochs, syn ynterne tests Se wize derop dat V3.2-Exp (de eksperimintele ferzje) presteart op it nivo fan V3.1-Terminus yn taken lykas sykmasines, kodearring of wiskunde, mei it tafoege foardiel fan effisjinsje yn lange-kontekst senario's.

Neist it technyske diel is de beskikberens breed: it model kin wurde hifke yn 'e app, it web en de API fan it bedriuw. De koarting (mear as 50%) hat as doel de oannimming te fersnellen troch produktteams en yngenieursôfdielingen dy't de eksploitaasjekosten ferminderje wolle.

Eksklusive ynhâld - Klik hjir  DeepSeek R2 koe yn april wurde frijlitten en markearje in nije mylpeal yn AI

Op it mienskipsfront, de iepening yn Knuffeljend gesicht en GitHub It stelt ûndersikers en ûntwikkelders yn steat om te kontrolearjen, opnij te brûken en ferbetteringen foar te stellen, wêrtroch it profyl fan DeepSeek yn it ekosysteem fersterke wurdt. iepen boarne AI.

Merkynfloed en geopolitike pols

AI-ekosysteem en modelkompetysje

Hoewol dizze stap nei alle gedachten net de merken sil skodzje lykas it die R1 en V3 oan it begjin fan it jier, V3.2-Exp kin druk sette op ynlânske rivalen lykas Qwen (Alibaba) en Amerikaanske konkurrinten lykas OpenAI, Antropysk of xAI. De kaai sil wêze om te demonstrearjen hege prestaasjes tsjin legere kosten, in bysûnder gefoelige faktor foar grutte AI-ynsetten.

De lansearring komt temidden fan in komplekse omjouwing: ferskate lannen hawwe it gebrûk fan beheind DeepSeek yn oerheidsynstânsjes (ynklusyf Itaalje, de Feriene Steaten en Súd-Koreä), mei ferwizing nei soargen oer feiligens. Dizze beheiningen twinge it bedriuw om syn bestjoer en garânsjes as jo ynstitúsjonele oanwêzigens krije wolle.

Yn 'e yndustriële sektor dringt Sina har technologybedriuwen oan om har ôfhinklikens fan bûtenlânske healgeleiders te ferminderjen. Amerikaanske eksportkontrôles op Nvidia-chips (lykas Blackwell) en ekstra beheiningen - bygelyks op RTX Pro 6000—, DeepSeek beweart gear te wurkjen mei Sineeske chipmakkers om syn útfiering op lokale hardwareYn dizze line hat de sektor de stipe oanjûn fan Huawei nei de lêste modelupdate.

Eksklusive ynhâld - Klik hjir  Astronauten dy't fongen binne op it International Space Station komme nei njoggen moannen werom nei de ierde

As it model deryn slagget om syn prestaasjes te behâlden mei de helte fan 'e eksploitaasjekosten, gebrûksgefallen mei lange dokuminten, lange petearen, of easkenfolle analytyske taken kinne foaral foardielich wêze. Foar in protte bedriuwen is de kombinaasje effisjinsje + priis It is like beslissend as in pear ekstra punten yn benchmarks.

De oanpak fan DeepSeek kombinearret iepenheid, effisjinsje en direkte beskikberens mei in roadmap dy't in bettere arsjitektuer belooft. As it bedriuw de kostenreduksjes konsolidearret wylst it nivo dat V3.1-Terminus demonstrearre hat, behâldt, It nije model koe in praktyske benchmark wurde foar it ynsetten fan generative AI op skaal sûnder de kosten te ferheegjen.Wy sille sjen oft DeepSeek effisjinsje net langer in technyske aspiraasje meitsje kin, mar in echt konkurrinsjefoardiel foar bedriuwen en ûntwikkelders.

Deepseek yn VS Code
Ferlykber artikel:
Hoe kinne jo DeepSeek brûke yn Visual Studio Code