DeepSeek giver gas: lavere omkostninger, mere kontekst og en akavet rival til OpenAI

Sidste ændring: 02/10/2025

  • DeepSeek-V3.2-Exp udgivet, et mellemtrin mod dens næste arkitektur
  • Ny DeepSeek Sparse Attention-mekanisme til lange kontekster og lavere beregningskrav
  • Tilgængelig på appen, web og API med en prisreduktion på mere end 50%.
  • Konkurrencepres og tilpasning til kinesiske chips, med FP8-understøttelse og arbejde på BF16
DeepSeek V3.2-Exp

Bygget på V3.1-Terminus, den nye model DeepSeek V3.2-Exp introducerer en tilgang med spredt opmærksomhed som søger at reducere computerbelastningen uden at gå på kompromis med kvaliteten. Ifølge virksomheden, API-priserne falder med mere end 50% med øjeblikkelig virkningog adgang Den er nu tilgængelig i din app, på nettet og via API, udover at blive tilbudt i form af open source på udviklingsplatforme som f.eks. Knusende ansigt.

Tekniske innovationer: spredt opmærksomhed og lang kontekst

Sparsom opmærksomhedsteknologi i AI-modeller

Kernen i denne opdatering er DeepSeek Sparse Attention (DSA), en mekanisme, der prioriterer relevante dele af konteksten for at behandle dem mere præcist. Virksomheden beskriver brugen af ​​en Lynindekser der udvælger nøglefragmenter og en proces med "finkornet token-udvælgelse", med det mål at dække store kontekstvinduer og håndtere flere tankebaner på én gang med mindre informationsomkostning.

Eksklusivt indhold - Klik her  Sam Altman præciserer ChatGPT's vandforbrug: tal, debat og spørgsmål omkring AI's miljøpåvirkning

Denne tilgang forfølger forbedringer i både træning og inferens, hvilket fremskynder tiden og reducerer hukommelsesforbruget. DeepSeek angiver, at dens nyeste versioner allerede støtte FP8 og arbejder på kompatibilitet med BF16, talformater, der hjælper med at balancere hastighed og nøjagtighed, og som gør det nemmere at udførelse på lokal hardware.

Virksomheden understreger, at dette er en lancering, dvs. en testplads som forudser dens næste generations arkitektur. Alligevel er dens interne tests De påpeger, at V3.2-Exp (den eksperimentelle version) præsterer på niveau med V3.1-Terminus i opgaver som søgeagenter, kodning eller matematik, med den ekstra fordel af effektivitet i scenarier med lang kontekst.

Ud over den tekniske del er tilgængeligheden bred: modellen kan testes i app, internettet og API'et af virksomheden. Den prisreduktion (mere end 50%) sigter mod at fremskynde implementeringen i produktteams og ingeniørafdelinger, der ønsker at reducere driftsomkostningerne.

Eksklusivt indhold - Klik her  Nebius og Microsoft indgår megaaftale om at skalere AI-skyen

På samfundsfronten, åbningen i Krammeansigt og GitHub Det gør det muligt for forskere og udviklere at revidere, genbruge og foreslå forbedringer, hvilket styrker DeepSeeks profil i økosystemet. Åben kildekode-kunstig intelligens.

Markedspåvirkning og geopolitisk puls

AI-økosystem og modelkonkurrence

Selvom dette skridt ikke forventes at ryste markederne, som det gjorde R1 og V3 i begyndelsen af ​​året, V3.2-Exp kan lægge pres på indenlandske rivaler som f.eks. Qwen (Alibaba) og amerikanske konkurrenter som f.eks. OpenAI, Antropisk eller xAI. Nøglen vil være at demonstrere høj ydeevne til lavere pris, en særligt følsom faktor for store AI-implementeringer.

Lanceringen sker midt i et komplekst miljø: flere lande har begrænset brugen af DeepSeek i offentlige myndigheder (inklusive Italien, USA og Sydkorea), med henvisning til sikkerhedsproblemer. Disse restriktioner tvinger virksomheden til at styrke sin styring og garantier hvis du ønsker at opnå institutionel tilstedeværelse.

Inden for industrisektoren presser Kina sine teknologivirksomheder til at reducere deres afhængighed af udenlandske halvledere. Amerikansk eksportkontrol af Nvidia-chips (såsom Blackwell) og yderligere restriktioner – for eksempel på RTX Pro 6000—, DeepSeek hævder at samarbejde med kinesiske chipproducenter for at optimere sin udførelse på lokal hardwareI denne forbindelse har sektoren vist støtte til Huawei til den seneste modelopdatering.

Eksklusivt indhold - Klik her  OpenAI begrænser brugen af ​​ChatGPT i medicinske og juridiske sammenhænge

Hvis modellen formår at opretholde sin ydeevne med halvdelen af ​​driftsomkostningerne, brugsscenarier med lange dokumenter, lange samtaler eller krævende analytiske opgaver kan være særligt gavnlige. For mange virksomheder er kombinationen effektivitet + pris Det er lige så afgørende som et par ekstra point i benchmarks.

DeepSeeks tilgang kombinerer åbenhed, effektivitet og øjeblikkelig tilgængelighed med en køreplan, der lover en mere kapabel arkitektur. Hvis virksomheden konsoliderer omkostningsreduktionerne, samtidig med at niveauet, der er demonstreret af V3.1-Terminus, opretholdes, Den nye model kan blive et praktisk benchmark for implementering af generativ AI i stor skala uden at omkostningerne stiger voldsomt.Vi vil se, om DeepSeek kan gøre effektivitet ikke længere til en teknisk aspiration, men til en reel konkurrencefordel for virksomheder og udviklere.

Deepseek i VS-kode
relateret artikel:
Sådan bruger du DeepSeek i Visual Studio Code