- DeepSeek-V3.2-Exp udgivet, et mellemtrin mod dens næste arkitektur
- Ny DeepSeek Sparse Attention-mekanisme til lange kontekster og lavere beregningskrav
- Tilgængelig på appen, web og API med en prisreduktion på mere end 50%.
- Konkurrencepres og tilpasning til kinesiske chips, med FP8-understøttelse og arbejde på BF16
Bygget på V3.1-Terminus, den nye model DeepSeek V3.2-Exp introducerer en tilgang med spredt opmærksomhed som søger at reducere computerbelastningen uden at gå på kompromis med kvaliteten. Ifølge virksomheden, API-priserne falder med mere end 50% med øjeblikkelig virkningog adgang Den er nu tilgængelig i din app, på nettet og via API, udover at blive tilbudt i form af open source på udviklingsplatforme som f.eks. Knusende ansigt.
Tekniske innovationer: spredt opmærksomhed og lang kontekst

Kernen i denne opdatering er DeepSeek Sparse Attention (DSA), en mekanisme, der prioriterer relevante dele af konteksten for at behandle dem mere præcist. Virksomheden beskriver brugen af en Lynindekser der udvælger nøglefragmenter og en proces med "finkornet token-udvælgelse", med det mål at dække store kontekstvinduer og håndtere flere tankebaner på én gang med mindre informationsomkostning.
Denne tilgang forfølger forbedringer i både træning og inferens, hvilket fremskynder tiden og reducerer hukommelsesforbruget. DeepSeek angiver, at dens nyeste versioner allerede støtte FP8 og arbejder på kompatibilitet med BF16, talformater, der hjælper med at balancere hastighed og nøjagtighed, og som gør det nemmere at udførelse på lokal hardware.
Virksomheden understreger, at dette er en lancering, dvs. en testplads som forudser dens næste generations arkitektur. Alligevel er dens interne tests De påpeger, at V3.2-Exp (den eksperimentelle version) præsterer på niveau med V3.1-Terminus i opgaver som søgeagenter, kodning eller matematik, med den ekstra fordel af effektivitet i scenarier med lang kontekst.
Ud over den tekniske del er tilgængeligheden bred: modellen kan testes i app, internettet og API'et af virksomheden. Den prisreduktion (mere end 50%) sigter mod at fremskynde implementeringen i produktteams og ingeniørafdelinger, der ønsker at reducere driftsomkostningerne.
På samfundsfronten, åbningen i Krammeansigt og GitHub Det gør det muligt for forskere og udviklere at revidere, genbruge og foreslå forbedringer, hvilket styrker DeepSeeks profil i økosystemet. Åben kildekode-kunstig intelligens.
Markedspåvirkning og geopolitisk puls

Selvom dette skridt ikke forventes at ryste markederne, som det gjorde R1 og V3 i begyndelsen af året, V3.2-Exp kan lægge pres på indenlandske rivaler som f.eks. Qwen (Alibaba) og amerikanske konkurrenter som f.eks. OpenAI, Antropisk eller xAI. Nøglen vil være at demonstrere høj ydeevne til lavere pris, en særligt følsom faktor for store AI-implementeringer.
Lanceringen sker midt i et komplekst miljø: flere lande har begrænset brugen af DeepSeek i offentlige myndigheder (inklusive Italien, USA og Sydkorea), med henvisning til sikkerhedsproblemer. Disse restriktioner tvinger virksomheden til at styrke sin styring og garantier hvis du ønsker at opnå institutionel tilstedeværelse.
Inden for industrisektoren presser Kina sine teknologivirksomheder til at reducere deres afhængighed af udenlandske halvledere. Amerikansk eksportkontrol af Nvidia-chips (såsom Blackwell) og yderligere restriktioner – for eksempel på RTX Pro 6000—, DeepSeek hævder at samarbejde med kinesiske chipproducenter for at optimere sin udførelse på lokal hardwareI denne forbindelse har sektoren vist støtte til Huawei til den seneste modelopdatering.
Hvis modellen formår at opretholde sin ydeevne med halvdelen af driftsomkostningerne, brugsscenarier med lange dokumenter, lange samtaler eller krævende analytiske opgaver kan være særligt gavnlige. For mange virksomheder er kombinationen effektivitet + pris Det er lige så afgørende som et par ekstra point i benchmarks.
DeepSeeks tilgang kombinerer åbenhed, effektivitet og øjeblikkelig tilgængelighed med en køreplan, der lover en mere kapabel arkitektur. Hvis virksomheden konsoliderer omkostningsreduktionerne, samtidig med at niveauet, der er demonstreret af V3.1-Terminus, opretholdes, Den nye model kan blive et praktisk benchmark for implementering af generativ AI i stor skala uden at omkostningerne stiger voldsomt.Vi vil se, om DeepSeek kan gøre effektivitet ikke længere til en teknisk aspiration, men til en reel konkurrencefordel for virksomheder og udviklere.
Jeg er en teknologientusiast, der har vendt sine "nørde" interesser til et erhverv. Jeg har brugt mere end 10 år af mit liv på at bruge avanceret teknologi og pille ved alle slags programmer af ren nysgerrighed. Nu har jeg specialiseret mig i computerteknologi og videospil. Dette skyldes, at jeg i mere end 5 år har skrevet til forskellige hjemmesider om teknologi og videospil, og lavet artikler, der søger at give dig den information, du har brug for, på et sprog, der er forståeligt for alle.
Har du spørgsmål, så spænder min viden fra alt relateret til Windows styresystemet samt Android til mobiltelefoner. Og mit engagement er over for dig, jeg er altid villig til at bruge et par minutter og hjælpe dig med at løse eventuelle spørgsmål, du måtte have i denne internetverden.