- DeepSeek-V3.2-Exp utgitt, et mellomsteg mot den neste arkitekturen
- Ny DeepSeek Sparse Attention-mekanisme for lange kontekster og lavere beregningsbehov
- Tilgjengelig på appen, nettet og API-et med en prisreduksjon på over 50 %.
- Konkurransepress og tilpasning til kinesiske brikker, med FP8-støtte og arbeid på BF16
Bygget på V3.1-Terminus, den nye modellen DeepSeek V3.2-Exp introduserer en tilnærming til spredt oppmerksomhet som har som mål å redusere databelastningen uten å ofre kvaliteten. Ifølge selskapet, API-prisene faller med mer enn 50 % med umiddelbar virkningog tilgang Den er nå tilgjengelig i appen din, på nettet og via API, i tillegg til å bli tilbudt i form av åpen kildekode på utviklingsplattformer som Klemme ansiktet.
Tekniske innovasjoner: spredt oppmerksomhet og lang kontekst

Kjernen i denne oppdateringen er DeepSeek Sparse Attention (DSA), en mekanisme som prioriterer relevante deler av konteksten for å behandle dem mer nøyaktig. Selskapet beskriver bruken av en Lynindekser som velger nøkkelfragmenter og en prosess med «finkornet tokenutvalg», med mål om å dekke store kontekstvinduer og håndtere flere tankerekker samtidig med mindre informasjonsoverhead.
Denne tilnærmingen forfølger forbedringer i både trening og inferens, noe som øker tiden og reduserer minneforbruket. DeepSeek indikerer at de nyeste versjonene allerede støtte FP8 og jobber med kompatibilitet med BF16, tallformater som bidrar til å balansere hastighet og nøyaktighet, og som gjør det enklere å utførelse på lokal maskinvare.
Selskapet understreker at dette er en lansering, det vil si en testplass som forutser neste generasjons arkitektur. Likevel, dens interne tester De påpeker at V3.2-Exp (eksperimentversjonen) yter på nivå med V3.1-Terminus i oppgaver som søkeagenter, koding eller matematikk, med den ekstra fordelen av effektivitet i langsiktige scenarier.
I tillegg til den tekniske delen er tilgjengeligheten bred: modellen kan testes i app, nettet og API-et av selskapet. Den prisreduksjon (mer enn 50 %) har som mål å akselerere adopsjonen hos produktteam og ingeniøravdelinger som ønsker å redusere driftskostnadene.
På samfunnsfronten, åpningen i Klemfjes og GitHub Det gjør det mulig for forskere og utviklere å revidere, gjenbruke og foreslå forbedringer, noe som styrker DeepSeeks profil i økosystemet. Åpen kildekode AI.
Markedspåvirkning og geopolitisk puls

Selv om dette tiltaket ikke forventes å ryste markedene slik det gjorde R1 og V3 i begynnelsen av året, V3.2-Exp kan legge press på innenlandske rivaler som Qwen (Alibaba) og amerikanske konkurrenter som f.eks. OpenAI, Antropisk eller xAI. Nøkkelen vil være å demonstrere høy ytelse til lavere kostnad, en spesielt sensitiv faktor for store AI-utplasseringer.
Lanseringen kommer midt i et komplekst miljø: flere land har begrenset bruken av DeepSeek i offentlige etater (inkludert Italia, USA og Sør-Korea), med henvisning til sikkerhetsbekymringer. Disse restriksjonene tvinger selskapet til å styrke sin styring og garantier hvis du ønsker å oppnå institusjonell tilstedeværelse.
I industrisektoren presser Kina teknologiselskapene sine til å redusere sin avhengighet av utenlandske halvledere. Amerikansk eksportkontroll av Nvidia-brikker (som Blackwell) og ytterligere restriksjoner – for eksempel på RTX Pro 6000—, DeepSeek hevder å samarbeide med kinesiske brikkeprodusenter for å optimalisere sin utførelse på lokal maskinvareI denne forbindelse har sektoren vist støtte til Huawei til den nyeste modelloppdateringen.
Hvis modellen klarer å opprettholde ytelsen med halvparten av driftskostnadene, brukstilfeller med lange dokumenter, lange samtaler eller krevende analytiske oppgaver kan være spesielt gunstige. For mange selskaper er kombinasjonen effektivitet + pris Det er like avgjørende som noen få ekstra poeng i referansetester.
DeepSeeks tilnærming kombinerer åpenhet, effektivitet og umiddelbar tilgjengelighet med en plan som lover en mer kapabel arkitektur. Hvis selskapet konsoliderer kostnadsreduksjonene samtidig som nivået som V3.1-Terminus demonstrerer opprettholder, Den nye modellen kan bli en praktisk målestokk for å distribuere generativ AI i stor skala uten at kostnadene skyter i været.Vi får se om DeepSeek kan gjøre effektivitet ikke lenger til en teknisk ambisjon, men til et reelt konkurransefortrinn for bedrifter og utviklere.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.