DeepSeek gir gass: lavere kostnader, mer kontekst og en vanskelig rival for OpenAI

Siste oppdatering: 02/10/2025

  • DeepSeek-V3.2-Exp utgitt, et mellomsteg mot den neste arkitekturen
  • Ny DeepSeek Sparse Attention-mekanisme for lange kontekster og lavere beregningsbehov
  • Tilgjengelig på appen, nettet og API-et med en prisreduksjon på over 50 %.
  • Konkurransepress og tilpasning til kinesiske brikker, med FP8-støtte og arbeid på BF16
DeepSeek V3.2-Exp

Bygget på V3.1-Terminus, den nye modellen DeepSeek V3.2-Exp introduserer en tilnærming til spredt oppmerksomhet som har som mål å redusere databelastningen uten å ofre kvaliteten. Ifølge selskapet, API-prisene faller med mer enn 50 % med umiddelbar virkningog tilgang Den er nå tilgjengelig i appen din, på nettet og via API, i tillegg til å bli tilbudt i form av åpen kildekode på utviklingsplattformer som Klemme ansiktet.

Tekniske innovasjoner: spredt oppmerksomhet og lang kontekst

Sparsom oppmerksomhetsteknologi i AI-modeller

Kjernen i denne oppdateringen er DeepSeek Sparse Attention (DSA), en mekanisme som prioriterer relevante deler av konteksten for å behandle dem mer nøyaktig. Selskapet beskriver bruken av en Lynindekser som velger nøkkelfragmenter og en prosess med «finkornet tokenutvalg», med mål om å dekke store kontekstvinduer og håndtere flere tankerekker samtidig med mindre informasjonsoverhead.

Eksklusivt innhold - Klikk her  Meta øker kappløpet om superintelligens med opprettelsen av superintelligenslaboratorier

Denne tilnærmingen forfølger forbedringer i både trening og inferens, noe som øker tiden og reduserer minneforbruket. DeepSeek indikerer at de nyeste versjonene allerede støtte FP8 og jobber med kompatibilitet med BF16, tallformater som bidrar til å balansere hastighet og nøyaktighet, og som gjør det enklere å utførelse på lokal maskinvare.

Selskapet understreker at dette er en lansering, det vil si en testplass som forutser neste generasjons arkitektur. Likevel, dens interne tester De påpeker at V3.2-Exp (eksperimentversjonen) yter på nivå med V3.1-Terminus i oppgaver som søkeagenter, koding eller matematikk, med den ekstra fordelen av effektivitet i langsiktige scenarier.

I tillegg til den tekniske delen er tilgjengeligheten bred: modellen kan testes i app, nettet og API-et av selskapet. Den prisreduksjon (mer enn 50 %) har som mål å akselerere adopsjonen hos produktteam og ingeniøravdelinger som ønsker å redusere driftskostnadene.

Eksklusivt innhold - Klikk her  DeepSeek R2 kan bli utgitt i april og markere en ny milepæl innen AI

På samfunnsfronten, åpningen i Klemfjes og GitHub Det gjør det mulig for forskere og utviklere å revidere, gjenbruke og foreslå forbedringer, noe som styrker DeepSeeks profil i økosystemet. Åpen kildekode AI.

Markedspåvirkning og geopolitisk puls

AI-økosystem og modellkonkurranse

Selv om dette tiltaket ikke forventes å ryste markedene slik det gjorde R1 og V3 i begynnelsen av året, V3.2-Exp kan legge press på innenlandske rivaler som Qwen (Alibaba) og amerikanske konkurrenter som f.eks. OpenAI, Antropisk eller xAI. Nøkkelen vil være å demonstrere høy ytelse til lavere kostnad, en spesielt sensitiv faktor for store AI-utplasseringer.

Lanseringen kommer midt i et komplekst miljø: flere land har begrenset bruken av DeepSeek i offentlige etater (inkludert Italia, USA og Sør-Korea), med henvisning til sikkerhetsbekymringer. Disse restriksjonene tvinger selskapet til å styrke sin styring og garantier hvis du ønsker å oppnå institusjonell tilstedeværelse.

I industrisektoren presser Kina teknologiselskapene sine til å redusere sin avhengighet av utenlandske halvledere. Amerikansk eksportkontroll av Nvidia-brikker (som Blackwell) og ytterligere restriksjoner – for eksempel på RTX Pro 6000—, DeepSeek hevder å samarbeide med kinesiske brikkeprodusenter for å optimalisere sin utførelse på lokal maskinvareI denne forbindelse har sektoren vist støtte til Huawei til den nyeste modelloppdateringen.

Eksklusivt innhold - Klikk her  Astronauter fanget på den internasjonale romstasjonen vender tilbake til jorden etter ni måneder

Hvis modellen klarer å opprettholde ytelsen med halvparten av driftskostnadene, brukstilfeller med lange dokumenter, lange samtaler eller krevende analytiske oppgaver kan være spesielt gunstige. For mange selskaper er kombinasjonen effektivitet + pris Det er like avgjørende som noen få ekstra poeng i referansetester.

DeepSeeks tilnærming kombinerer åpenhet, effektivitet og umiddelbar tilgjengelighet med en plan som lover en mer kapabel arkitektur. Hvis selskapet konsoliderer kostnadsreduksjonene samtidig som nivået som V3.1-Terminus demonstrerer opprettholder, Den nye modellen kan bli en praktisk målestokk for å distribuere generativ AI i stor skala uten at kostnadene skyter i været.Vi får se om DeepSeek kan gjøre effektivitet ikke lenger til en teknisk ambisjon, men til et reelt konkurransefortrinn for bedrifter og utviklere.

Deepseek i VS-kode
Relatert artikkel:
Hvordan bruke DeepSeek i Visual Studio Code