- DeepSeek-V3.2-Exp julkaistu, välivaihe kohti seuraavaa arkkitehtuuria
- Uusi DeepSeek Sparse Attention -mekanismi pitkille konteksteille ja pienemmälle laskennalle
- Saatavilla sovelluksessa, verkossa ja API:ssa yli 50 %:n hinnanalennuksella.
- Kilpailupaine ja sopeutuminen kiinalaisiin siruihin, FP8-tuki ja työ BF16:n parissa
Rakennettu V3.1-terminaali, uusi malli DeepSeek V3.2-Expert esittelee hajautetun huomion lähestymistavan ...joka pyrkii vähentämään laskentatehoa laadusta tinkimättä. Yrityksen mukaan API-hinnat laskevat yli 50 % välittömästi voimaanja pääsy Se on nyt saatavilla sovelluksessasi, verkossa ja API:n kautta, sen lisäksi, että sitä tarjotaan muodossa avoin lähdekoodi kehitysalustoilla, kuten Halaaminen kasvot.
Tekniset innovaatiot: hajanainen huomio ja pitkä konteksti

Tämän päivityksen ydin on DeepSeek Sparse Attention (DSA), mekanismi, joka priorisoi kontekstin olennaisia osia niiden tarkempaa käsittelyä varten. Yritys kertoo yksityiskohtaisesti a:n käytöstä Salamaindeksi joka valitsee avainfragmentit ja prosessin, jossa ”Hienoraikasteinen merkkien valinta”, tavoitteenaan kattaa suuret konteksti-ikkunat ja käsitellä useita ajatuslinjoja kerralla pienemmällä tietomäärällä.
Tämä lähestymistapa pyrkii parannuksia sekä koulutuksessa että päättelyssä, mikä nopeuttaa aikoja ja vähentää muistin kulutusta. DeepSeek ilmoittaa, että sen uusimmat versiot ovat jo tukea kahdeksatta puiteohjelmaa ja työskentelevät yhteensopivuuden eteen BF16, numeromuotoilut, jotka auttavat tasapainottamaan nopeutta ja tarkkuutta ja helpottavat suoritus paikallisella laitteistolla.
Yhtiö korostaa, että kyseessä on lanseeraus, ts. testausmaa joka ennakoi seuraavan sukupolven arkkitehtuuriaan. Silti sen sisäiset testit He huomauttavat, että V3.2-Exp (kokeellinen versio) suoriutuu V3.1-Terminuksen tasolla esimerkiksi hakuagenttien, koodauksen tai matematiikan kaltaisissa tehtävissä, ja sillä on lisäetuna tehokkuus pitkän kontekstin skenaarioissa.
Teknisen puolen lisäksi saatavuus on laaja: mallia voidaan testata sovelluksen, verkko ja API yrityksen hinnanalennus (yli 50 %) pyrkii nopeuttamaan käyttöönottoa tuotetiimien ja suunnitteluosastojen keskuudessa, jotka haluavat vähentää käyttökustannuksia.
Yhteisön rintamalla avajaiset vuonna Hugging Face ja GitHub Se mahdollistaa tutkijoiden ja kehittäjien auditoinnin, uudelleenkäytön ja parannusten ehdottamisen, mikä vahvistaa DeepSeekin profiilia ekosysteemissä. avoimen lähdekoodin AI.
Markkinavaikutus ja geopoliittinen pulssi

Vaikka tämän toimenpiteen ei odoteta ravistelevan markkinoita samalla tavalla kuin se teki R1 ja V3 vuoden alussa V3.2-Exp voi painostaa kotimaisia kilpailijoita, kuten Qwen (Alibaba) ja amerikkalaiset kilpailijat, kuten OpenAI, Antrooppinen tai xAI. Avainasia olisi osoittaa korkea suorituskyky alhaisemmilla kustannuksilla, erityisen herkkä tekijä suurille tekoälykäyttöönotoille.
Lanseeraus tapahtuu monimutkaisessa ympäristössä: useat maat ovat rajoittaneet käyttöä DeepSeek valtion virastoissa (mukaan lukien Italia, Yhdysvallat ja Etelä-Korea) vedoten turvallisuussyihin. Nämä rajoitukset pakottavat yrityksen vahvistamaan hallinto ja takuut jos haluat institutionaalisen läsnäolon.
Teollisuussektorilla Kiina painostaa teknologiayrityksiään vähentämään riippuvuuttaan ulkomaisista puolijohteista. Yhdysvaltojen vientirajoitukset Nvidia-siruille (kuten Blackwell) ja lisärajoituksia – esimerkiksi RTX Pro 6000— DeepSeek väittää tekevänsä yhteistyötä kiinalaisten siruvalmistajien kanssa optimoidakseen suoritus paikallisella laitteistollaTässä yhteydessä sektori on ilmaissut tukensa Huawei uusimpaan mallipäivitykseen.
Jos malli onnistuu ylläpitämään suorituskykynsä puolella käyttökustannuksilla, käyttötapaukset pitkien dokumenttien kanssa, pitkät keskustelut tai vaativat analyyttiset tehtävät voisivat erityisesti hyödyttää. Monille yrityksille tämä yhdistelmä tehokkuus + hinta Se on yhtä ratkaiseva kuin muutama lisäpiste vertailuissa.
DeepSeekin lähestymistapa yhdistää avoimuuden, tehokkuuden ja välittömän saatavuuden tiekarttaan, joka lupaa tehokkaamman arkkitehtuurin. Jos yritys vakiinnuttaa kustannussäästöt säilyttäen samalla V3.1-Terminuksen osoittaman tason, Uudesta mallista voisi tulla käytännöllinen vertailukohta generatiivisen tekoälyn laajamittaiselle käyttöönotolle ilman räjähdysmäisiä kustannuksia.Näemme, voiko DeepSeek tehdä tehokkuudesta enää teknisen pyrkimyksen, vaan todellisen kilpailuedun yrityksille ja kehittäjille.
Olen teknologian harrastaja, joka on muuttanut "nörtti"-harrastuksensa ammatiksi. Olen käyttänyt yli 10 vuotta elämästäni uusinta teknologiaa käyttäen ja kaikenlaisten ohjelmien parissa puhtaasta uteliaisuudesta. Nyt olen erikoistunut tietotekniikkaan ja videopeleihin. Tämä johtuu siitä, että yli 5 vuoden ajan olen työskennellyt kirjoittaen useille teknologiaa ja videopelejä käsitteleville verkkosivustoille ja luonut artikkeleita, jotka pyrkivät antamaan sinulle tarvitsemaasi tietoa kielellä, jota kaikki ymmärtävät.
Jos sinulla on kysyttävää, tietoni ulottuu kaikesta Windows-käyttöjärjestelmään liittyvästä sekä matkapuhelimien Androidista. Ja sitoumukseni on sinulle, olen aina valmis käyttämään muutaman minuutin ja auttamaan sinua ratkaisemaan kaikki kysymyksesi, joita sinulla saattaa olla tässä Internet-maailmassa.