DeepSeek painaa kaasua: halvempi hinta, enemmän kontekstia ja hankala kilpailija OpenAI:lle

Viimeisin päivitys: 02/10/2025
Kirjoittaja: Alberto navarro

  • DeepSeek-V3.2-Exp julkaistu, välivaihe kohti seuraavaa arkkitehtuuria
  • Uusi DeepSeek Sparse Attention -mekanismi pitkille konteksteille ja pienemmälle laskennalle
  • Saatavilla sovelluksessa, verkossa ja API:ssa yli 50 %:n hinnanalennuksella.
  • Kilpailupaine ja sopeutuminen kiinalaisiin siruihin, FP8-tuki ja työ BF16:n parissa
DeepSeek V3.2-Expert

Rakennettu V3.1-terminaali, uusi malli DeepSeek V3.2-Expert esittelee hajautetun huomion lähestymistavan ...joka pyrkii vähentämään laskentatehoa laadusta tinkimättä. Yrityksen mukaan API-hinnat laskevat yli 50 % välittömästi voimaanja pääsy Se on nyt saatavilla sovelluksessasi, verkossa ja API:n kautta, sen lisäksi, että sitä tarjotaan muodossa avoin lähdekoodi kehitysalustoilla, kuten Halaaminen kasvot.

Tekniset innovaatiot: hajanainen huomio ja pitkä konteksti

Harva huomioteknologia tekoälymalleissa

Tämän päivityksen ydin on DeepSeek Sparse Attention (DSA), mekanismi, joka priorisoi kontekstin olennaisia ​​osia niiden tarkempaa käsittelyä varten. Yritys kertoo yksityiskohtaisesti a:n käytöstä Salamaindeksi joka valitsee avainfragmentit ja prosessin, jossa ”Hienoraikasteinen merkkien valinta”, tavoitteenaan kattaa suuret konteksti-ikkunat ja käsitellä useita ajatuslinjoja kerralla pienemmällä tietomäärällä.

Ainutlaatuinen sisältö - Napsauta tästä  YouTube tiukentaa käytäntöään massatuotettuja ja tekoälyllä toimivia videoita vastaan

Tämä lähestymistapa pyrkii parannuksia sekä koulutuksessa että päättelyssä, mikä nopeuttaa aikoja ja vähentää muistin kulutusta. DeepSeek ilmoittaa, että sen uusimmat versiot ovat jo tukea kahdeksatta puiteohjelmaa ja työskentelevät yhteensopivuuden eteen BF16, numeromuotoilut, jotka auttavat tasapainottamaan nopeutta ja tarkkuutta ja helpottavat suoritus paikallisella laitteistolla.

Yhtiö korostaa, että kyseessä on lanseeraus, ts. testausmaa joka ennakoi seuraavan sukupolven arkkitehtuuriaan. Silti sen sisäiset testit He huomauttavat, että V3.2-Exp (kokeellinen versio) suoriutuu V3.1-Terminuksen tasolla esimerkiksi hakuagenttien, koodauksen tai matematiikan kaltaisissa tehtävissä, ja sillä on lisäetuna tehokkuus pitkän kontekstin skenaarioissa.

Teknisen puolen lisäksi saatavuus on laaja: mallia voidaan testata sovelluksen, verkko ja API yrityksen hinnanalennus (yli 50 %) pyrkii nopeuttamaan käyttöönottoa tuotetiimien ja suunnitteluosastojen keskuudessa, jotka haluavat vähentää käyttökustannuksia.

Ainutlaatuinen sisältö - Napsauta tästä  Kuva 03: Humanoidirobotti hyppää työpajasta kotiin

Yhteisön rintamalla avajaiset vuonna Hugging Face ja GitHub Se mahdollistaa tutkijoiden ja kehittäjien auditoinnin, uudelleenkäytön ja parannusten ehdottamisen, mikä vahvistaa DeepSeekin profiilia ekosysteemissä. avoimen lähdekoodin AI.

Markkinavaikutus ja geopoliittinen pulssi

Tekoälyekosysteemi ja mallikilpailu

Vaikka tämän toimenpiteen ei odoteta ravistelevan markkinoita samalla tavalla kuin se teki R1 ja V3 vuoden alussa V3.2-Exp voi painostaa kotimaisia ​​kilpailijoita, kuten Qwen (Alibaba) ja amerikkalaiset kilpailijat, kuten OpenAI, Antrooppinen tai xAI. Avainasia olisi osoittaa korkea suorituskyky alhaisemmilla kustannuksilla, erityisen herkkä tekijä suurille tekoälykäyttöönotoille.

Lanseeraus tapahtuu monimutkaisessa ympäristössä: useat maat ovat rajoittaneet käyttöä DeepSeek valtion virastoissa (mukaan lukien Italia, Yhdysvallat ja Etelä-Korea) vedoten turvallisuussyihin. Nämä rajoitukset pakottavat yrityksen vahvistamaan hallinto ja takuut jos haluat institutionaalisen läsnäolon.

Teollisuussektorilla Kiina painostaa teknologiayrityksiään vähentämään riippuvuuttaan ulkomaisista puolijohteista. Yhdysvaltojen vientirajoitukset Nvidia-siruille (kuten Blackwell) ja lisärajoituksia – esimerkiksi RTX Pro 6000— DeepSeek väittää tekevänsä yhteistyötä kiinalaisten siruvalmistajien kanssa optimoidakseen suoritus paikallisella laitteistollaTässä yhteydessä sektori on ilmaissut tukensa Huawei uusimpaan mallipäivitykseen.

Ainutlaatuinen sisältö - Napsauta tästä  Meta vauhdittaa superälykkyyden kilpailua perustamalla superälylaboratorioita

Jos malli onnistuu ylläpitämään suorituskykynsä puolella käyttökustannuksilla, käyttötapaukset pitkien dokumenttien kanssa, pitkät keskustelut tai vaativat analyyttiset tehtävät voisivat erityisesti hyödyttää. Monille yrityksille tämä yhdistelmä tehokkuus + hinta Se on yhtä ratkaiseva kuin muutama lisäpiste vertailuissa.

DeepSeekin lähestymistapa yhdistää avoimuuden, tehokkuuden ja välittömän saatavuuden tiekarttaan, joka lupaa tehokkaamman arkkitehtuurin. Jos yritys vakiinnuttaa kustannussäästöt säilyttäen samalla V3.1-Terminuksen osoittaman tason, Uudesta mallista voisi tulla käytännöllinen vertailukohta generatiivisen tekoälyn laajamittaiselle käyttöönotolle ilman räjähdysmäisiä kustannuksia.Näemme, voiko DeepSeek tehdä tehokkuudesta enää teknisen pyrkimyksen, vaan todellisen kilpailuedun yrityksille ja kehittäjille.

Deepseek VS Codessa
Aiheeseen liittyvä artikkeli:
DeepSeekin käyttäminen Visual Studio Codessa