- Išleista „DeepSeek-V3.2-Exp“ – tarpinis žingsnis link naujos architektūros
- Naujas „DeepSeek Sparse Attention“ mechanizmas ilgiems kontekstams ir mažesniems skaičiavimo našumo rodikliams
- Pasiekiama programėlėje, žiniatinklyje ir API, o kaina sumažinta daugiau nei 50 %.
- Konkurencinis spaudimas ir prisitaikymas prie kiniškų lustų, remiant FP8 ir dirbant su BF16
Pastatytas ant V3.1-Terminus, naujasis modelis „DeepSeek V3.2“ – patyręs pristato išsklaidyto dėmesio metodą kuria siekiama sumažinti skaičiavimo apkrovą neprarandant kokybės. Pasak bendrovės, API kainos sumažėjo daugiau nei 50 % su neatidėliotinu įsigaliojimuir prieigą Dabar tai pasiekiama jūsų programėlėje, žiniatinklyje ir per API, be to, kad siūloma tokiu formatu atvirojo kodo kūrimo platformose, tokiose kaip Apsikabinęs veidas.
Techninės naujovės: išsklaidytas dėmesys ir ilgas kontekstas

Šio atnaujinimo esmė yra ta, „DeepSeek“ retas dėmesys (DSA), mechanizmas, kuris teikia pirmenybę svarbioms konteksto dalims, kad jas būtų galima tiksliau apdoroti. Bendrovė išsamiai aprašo a naudojimą Žaibo indeksavimo priemonė kuris atrenka pagrindinius fragmentus ir procesą, kurio metu „smulkiagrūdis žetonų pasirinkimas“, siekiant aprėpti didelius kontekstinius langus ir vienu metu apdoroti kelias minčių eilutes, naudojant mažiau informacijos.
Šis požiūris siekia patobulinimai tiek mokymo, tiek išvadų srityje, pagreitindamas laiką ir sumažindamas atminties sunaudojimą. „DeepSeek“ nurodo, kad naujausios versijos jau remti 8-ąją bendrąją programą ir dirbama ties suderinamumu su BF16, skaičių formatai, kurie padeda subalansuoti greitį ir tikslumą ir palengvina vykdymas vietinėje aparatinėje įrangoje.
Bendrovė pabrėžia, kad tai yra paleidimas, t. y. bandymų poligonas kuri numato naujos kartos architektūrą. Vis dėlto, jos vidinius testus Jie atkreipia dėmesį, kad V3.2-Exp (eksperimentinė versija) atlieka tokias užduotis kaip V3.1-Terminus lygio funkcijas tokiose srityse kaip paieškos agentai, kodavimas ar matematika, o papildomai pasižymi efektyvumu ilgalaikėse situacijose.
Be techninės dalies, prieinamumas yra platus: modelį galima išbandyti programa, žiniatinklis ir API įmonės. The kainos sumažinimas (daugiau nei 50 %) siekia paspartinti produktų komandų ir inžinerijos skyrių, siekiančių sumažinti veiklos sąnaudas, diegimą.
Bendruomenės fronte atidarymas Apkabinantis veidas ir „GitHub“ Tai leidžia tyrėjams ir kūrėjams atlikti auditą, pakartotinai naudoti ir siūlyti patobulinimus, taip stiprinant „DeepSeek“ profilį ekosistemoje. atvirojo kodo AI.
Rinkos poveikis ir geopolitinis pulsas

Nors nesitikima, kad šis žingsnis supurtys rinkas taip, kaip supurtė R1 ir V3 metų pradžioje V3.2-Exp gali daryti spaudimą vietiniams konkurentams, tokiems kaip Qwen (Alibaba) ir Amerikos konkurentai, tokie kaip OpenAI, Antropinis arba xAI. Svarbiausia bus parodyti didelis našumas už mažesnę kainą, ypač jautrus veiksnys diegiant didelius dirbtinio intelekto projektus.
Paleidimas vyksta sudėtingoje aplinkoje: kelios šalys apribojo naudojimą „DeepSeek“ vyriausybinėse agentūrose (įskaitant Italiją, Jungtines Valstijas ir Korėja del Sur), nurodydama saugumo problemas. Šie apribojimai verčia bendrovę sustiprinti savo valdymas ir garantijos jei norite įgyti institucinį žinomumą.
Pramonės sektoriuje Kinija spaudžia savo technologijų įmones mažinti priklausomybę nuo užsienio puslaidininkių. JAV kontroliuoja „Nvidia“ lustų eksportą (pvz., Blackwell) ir papildomi apribojimai, pavyzdžiui, RTX Pro 6000„DeepSeek“ teigia bendradarbiaujanti su Kinijos lustų gamintojais, siekdama optimizuoti savo veiklą. vykdymas vietinėje aparatinėje įrangojeŠiuo klausimu sektorius išreiškė paramą. "Huawei" iki naujausio modelio atnaujinimo.
Jei modeliui pavyksta išlaikyti savo našumą su perpus mažesnėmis eksploatavimo sąnaudomis, naudojimo atvejai su ilgais dokumentais, ilgi pokalbiai ar sudėtingos analitinės užduotys galėtų būti ypač naudingos. Daugeliui įmonių šis derinys efektyvumas + kaina Tai taip pat lemiama, kaip ir keli papildomi taškai lyginamuosiuose testuose.
„DeepSeek“ metodas sujungia atvirumą, efektyvumą ir tiesioginį prieinamumą su veiksmų planu, kuris žada galingesnę architektūrą. Jei įmonė įtvirtins sąnaudų mažinimą, išlaikydama V3.1-Terminus demonstruotą lygį, Naujasis modelis galėtų tapti praktiniu generatyvinio dirbtinio intelekto diegimo dideliu mastu etalonu be staigių išlaidų.Pamatysime, ar „DeepSeek“ gali paversti efektyvumą nebe techniniu siekiu, o realiu konkurenciniu pranašumu įmonėms ir kūrėjams.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.