DeepSeekek gasa jotzen du: kostu txikiagoa, testuinguru gehiago eta OpenAIren aurkari deserosoa

Azken eguneratzea: 02/10/2025

  • DeepSeek-V3.2-Exp kaleratu da, hurrengo arkitekturarako tarteko urratsa
  • DeepSeek Sparse Arreta mekanismo berria testuinguru luzeetarako eta kalkulu gutxiagorako
  • Aplikazioan, webgunean eta APIan eskuragarri, % 50 baino gehiagoko prezio-murrizketarekin.
  • Lehiakortasun-presioa eta txipa txipen egokitzapena, FP8ren laguntzarekin eta BF16an egindako lanarekin
DeepSeek V3.2-Exp

Eraikia V3.1-Terminus, eredu berria DeepSeek V3.2-Exp arreta sakabanatuaren ikuspegia aurkezten du kalitatea galdu gabe konputazio-karga murriztea bilatzen duena. Enpresaren arabera, APIen prezioak %50 baino gehiago jaitsi dira berehalako eraginarekin, eta sarbidea Orain zure aplikazioan, webgunean eta APIaren bidez eskuragarri dago, formatuan eskaintzeaz gain kode irekikoa bezalako garapen plataformetan Besarkatzen Aurpegia.

Berrikuntza teknikoak: arreta sakabanatua eta testuinguru luzea

Arreta urriaren teknologia IA ereduetan

Eguneratze honen muina da DeepSeek Arreta Urria (DSA), testuinguruaren atal garrantzitsuak lehenesten dituen mekanismo bat, zehatzago prozesatzeko. Enpresak honen erabilera zehazten du Tximista indexatzailea gako zatiak eta prozesu bat hautatzen dituena "token hautaketa zehatza", testuinguru-leiho handiak estaltzeko eta pentsamendu-lerro anitz aldi berean kudeatzeko helburuarekin, informazio-gainkarga gutxiagorekin.

Eduki esklusiboa - Egin klik hemen  Metak superinteligentziaren lasterketa bultzatzen du Superinteligentzia Laborategiak sortuz.

Ikuspegi honek jarraitzen du hobekuntzak bai prestakuntzan bai inferentzian, denborak bizkortuz eta memoria-kontsumoa murriztuz. DeepSeek-ek adierazten du bere azken bertsioak dagoeneko FP8ri laguntza eta bateragarritasunean lanean ari dira BF16, abiadura eta zehaztasuna orekatzen laguntzen duten zenbaki-formatuak, eta errazten dutenak exekuzioa tokiko hardwarean.

Konpainiak azpimarratzen du hau abiarazte bat dela, hau da, probalekuan hurrengo belaunaldiko arkitektura aurreikusten duena. Hala ere, bere barne probak Adierazi dutenez, V3.2-Exp-ek (bertsio esperimentala) V3.1-Terminus-en mailan funtzionatzen du bilaketa-agenteetan, kodeketan edo matematikan, eta, gainera, testuinguru luzeko egoeretan eraginkortasunaren abantaila du.

Alderdi teknikoaz gain, eskuragarritasuna zabala da: modeloa probatu daiteke aplikazioa, weba eta APIa enpresaren. -(e)n prezioa murriztea (% 50 baino gehiago) produktu-taldeek eta ingeniaritza-sailek funtzionamendu-kostuak murriztu nahi dituztenek adopzioa bizkortzea du helburu.

Eduki esklusiboa - Egin klik hemen  DeepSeek R2 apirilean kaleratu liteke eta AIren mugarri berri bat markatu

Komunitatearen arloan, irekiera Aurpegi Besarkatzailea eta GitHub Ikertzaileei eta garatzaileei auditoriak egiteko, berrerabiltzeko eta hobekuntzak proposatzeko aukera ematen die, DeepSeek-en profila ekosisteman indartuz. kode irekiko AI.

Merkatuaren eragina eta pultsu geopolitikoa

IA ekosistema eta modeloen lehia

Nahiz eta urrats honek ez duen merkatuak astindu nahi izan, gertatu zen bezala R1 eta V3 urte hasieran, V3.2-Exp-ek presioa egin diezaieke etxeko arerioei, hala nola Qwen (Alibaba) eta amerikar lehiakideak, hala nola OpenAI, Antropikoa edo xAI. Gakoa erakustea izango da errendimendu handia kostu txikiagoan, faktore bereziki sentikorra IA hedapen handietarako.

Abiaraztea ingurune konplexu batean dator: hainbat herrialdek erabilera mugatu dute DeepSeek gobernu agentzietan (Italia, Estatu Batuak eta beste batzuk barne) Hego Korea), segurtasun kezkak aipatuz. Murrizketa hauek enpresa indartzera behartzen dute gobernantza eta bermeak presentzia instituzionala lortu nahi baduzu.

Industria sektorean, Txinak bere teknologia-enpresak bultzatu ditu atzerriko erdieroaleen mendekotasuna murrizteko. AEBetako Nvidia txipen esportazio kontrolak (Blackwell bezalakoak) eta murrizketa gehigarriak —adibidez, RTX Pro 6000—, DeepSeekek dio txipa fabrikatzaile txinatarrei laguntzen diela bere optimizaziorako exekuzioa tokiko hardwareanIldo honetan, sektoreak honako hauen babesa adierazi du: Huawei azken modeloaren eguneratzera.

Eduki esklusiboa - Egin klik hemen  Nazioarteko Espazio Estazioan harrapatuta dauden astronautak Lurrera itzuli dira bederatzi hilabeteren buruan

Modeloak bere errendimendua mantentzea lortzen badu funtzionamendu-kostuaren erdiarekin, dokumentu luzeekin erabilera kasuak, txat luzeek edo analisi-lan zorrotzek bereziki onuragarriak izan daitezke. Enpresa askorentzat, konbinazio hau eraginkortasuna + prezioa Erreferentzia-puntuetan puntu gehigarri batzuk bezain erabakigarria da.

DeepSeek-en ikuspegiak irekitasuna, eraginkortasuna eta berehalako erabilgarritasuna konbinatzen ditu arkitektura gaiago bat agintzen duen bide-orri batekin. Enpresak kostuen murrizketak sendotzen baditu V3.1-Terminus-ek erakutsitako maila mantenduz, Eredu berria erreferentzia praktiko bihur daiteke IA sortzailea eskala handian zabaltzeko, kostuak izugarri igo gabe.Ikusiko dugu ea DeepSeek-ek eraginkortasuna ez den gehiago helburu tekniko bat, baizik eta enpresentzat eta garatzaileentzat benetako abantaila lehiakor bat bihurtu dezakeen.

Deepseek VS kodean
Lotutako artikulua:
Nola erabili DeepSeek Visual Studio Code-n