DeepSeek akcelas: pli malalta kosto, pli da kunteksto, kaj mallerta rivalo por OpenAI

Lasta ĝisdatigo: 02/10/2025

  • DeepSeek-V3.2-Exp publikigita, meza paŝo al ĝia sekva arkitekturo
  • Nova mekanismo de DeepSeek Sparse Attention por longaj kuntekstoj kaj pli malalta komputado
  • Havebla en la aplikaĵo, reto kaj API kun prezmalaltigo de pli ol 50%.
  • Konkurenca premo kaj adaptiĝo al ĉinaj ĉipoj, kun subteno de FP8 kaj laboro pri BF16
DeepSeek V3.2-Exp

Konstruita sur V3.1-Finstacio, la nova modelo DeepSeek V3.2-Exp enkondukas disigitan atentan aliron kiu celas redukti la komputilan ŝarĝon sen oferi kvaliton. Laŭ la kompanio, API-prezoj malaltiĝas je pli ol 50% kun tuja efiko, kaj aliro Ĝi nun haveblas en via aplikaĵo, la reto kaj per API, krom esti ofertita en la formato de malferma fonto sur evoluigaj platformoj kiel ekzemple Ĉirkaŭbrakanta Vizaĝo.

Teknikaj novigoj: disa atento kaj longa kunteksto

Teknologio de malabunda atento en AI-modeloj

La kerno de ĉi tiu ĝisdatigo estas DeepSeek Malabunda Atento (DSA), mekanismo kiu prioritatigas koncernajn partojn de la kunteksto por prilabori ilin pli precize. La kompanio detaligas la uzon de Fulma indeksilo kiu selektas ŝlosilajn fragmentojn kaj procezon de "fajngrajna ĵetona selektado", kun la celo kovri grandajn kuntekstajn fenestrojn kaj pritrakti plurajn pensliniojn samtempe kun malpli da informa kosto.

Ekskluziva enhavo - Klaku Ĉi tie  Meta akcelas la vetkuron por superinteligenteco per la kreado de Superinteligentecaj Laboratorioj

Ĉi tiu aliro celas plibonigoj en kaj trejnado kaj inferenco, akcelante tempojn kaj reduktante memorkonsumon. DeepSeek indikas, ke ĝiaj plej novaj versioj jam subteno FP8 kaj laboras pri kongrueco kun BF16, nombroformatoj kiuj helpas ekvilibrigi rapidon kaj precizecon, kaj kiuj faciligas ekzekuto sur loka aparataro.

La kompanio emfazas, ke temas pri lanĉo, tio estas, testadkampo kiu antaŭvidas ĝian venontgeneracian arkitekturon. Tamen, ĝia internaj testoj Ili atentigas, ke V3.2-Exp (la eksperimenta versio) funkcias je la nivelo de V3.1-Terminus en taskoj kiel serĉiloj, kodado aŭ matematiko, kun la aldona avantaĝo de efikeco en longkuntekstaj scenaroj.

Aldone al la teknika parto, la havebleco estas vasta: la modelo povas esti testita en la app, la reto kaj la API de la kompanio. La prezmalaltigo (pli ol 50%) celas akceli adopton fare de produktaj teamoj kaj inĝenieraj fakoj, kiuj volas redukti funkciajn kostojn.

Ekskluziva enhavo - Klaku Ĉi tie  DeepSeek R2 povus esti liberigita en aprilo kaj marki novan mejloŝtonon en AI

Rilate al la komunumo, la malfermo en Brakuma Vizaĝo kaj GitHub Ĝi ebligas al esploristoj kaj programistoj kontroli, reuzi kaj proponi plibonigojn, plifortigante la profilon de DeepSeek en la ekosistemo. Malfermitkoda AI.

Merkata efiko kaj geopolitika pulso

AI-ekosistemo kaj modelkonkurenco

Kvankam oni ne atendas, ke ĉi tiu paŝo skuos la merkatojn kiel ĝi faris R1 kaj V3 komence de la jaro, V3.2-Exp povas meti premon sur hejmajn rivalojn kiel ekzemple Qwen (Alibaba) kaj usonaj konkurantoj kiel ekzemple OpenAI, Antropa aŭ xAI. La ŝlosilo estos montri alta efikeco je pli malalta kosto, aparte sentema faktoro por grandaj deplojoj de AI.

La lanĉo okazas meze de kompleksa medio: pluraj landoj limigis la uzon de DeepSeek en registaraj agentejoj (inkluzive de Italio, Usono kaj Sud-Koreio), citante sekurecajn zorgojn. Ĉi tiuj limigoj devigas la kompanion plifortigi sian regado kaj garantioj se vi volas akiri institucian ĉeeston.

En la industria sektoro, Ĉinio instigas siajn teknologiajn kompaniojn redukti sian dependecon de eksterlandaj duonkonduktaĵoj. Usonaj eksportkontroloj sur Nvidia-ĉipoj (kiel ekzemple Blackwell) kaj pliaj limigoj — ekzemple, pri RTX Pro 6000—, DeepSeek asertas kunlabori kun ĉinaj ĉipproduktantoj por optimumigi sian ekzekuto sur loka aparataroEn ĉi tiu linio, la sektoro indikis la subtenon de Huawei al la plej nova modelĝisdatigo.

Ekskluziva enhavo - Klaku Ĉi tie  Astronaŭtoj kaptitaj sur la Internacia Kosmostacio revenas al la Tero post naŭ monatoj

Se la modelo sukcesas subteni sian funkciadon kun duono de la funkciigaj kostoj, uzkazoj kun longaj dokumentoj, longaj konversacioj, aŭ postulemaj analizaj taskoj povus aparte profiti. Por multaj kompanioj, la kombinaĵo efikeco + prezo Ĝi estas tiel decida kiel kelkaj ekstraj poentoj en komparnormoj.

La aliro de DeepSeek kombinas malfermitecon, efikecon kaj tujan haveblecon kun vojmapo kiu promesas pli kapablan arkitekturon. Se la kompanio firmigos la kostreduktojn konservante la nivelon montritan de V3.1-Terminus, La nova modelo povus fariĝi praktika komparnormo por deploji generativan artefaritan inteligentecon je granda skalo sen rapide altiĝantaj kostoj.Ni vidos ĉu DeepSeek povos igi efikecon ne plu teknika aspiro, sed vera konkurenciva avantaĝo por kompanioj kaj programistoj.

Deepseek en VS Kodo
Rilata artikolo:
Kiel uzi DeepSeek en Visual Studio Code