DeepSeek gazê dide: lêçûnek kêmtir, kontekstek bêtir, û reqîbek nebaş ji bo OpenAI

Nûvekirina Dawîn: 02/10/2025

  • DeepSeek-V3.2-Exp hate berdan, gaveke navberî ber bi mîmariya wê ya din ve
  • Mekanîzmaya Nû ya DeepSeek Sparse Attention ji bo çarçoveyên dirêj û hesabkirina kêmtir
  • Li ser sepanê, webê, û API-yê bi daxistina bihayê ji %50 zêdetir peyda dibe.
  • Zexta reqabetê û adapteyî bi çîpên çînî re, bi piştgiriya FP8 û xebata li ser BF16
DeepSeek V3.2-Exp

Li ser hatiye avakirin V3.1-Termînus, modela nû DeepSeek V3.2-Exp rêbazek baldariya belavbûyî pêşkêş dike ku hewl dide barê komputerê kêm bike bêyî ku kalîteyê qurban bike. Li gorî pargîdaniyê, Bihayên API ji %50 zêdetir daketin bi bandora tavilê, û gihîştinê Ew niha di sepana we, webê û bi rêya API-yê de peyda dibe., ji bilî ku di forma pêşkêşkirî de ye çavkaniya vekirî li ser platformên pêşveçûnê yên wekî Rûyê Hugging.

Nûbûnên teknîkî: baldariya belavbûyî û çarçoveyek dirêj

Teknolojiya balkişandina kêm di modelên AI de

Dilê vê nûvekirinê ev e DeepSeek Kêm Baldarî (DSA), mekanîzmayek ku beşên têkildar ên çarçoveyê dide pêşiyê da ku wan bi awayekî rasttir pêvajo bike. Şîrket karanîna Îndeksera birûskê ku perçeyên sereke û pêvajoyek hildibijêre "Hilbijartina nîşanekan a hûr", bi armanca nixumandina paceyên kontekstê yên mezin û bi kêmkirina barê agahdariyê, birêvebirina gelek rêzikên ramanan di heman demê de.

Naveroka taybetî - Li vir bikirtînin  Meta bi afirandina Laboratuarên Superintelligence re pêşbirka ji bo superintelligence zêde dike.

Ev rêbaz li pey başbûnên di perwerde û texmînkirinê de, dem zûtir dike û xerckirina bîrê kêm dike. DeepSeek nîşan dide ku guhertoyên wê yên herî dawî jixwe piştgiriya FP8 û li ser lihevhatina bi BF16, formatên hejmaran ku alîkariya hevsengkirina leza û rastbûnê dikin, û ku hêsantir dikin ku bicîhanîn li ser alavên herêmî.

Şîrket tekez dike ku ev destpêkirinek e, ango erdê ceribandinê ku pêşbîniya mîmariya nifşê wê yê pêşerojê dike. Dîsa jî, wê testên navxweyî Ew destnîşan dikin ku V3.2-Exp (guhertoya ceribandinî) di karên wekî ajanên lêgerînê, kodkirin an matematîkê de di asta V3.1-Terminus de dixebite, digel feydeya zêdekirî ya karîgeriyê di senaryoyên çarçoveya dirêj de.

Ji bilî beşa teknîkî, berdestbûn fireh e: model dikare di ... de were ceribandin. app, web û API ya şîrketê. Ew kêmkirina bihayê (ji %50 zêdetir) armanc dike ku pejirandina ji hêla tîmên hilberê û beşên endezyariyê ve bileztir bike ku dixwazin lêçûnên xebitandinê kêm bikin.

Naveroka taybetî - Li vir bikirtînin  DeepSeek R2 dikare di Nîsanê de were berdan û di AI-ê de qonaxek nû nîşan bide

Li ser eniya civakê, vekirina Rûyê Hembêzkirinê û GitHub Ew rê dide lêkolîner û pêşdebiran ku başkirinan kontrol bikin, ji nû ve bikar bînin û pêşniyar bikin, profîla DeepSeek di ekosîstemê de xurt dike. çavkaniya vekirî AI.

Bandora li ser bazarê û lêdana jeopolîtîk

Ekosîstema AI û pêşbaziya modelan

Her çend ev gav nayê çaverêkirin ku bazarên wekî ku kir bihejîne R1 û V3 di destpêka salê de, V3.2-Exp dikare zextê li ser reqîbên navxweyî yên wekî Qwen (Alîbaba) û reqîbên Amerîkî yên wekî OpenAI, Antropîk an xAI. Kilît dê nîşandan be performansa bilind bi lêçûnek kêmtir, faktorek bi taybetî hesas ji bo bicihkirinên mezin ên AI.

Ev destpêkirin di nava hawîrdorek aloz de tê: çend welatan karanîna sînordar kirine. DeepSeek di dezgehên hikûmetê de (di nav de Îtalya, Dewletên Yekbûyî yên Amerîkayê û Koreya Başûrê), bi hinceta fikarên ewlehiyê. Ev sînorkirin şîrketê neçar dikin ku karûbarên xwe xurt bike rêveberî û garantî heke hûn dixwazin hebûnek sazûmanî bi dest bixin.

Di sektora pîşesaziyê de, Çîn şîrketên xwe yên teknolojiyê zext dike ku girêdayîbûna xwe ya bi nîvconductorên biyanî kêm bikin. Kontrolên hinardekirina çîpên Nvidia yên Amerîkayê (wek Blackwell) û sînorkirinên din - mînakî, li ser RTX Pro 6000—, DeepSeek îdîa dike ku bi çêkerên çîpên Çînî re hevkariyê dike da ku xwe baştir bike bicîhanîn li ser alavên herêmîDi vê xetê de, sektorê piştgiriya xwe ji Huawei ji bo guhertoya herî dawî ya modela.

Naveroka taybetî - Li vir bikirtînin  Astronotên ku li Îstasyona Fezayê ya Navneteweyî asê mane, piştî neh mehan vedigerin dinyayê

Eger model bi nîvê lêçûna xebitandinê karibe performansa xwe bidomîne, rewşên bi belgeyên dirêj bikar bînin, sohbetên dirêj, an jî karên analîtîk ên dijwar dikarin bi taybetî sûdmend bin. Ji bo gelek şîrketan, ev têkel karîgerî + biha Ew bi qasî çend xalên zêde di pîvanan de biryardar e.

Nêzîkatiya DeepSeek vekirîbûn, karîgerî û hebûna tavilê bi nexşerêyekê re dike yek ku soza mîmariyeke jêhatîtir dide. Ger şirket kêmkirina lêçûnan yek bike di heman demê de asta ku ji hêla V3.1-Terminus ve hatî nîşandan biparêze, Modela nû dikare bibe pîvanek pratîkî ji bo bicihkirina AI-ya hilberîner di pîvanek bilind de bêyî lêçûnên zêde.Em ê bibînin ka DeepSeek dikare karîgeriyê êdî ne armancek teknîkî be, lê ji bo pargîdanî û pêşdebiran bike avantajek reqabetê ya rastîn.

Di VS Code de Deepseek
Gotara peywendîdar:
Meriv çawa di Koda Visual Studio de DeepSeek bikar tîne