DeepSeek gee gas: laer koste, meer konteks en 'n ongemaklike mededinger vir OpenAI

Laaste opdatering: 02/10/2025

  • DeepSeek-V3.2-Exp vrygestel, 'n tussenstap in die rigting van sy volgende argitektuur
  • Nuwe DeepSeek Sparse Attention-meganisme vir lang kontekste en laer berekening
  • Beskikbaar op die toepassing, web en API met 'n prysverlaging van meer as 50%.
  • Mededingende druk en aanpassing aan Chinese skyfies, met FP8-ondersteuning en werk aan BF16
DeepSeek V3.2-Exp

Gebou op V3.1-Eindpunt, die nuwe model DeepSeek V3.2-Exp stel 'n verspreide aandagbenadering bekend wat poog om die rekenaarlas te verminder sonder om kwaliteit in te boet. Volgens die maatskappy, API-pryse daal met meer as 50% met onmiddellike effek, en toegang Dit is nou beskikbaar in jou toepassing, die web en via API, benewens dat dit aangebied word in die formaat van oopbron op ontwikkelingsplatforms soos Drukkende gesig.

Tegniese innovasies: verspreide aandag en lang konteks

Yllike aandagtegnologie in KI-modelle

Die kern van hierdie opdatering is DeepSeek Yllike Aandag (DSA), 'n meganisme wat relevante dele van die konteks prioritiseer om hulle meer akkuraat te verwerk. Die maatskappy gee besonderhede oor die gebruik van 'n Weerligindekseerder wat sleutelfragmente en 'n proses van kies "fynkorrelige tekenseleksie", met die doel om groot konteksvensters te dek en verskeie denkrigtings gelyktydig te hanteer met minder inligtingsoorhoofse koste.

Eksklusiewe inhoud - Klik hier  Hoe skep jy 'n inkopielys of doenlys met Alexa?

Hierdie benadering streef na verbeterings in beide opleiding en inferensie, wat tye versnel en geheueverbruik verminder. DeepSeek dui aan dat sy mees onlangse weergawes reeds ondersteun FP8 en werk aan versoenbaarheid met BF16, getalformate wat help om spoed en akkuraatheid te balanseer, en wat dit makliker maak om uitvoering op plaaslike hardeware.

Die maatskappy beklemtoon dat dit 'n bekendstelling is, dit wil sê 'n toetsveld wat sy volgende generasie argitektuur antisipeer. Tog, sy interne toetse Hulle wys daarop dat V3.2-Exp (die eksperimentele weergawe) op die vlak van V3.1-Terminus presteer in take soos soekagente, kodering of wiskunde, met die bykomende voordeel van doeltreffendheid in langkonteks scenario's.

Benewens die tegniese deel, is beskikbaarheid wyd: die model kan getoets word in die artikels, die web en die API van die maatskappy. Die prysverlaging (meer as 50%) is daarop gemik om die aanvaarding deur produkspanne en ingenieursafdelings te versnel wat bedryfskoste wil verminder.

Eksklusiewe inhoud - Klik hier  Hoe om Super Alexa te aktiveer

Op die gemeenskapsfront, die opening in Drukkende Gesig en GitHub Dit stel navorsers en ontwikkelaars in staat om te oudit, hergebruik en verbeterings voor te stel, wat DeepSeek se profiel in die ekosisteem versterk. oopbron AI.

Markimpak en geopolitieke pols

KI-ekosisteem en modelkompetisie

Alhoewel hierdie stap na verwagting nie die markte sal skud soos dit wel gedoen het nie R1 en V3 aan die begin van die jaar, V3.2-Exp kan druk plaas op plaaslike mededingers soos Qwen (Alibaba) en Amerikaanse mededingers soos OpenAI, Antropies of xAI. Die sleutel sal wees om te demonstreer hoë werkverrigting teen laer koste, 'n besonder sensitiewe faktor vir groot KI-ontplooiings.

Die bekendstelling kom te midde van 'n komplekse omgewing: verskeie lande het die gebruik van beperk DeepSeek in regeringsagentskappe (insluitend Italië, die Verenigde State en Suid-Korea), met verwysing na sekuriteitskwessies. Hierdie beperkings dwing die maatskappy om sy bestuur en waarborge as jy institusionele teenwoordigheid wil verkry.

In die industriële sektor druk China sy tegnologiemaatskappye om hul afhanklikheid van buitelandse halfgeleiers te verminder. VSA-uitvoerbeheer op Nvidia-skyfies (soos Blackwell) en bykomende beperkings—byvoorbeeld, op RTX Pro 6000—, DeepSeek beweer dat hy met Chinese skyfievervaardigers sal saamwerk om sy uitvoering op plaaslike hardewareIn hierdie lyn het die sektor die steun aangedui van Huawei na die nuutste modelopdatering.

Eksklusiewe inhoud - Klik hier  Cloudflare maak 'n strategiese skuif, blokkeer KI-spoorsnyers en stel 'n nuwe manier bekend om te hef vir toegang tot webinhoud.

As die model daarin slaag om sy prestasie met die helfte van die bedryfskoste te handhaaf, gebruiksgevalle met lang dokumente, lang gesprekke of veeleisende analitiese take kan veral voordelig wees. Vir baie maatskappye is die kombinasie doeltreffendheid + prys Dit is so deurslaggewend soos 'n paar ekstra punte in maatstawwe.

DeepSeek se benadering kombineer openheid, doeltreffendheid en onmiddellike beskikbaarheid met 'n padkaart wat 'n meer bekwame argitektuur belowe. Indien die maatskappy die kostevermindering konsolideer terwyl die vlak wat deur V3.1-Terminus gedemonstreer word, gehandhaaf word, Die nuwe model kan 'n praktiese maatstaf word vir die ontplooiing van generatiewe KI op skaal sonder om kostes die hoogte in te skiet.Ons sal sien of DeepSeek doeltreffendheid nie meer 'n tegniese strewe kan maak nie, maar 'n werklike mededingende voordeel vir maatskappye en ontwikkelaars.

Deepseek in VS-kode
Verwante artikel:
Hoe om DeepSeek in Visual Studio Code te gebruik