- DeepSeek-V3.2-Exp vrygestel, 'n tussenstap in die rigting van sy volgende argitektuur
- Nuwe DeepSeek Sparse Attention-meganisme vir lang kontekste en laer berekening
- Beskikbaar op die toepassing, web en API met 'n prysverlaging van meer as 50%.
- Mededingende druk en aanpassing aan Chinese skyfies, met FP8-ondersteuning en werk aan BF16
Gebou op V3.1-Eindpunt, die nuwe model DeepSeek V3.2-Exp stel 'n verspreide aandagbenadering bekend wat poog om die rekenaarlas te verminder sonder om kwaliteit in te boet. Volgens die maatskappy, API-pryse daal met meer as 50% met onmiddellike effek, en toegang Dit is nou beskikbaar in jou toepassing, die web en via API, benewens dat dit aangebied word in die formaat van oopbron op ontwikkelingsplatforms soos Drukkende gesig.
Tegniese innovasies: verspreide aandag en lang konteks

Die kern van hierdie opdatering is DeepSeek Yllike Aandag (DSA), 'n meganisme wat relevante dele van die konteks prioritiseer om hulle meer akkuraat te verwerk. Die maatskappy gee besonderhede oor die gebruik van 'n Weerligindekseerder wat sleutelfragmente en 'n proses van kies "fynkorrelige tekenseleksie", met die doel om groot konteksvensters te dek en verskeie denkrigtings gelyktydig te hanteer met minder inligtingsoorhoofse koste.
Hierdie benadering streef na verbeterings in beide opleiding en inferensie, wat tye versnel en geheueverbruik verminder. DeepSeek dui aan dat sy mees onlangse weergawes reeds ondersteun FP8 en werk aan versoenbaarheid met BF16, getalformate wat help om spoed en akkuraatheid te balanseer, en wat dit makliker maak om uitvoering op plaaslike hardeware.
Die maatskappy beklemtoon dat dit 'n bekendstelling is, dit wil sê 'n toetsveld wat sy volgende generasie argitektuur antisipeer. Tog, sy interne toetse Hulle wys daarop dat V3.2-Exp (die eksperimentele weergawe) op die vlak van V3.1-Terminus presteer in take soos soekagente, kodering of wiskunde, met die bykomende voordeel van doeltreffendheid in langkonteks scenario's.
Benewens die tegniese deel, is beskikbaarheid wyd: die model kan getoets word in die artikels, die web en die API van die maatskappy. Die prysverlaging (meer as 50%) is daarop gemik om die aanvaarding deur produkspanne en ingenieursafdelings te versnel wat bedryfskoste wil verminder.
Op die gemeenskapsfront, die opening in Drukkende Gesig en GitHub Dit stel navorsers en ontwikkelaars in staat om te oudit, hergebruik en verbeterings voor te stel, wat DeepSeek se profiel in die ekosisteem versterk. oopbron AI.
Markimpak en geopolitieke pols

Alhoewel hierdie stap na verwagting nie die markte sal skud soos dit wel gedoen het nie R1 en V3 aan die begin van die jaar, V3.2-Exp kan druk plaas op plaaslike mededingers soos Qwen (Alibaba) en Amerikaanse mededingers soos OpenAI, Antropies of xAI. Die sleutel sal wees om te demonstreer hoë werkverrigting teen laer koste, 'n besonder sensitiewe faktor vir groot KI-ontplooiings.
Die bekendstelling kom te midde van 'n komplekse omgewing: verskeie lande het die gebruik van beperk DeepSeek in regeringsagentskappe (insluitend Italië, die Verenigde State en Suid-Korea), met verwysing na sekuriteitskwessies. Hierdie beperkings dwing die maatskappy om sy bestuur en waarborge as jy institusionele teenwoordigheid wil verkry.
In die industriële sektor druk China sy tegnologiemaatskappye om hul afhanklikheid van buitelandse halfgeleiers te verminder. VSA-uitvoerbeheer op Nvidia-skyfies (soos Blackwell) en bykomende beperkings—byvoorbeeld, op RTX Pro 6000—, DeepSeek beweer dat hy met Chinese skyfievervaardigers sal saamwerk om sy uitvoering op plaaslike hardewareIn hierdie lyn het die sektor die steun aangedui van Huawei na die nuutste modelopdatering.
As die model daarin slaag om sy prestasie met die helfte van die bedryfskoste te handhaaf, gebruiksgevalle met lang dokumente, lang gesprekke of veeleisende analitiese take kan veral voordelig wees. Vir baie maatskappye is die kombinasie doeltreffendheid + prys Dit is so deurslaggewend soos 'n paar ekstra punte in maatstawwe.
DeepSeek se benadering kombineer openheid, doeltreffendheid en onmiddellike beskikbaarheid met 'n padkaart wat 'n meer bekwame argitektuur belowe. Indien die maatskappy die kostevermindering konsolideer terwyl die vlak wat deur V3.1-Terminus gedemonstreer word, gehandhaaf word, Die nuwe model kan 'n praktiese maatstaf word vir die ontplooiing van generatiewe KI op skaal sonder om kostes die hoogte in te skiet.Ons sal sien of DeepSeek doeltreffendheid nie meer 'n tegniese strewe kan maak nie, maar 'n werklike mededingende voordeel vir maatskappye en ontwikkelaars.
Ek is 'n tegnologie-entoesias wat sy "geek"-belangstellings in 'n beroep verander het. Ek het meer as 10 jaar van my lewe bestee om die nuutste tegnologie te gebruik en uit pure nuuskierigheid met allerhande programme te peuter. Nou het ek gespesialiseer in rekenaartegnologie en videospeletjies. Dit is omdat ek al vir meer as 5 jaar vir verskeie webwerwe oor tegnologie en videospeletjies skryf en artikels skep wat poog om jou die inligting te gee wat jy nodig het in 'n taal wat vir almal verstaanbaar is.
As jy enige vrae het, strek my kennis van alles wat verband hou met die Windows-bedryfstelsel sowel as Android vir selfone. En my verbintenis is aan jou, ek is altyd bereid om 'n paar minute te spandeer en jou te help om enige vrae op te los wat jy in hierdie internetwêreld mag hê.