- DeepSeek-V3.2-Exp avaldati, mis on vaheetapp järgmise arhitektuuri suunas
- Uus DeepSeeki hõreda tähelepanu mehhanism pikkade kontekstide ja väiksema arvutusvõimsuse jaoks
- Saadaval rakenduses, veebis ja API-s enam kui 50% hinnaga.
- Konkurentsisurve ja kohanemine Hiina kiipidega, toetades FP8-d ja töötades BF16 kallal
Ehitatud peale V3.1-Terminus, uus mudel DeepSeek V3.2-Expert tutvustab hajutatud tähelepanu lähenemisviisi mille eesmärk on vähendada arvutuskoormust kvaliteeti ohverdamata. Ettevõtte sõnul API hinnad langevad enam kui 50% kohese mõjugaja juurdepääs See on nüüd saadaval teie rakenduses, veebis ja API kaudulisaks sellele, et seda pakutakse ka järgmisel kujul: avatud lähtekoodiga arendusplatvormidel, näiteks Kallistav nägu.
Tehnilised uuendused: hajutatud tähelepanu ja pikk kontekst

Selle uuenduse tuum on DeepSeek hõre tähelepanu (DSA), mehhanism, mis seab konteksti olulised osad tähtsuse järjekorda, et neid täpsemalt töödelda. Ettevõte kirjeldab üksikasjalikult a kasutamist Välguindekseerija mis valib võtmefragmendid ja protsessi „peeneteraline märkide valik”, eesmärgiga katta suuri kontekstiaknaid ja käsitleda korraga mitut mõtteliini väiksema infokuluga.
See lähenemisviis taotleb nii koolituse kui ka järelduste tegemise täiustused, kiirendades aega ja vähendades mälukasutust. DeepSeek näitab, et selle uusimad versioonid on juba olemas toetada kaheksandat raamprogrammi ja töötavad ühilduvuse nimel BF16, numbrivormingud, mis aitavad tasakaalustada kiirust ja täpsust ning muudavad käivitamine kohalikul riistvaral.
Ettevõte rõhutab, et tegemist on turuletoomisega, st. katsepolügoon mis eeldab oma järgmise põlvkonna arhitektuuri. Sellegipoolest on selle sisetestid Nad toovad välja, et V3.2-Exp (eksperimentaalne versioon) toimib otsinguagendi, kodeerimise või matemaatika puhul V3.1-Terminuse tasemel, millele lisandub efektiivsus pika kontekstiga stsenaariumides.
Lisaks tehnilisele osale on ka kättesaadavus lai: mudelit saab testida app, veeb ja API ettevõttest. See hinnaalandus (üle 50%) eesmärk on kiirendada tootemeeskondade ja inseneriosakondade poolt kasutuselevõttu, et vähendada tegevuskulusid.
Kogukonnarindel avati Kallistav Nägu ja GitHub See võimaldab teadlastel ja arendajatel auditeerida, taaskasutada ja parandusi pakkuda, tugevdades DeepSeeki profiili ökosüsteemis. Avatud lähtekoodiga tehisintellekt.
Turu mõju ja geopoliitiline pulss

Kuigi see samm ei peaks turge nii palju raputama, nagu see juhtus R1 ja V3 aasta alguses V3.2-Exp võib avaldada survet kodumaistele konkurentidele, näiteks Qwen (Alibaba) ja Ameerika konkurendid, näiteks OpenAI, Antroopiline või xAI. Peamine on näidata kõrge jõudlus madalama hinnaga, mis on eriti tundlik tegur suurte tehisintellekti juurutuste puhul.
Käivitamine toimub keerulises keskkonnas: mitmed riigid on piiranud selle kasutamist DeepSeek valitsusasutustes (sealhulgas Itaalia, Ameerika Ühendriigid ja Lõuna-Korea), viidates turvakaalutlustele. Need piirangud sunnivad ettevõtet oma juhtimine ja tagatised kui soovite saavutada institutsionaalset kohalolekut.
Tööstussektoris survestab Hiina oma tehnoloogiaettevõtteid vähendama sõltuvust välismaistest pooljuhtidest. USA ekspordikontroll Nvidia kiipidele (näiteks Blackwell) ja täiendavad piirangud – näiteks RTX Pro 6000— DeepSeek väidab, et teeb oma optimeerimiseks koostööd Hiina kiibitootjatega käivitamine kohalikul riistvaralSelles reas on sektor avaldanud toetust Huawei uusima mudelivärskenduseni.
Kui mudelil õnnestub säilitada oma jõudlus poole väiksemate tegevuskuludega, pikkade dokumentidega seotud kasutusjuhud, pikad vestlused või nõudlikud analüütilised ülesanded võivad eriti kasulikud olla. Paljude ettevõtete jaoks on see kombinatsioon efektiivsus + hind See on sama määrav kui paar lisapunkti võrdlusalustes.
DeepSeeki lähenemisviis ühendab avatuse, tõhususe ja kohese kättesaadavuse tegevuskavaga, mis lubab võimekamat arhitektuuri. Kui ettevõte konsolideerib kulude vähendamise, säilitades samal ajal V3.1-Terminuse näidatud taseme, Uus mudel võiks saada praktiliseks etaloniks generatiivse tehisintellekti ulatuslikuks juurutamiseks ilma hüppeliselt kasvavate kuludeta.Näeme, kas DeepSeek suudab muuta efektiivsuse enam mitte tehniliseks püüdluseks, vaid ettevõtete ja arendajate jaoks tõeliseks konkurentsieeliseks.
Olen tehnoloogiahuviline, kes on muutnud oma "nohikese" huvidest elukutse. Olen veetnud üle 10 aasta oma elust tipptehnoloogiat kasutades ja puhtast uudishimust igasuguste programmide kallal nokitsenud. Nüüd olen spetsialiseerunud arvutitehnoloogiale ja videomängudele. Seda seetõttu, et rohkem kui 5 aastat olen kirjutanud erinevatele tehnoloogia ja videomängude veebisaitidele, luues artikleid, mille eesmärk on anda teile vajalikku teavet kõigile arusaadavas keeles.
Kui teil on küsimusi, siis minu teadmised ulatuvad kõigest, mis on seotud nii Windowsi operatsioonisüsteemiga kui ka Androidiga mobiiltelefonidele. Ja ma olen pühendunud teile, olen alati nõus kulutama paar minutit ja aitama teil lahendada kõik küsimused, mis teil selles Interneti-maailmas tekkida võivad.