DeepSeek lööb gaasi: madalamad kulud, rohkem konteksti ja ebamugav konkurent OpenAI-le

Viimane uuendus: 02/10/2025

  • DeepSeek-V3.2-Exp avaldati, mis on vaheetapp järgmise arhitektuuri suunas
  • Uus DeepSeeki hõreda tähelepanu mehhanism pikkade kontekstide ja väiksema arvutusvõimsuse jaoks
  • Saadaval rakenduses, veebis ja API-s enam kui 50% hinnaga.
  • Konkurentsisurve ja kohanemine Hiina kiipidega, toetades FP8-d ja töötades BF16 kallal
DeepSeek V3.2-Expert

Ehitatud peale V3.1-Terminus, uus mudel DeepSeek V3.2-Expert tutvustab hajutatud tähelepanu lähenemisviisi mille eesmärk on vähendada arvutuskoormust kvaliteeti ohverdamata. Ettevõtte sõnul API hinnad langevad enam kui 50% kohese mõjugaja juurdepääs See on nüüd saadaval teie rakenduses, veebis ja API kaudulisaks sellele, et seda pakutakse ka järgmisel kujul: avatud lähtekoodiga arendusplatvormidel, näiteks Kallistav nägu.

Tehnilised uuendused: hajutatud tähelepanu ja pikk kontekst

Hõredat tähelepanu tehnoloogiat tehisintellekti mudelites

Selle uuenduse tuum on DeepSeek hõre tähelepanu (DSA), mehhanism, mis seab konteksti olulised osad tähtsuse järjekorda, et neid täpsemalt töödelda. Ettevõte kirjeldab üksikasjalikult a kasutamist Välguindekseerija mis valib võtmefragmendid ja protsessi „peeneteraline märkide valik”, eesmärgiga katta suuri kontekstiaknaid ja käsitleda korraga mitut mõtteliini väiksema infokuluga.

Eksklusiivne sisu – klõpsake siin  Meta hoogustab superintelligentsuse võidujooksu superintelligentsuse laborite loomisega

See lähenemisviis taotleb nii koolituse kui ka järelduste tegemise täiustused, kiirendades aega ja vähendades mälukasutust. DeepSeek näitab, et selle uusimad versioonid on juba olemas toetada kaheksandat raamprogrammi ja töötavad ühilduvuse nimel BF16, numbrivormingud, mis aitavad tasakaalustada kiirust ja täpsust ning muudavad käivitamine kohalikul riistvaral.

Ettevõte rõhutab, et tegemist on turuletoomisega, st. katsepolügoon mis eeldab oma järgmise põlvkonna arhitektuuri. Sellegipoolest on selle sisetestid Nad toovad välja, et V3.2-Exp (eksperimentaalne versioon) toimib otsinguagendi, kodeerimise või matemaatika puhul V3.1-Terminuse tasemel, millele lisandub efektiivsus pika kontekstiga stsenaariumides.

Lisaks tehnilisele osale on ka kättesaadavus lai: mudelit saab testida app, veeb ja API ettevõttest. See hinnaalandus (üle 50%) eesmärk on kiirendada tootemeeskondade ja inseneriosakondade poolt kasutuselevõttu, et vähendada tegevuskulusid.

Eksklusiivne sisu – klõpsake siin  DeepSeek R2 võidakse välja anda aprillis ja tähistab uut verstaposti AI-s

Kogukonnarindel avati Kallistav Nägu ja GitHub See võimaldab teadlastel ja arendajatel auditeerida, taaskasutada ja parandusi pakkuda, tugevdades DeepSeeki profiili ökosüsteemis. Avatud lähtekoodiga tehisintellekt.

Turu mõju ja geopoliitiline pulss

Tehisintellekti ökosüsteem ja mudelikonkurents

Kuigi see samm ei peaks turge nii palju raputama, nagu see juhtus R1 ja V3 aasta alguses V3.2-Exp võib avaldada survet kodumaistele konkurentidele, näiteks Qwen (Alibaba) ja Ameerika konkurendid, näiteks OpenAI, Antroopiline või xAI. Peamine on näidata kõrge jõudlus madalama hinnaga, mis on eriti tundlik tegur suurte tehisintellekti juurutuste puhul.

Käivitamine toimub keerulises keskkonnas: mitmed riigid on piiranud selle kasutamist DeepSeek valitsusasutustes (sealhulgas Itaalia, Ameerika Ühendriigid ja Lõuna-Korea), viidates turvakaalutlustele. Need piirangud sunnivad ettevõtet oma juhtimine ja tagatised kui soovite saavutada institutsionaalset kohalolekut.

Tööstussektoris survestab Hiina oma tehnoloogiaettevõtteid vähendama sõltuvust välismaistest pooljuhtidest. USA ekspordikontroll Nvidia kiipidele (näiteks Blackwell) ja täiendavad piirangud – näiteks RTX Pro 6000— DeepSeek väidab, et teeb oma optimeerimiseks koostööd Hiina kiibitootjatega käivitamine kohalikul riistvaralSelles reas on sektor avaldanud toetust Huawei uusima mudelivärskenduseni.

Eksklusiivne sisu – klõpsake siin  Rahvusvahelises kosmosejaamas lõksus olevad astronaudid naasevad üheksa kuu pärast Maale

Kui mudelil õnnestub säilitada oma jõudlus poole väiksemate tegevuskuludega, pikkade dokumentidega seotud kasutusjuhud, pikad vestlused või nõudlikud analüütilised ülesanded võivad eriti kasulikud olla. Paljude ettevõtete jaoks on see kombinatsioon efektiivsus + hind See on sama määrav kui paar lisapunkti võrdlusalustes.

DeepSeeki lähenemisviis ühendab avatuse, tõhususe ja kohese kättesaadavuse tegevuskavaga, mis lubab võimekamat arhitektuuri. Kui ettevõte konsolideerib kulude vähendamise, säilitades samal ajal V3.1-Terminuse näidatud taseme, Uus mudel võiks saada praktiliseks etaloniks generatiivse tehisintellekti ulatuslikuks juurutamiseks ilma hüppeliselt kasvavate kuludeta.Näeme, kas DeepSeek suudab muuta efektiivsuse enam mitte tehniliseks püüdluseks, vaid ettevõtete ja arendajate jaoks tõeliseks konkurentsieeliseks.

Deepseek VS-koodis
Seotud artikkel:
DeepSeeki kasutamine Visual Studio Code'is