DeepSeek accelerează: costuri mai mici, mai mult context și un rival incomod pentru OpenAI

Ultima actualizare: 02/10/2025

  • DeepSeek-V3.2-Exp lansat, un pas intermediar către următoarea sa arhitectură
  • Noul mecanism DeepSeek Sparse Attention pentru contexte lungi și un volum de calcul redus
  • Disponibil în aplicație, web și API cu o reducere de preț de peste 50%.
  • Presiune concurențială și adaptare la cipurile chinezești, cu suport pentru FP8 și lucrări la BF16
DeepSeek V3.2-Exp

Construit pe V3.1-Terminus, noul model DeepSeek V3.2-Exp introduce o abordare a atenției dispersate care urmărește reducerea sarcinii de calcul fără a sacrifica calitatea. Potrivit companiei, Prețurile API-urilor scad cu peste 50% cu efect imediatși acces Acum este disponibil în aplicația ta, pe web și prin API, pe lângă faptul că este oferit sub formă de open source pe platforme de dezvoltare precum Fata îmbrățișată.

Inovații tehnice: atenție dispersată și context lung

Tehnologia atenției dispersate în modelele de inteligență artificială

Esența acestei actualizări este Atenție redusă DeepSeek (DSA), un mecanism care prioritizează părțile relevante ale contextului pentru a le procesa mai precis. Compania detaliază utilizarea unui Indexator Lightning care selectează fragmente cheie și un proces de „selecție fină a jetoanelor”, cu scopul de a acoperi ferestre contextuale mari și de a gestiona mai multe linii de gândire simultan, cu mai puține informații suplimentare.

Conținut exclusiv - Faceți clic aici  Aproape unul din cinci jocuri noi de pe Steam folosește inteligență artificială generativă.

Această abordare urmărește îmbunătățiri atât în ​​antrenament, cât și în inferență, accelerând timpii și reducând consumul de memorie. DeepSeek indică faptul că cele mai recente versiuni ale sale deja sprijină FP8 și lucrează la compatibilitate cu BF16, formate numerice care ajută la echilibrarea vitezei și a preciziei și care facilitează execuție pe hardware local.

Compania subliniază că aceasta este o lansare, adică o teren de testare care anticipează arhitectura sa de generație următoare. Totuși, teste interne Aceștia subliniază faptul că V3.2-Exp (versiunea experimentală) are performanțe la nivelul V3.1-Terminus în sarcini precum agenți de căutare, codare sau matematică, cu avantajul suplimentar al eficienței în scenarii de context lung.

Pe lângă partea tehnică, disponibilitatea este largă: modelul poate fi testat în aplicaţia, web-ul și API-ul al companiei. Cel/Cea/Cei/Cele reducere de preț (peste 50%) își propune să accelereze adoptarea de către echipele de produs și departamentele de inginerie care doresc să reducă costurile de operare.

Conținut exclusiv - Faceți clic aici  Ce este Copilot și pentru ce este? Descoperiți cum vă crește productivitatea și codul

Pe plan comunitar, deschiderea în Hugging Face și GitHub Permite cercetătorilor și dezvoltatorilor să auditeze, să reutilizeze și să propună îmbunătățiri, consolidând profilul DeepSeek în ecosistem. AI cu sursă deschisă.

Impactul pe piață și pulsul geopolitic

Ecosistemul IA și competiția cu modelele

Deși nu se așteaptă ca această măsură să zguduie piețele așa cum a făcut-o R1 și V3 la începutul anului, V3.2-Exp poate pune presiune pe rivalii interni, cum ar fi Qwen (Alibaba) și concurenți americani precum OpenAI, Antropică sau xAI. Cheia va fi să demonstrăm performanță ridicată la un cost mai mic, un factor deosebit de sensibil pentru implementările mari de inteligență artificială.

Lansarea are loc într-un mediu complex: mai multe țări au limitat utilizarea DeepSeek în agențiile guvernamentale (inclusiv Italia, Statele Unite și Coreea de Sud), invocând preocupări legate de securitate. Aceste restricții obligă compania să își consolideze guvernanță și garanții dacă vrei să obții o prezență instituțională.

În sectorul industrial, China își face presiuni asupra companiilor de tehnologie pentru a-și reduce dependența de semiconductorii străini. Controalele exporturilor americane pentru cipurile Nvidia (cum ar fi Blackwell) și restricții suplimentare - de exemplu, privind RTX Pro 6000—, DeepSeek susține că colaborează cu producătorii chinezi de cipuri pentru a-și optimiza execuție pe hardware localÎn acest sens, sectorul a indicat sprijinul Huawei la cea mai recentă actualizare a modelului.

Conținut exclusiv - Faceți clic aici  Cum se folosește Comet, browserul inteligent care concurează cu Chrome și Gemini

Dacă modelul reușește să își mențină performanța cu jumătate din costul de operare, cazuri de utilizare cu documente lungi, discuțiile lungi sau sarcinile analitice solicitante ar putea fi deosebit de benefice. Pentru multe companii, combinația eficiență + preț Este la fel de decisiv ca câteva puncte suplimentare în repere.

Abordarea DeepSeek combină deschiderea, eficiența și disponibilitatea imediată cu o foaie de parcurs care promite o arhitectură mai capabilă. Dacă firma consolidează reducerile de costuri, menținând în același timp nivelul demonstrat de V3.1-Terminus, Noul model ar putea deveni un punct de referință practic pentru implementarea inteligenței artificiale generative la scară largă, fără costuri exorbitante.Vom vedea dacă DeepSeek poate face ca eficiența să nu mai fie o aspirație tehnică, ci un avantaj competitiv real pentru companii și dezvoltatori.

Deepseek în VS Code
Articol asociat:
Cum să utilizați DeepSeek în Visual Studio Code