DeepSeek V3.2-Tap: Szétszóródott figyelem és csökkenő árak

Megjelent a DeepSeek-V3.2-Exp, egy köztes lépés a következő architektúra felé
Új DeepSeek Sparse Attention mechanizmus hosszú kontextusokhoz és alacsonyabb számítási teljesítményhez
Elérhető az alkalmazásban, a weben és az API-n, több mint 50%-os árcsökkentéssel.
Versenynyomás és alkalmazkodás a kínai chipekhez, az FP8 támogatásával és a BF16-on végzett munkával

Épült V3.1-Terminus, az új modell DeepSeek V3.2-Expert bevezet egy szétszórt figyelem megközelítést amely a számítási terhelés csökkentésére törekszik a minőség feláldozása nélkül. A vállalat szerint Az API-árak több mint 50%-kal csökkentek azonnali hatállyalés hozzáférés Mostantól elérhető az alkalmazásodban, a weben és API-n keresztül, amellett, hogy a következő formátumban is elérhető nyílt forráskódú fejlesztőplatformokon, mint például Ölelő arc.

Technikai újítások: szétszórt figyelem és hosszú kontextus

Ritka figyelem technológia a mesterséges intelligencia modellekben

A frissítés lényege, hogy DeepSeek ritka figyelem (DSA), egy olyan mechanizmus, amely a kontextus releváns részeit rangsorolja a pontosabb feldolgozás érdekében. A vállalat részletezi egy Villámindexelő amely kiválasztja a kulcsfontosságú töredékeket és egy folyamatot „finomszemcsés tokenkiválasztás”, azzal a céllal, hogy nagy kontextuális ablakokat lefedjen, és egyszerre több gondolatmenetet kezeljen kevesebb információfelhasználással.

Exkluzív tartalom – Kattintson ide Mik azok a TOPS

Ez a megközelítés a következőkre törekszik: fejlesztések mind a képzésben, mind a következtetésekben, felgyorsítva az időt és csökkentve a memóriafogyasztást. A DeepSeek azt jelzi, hogy a legújabb verziói már támogatja a 8. keretprogramot és dolgoznak a kompatibilitáson BF16, számformátumok, amelyek segítenek egyensúlyt teremteni a sebesség és a pontosság között, és megkönnyítik a végrehajtás helyi hardveren.

A cég hangsúlyozza, hogy ez egy bevezetés, azaz egy tesztelés amely a következő generációs architektúráját vetíti előre. Mégis, a belső tesztek Rámutatnak, hogy a V3.2-Exp (a kísérleti verzió) a V3.1-Terminus szintjén teljesít olyan feladatokban, mint a keresőügynökök, a kódolás vagy a matematika, azzal a további előnnyel, hogy hatékonyan használható hosszú kontextusú forgatókönyvekben.

A technikai részen túl a rendelkezésre állás széleskörű: a modell tesztelhető a alkalmazás, a web és az API a vállalat. A árcsökkentés (több mint 50%) célja, hogy felgyorsítsa az alkalmazást a termékfejlesztő csapatok és a mérnöki osztályok körében, akik csökkenteni szeretnék az üzemeltetési költségeket.

Exkluzív tartalom – Kattintson ide Az OpenAI forradalmasítja a ChatGPT-t egy autonóm ágenssel, amely összetett feladatokat hajt végre.

Közösségi fronton a megnyitó Ölelő Arc és GitHub Lehetővé teszi a kutatók és fejlesztők számára az auditálást, az újrafelhasználást és a fejlesztési javaslatok benyújtását, erősítve a DeepSeek profilját az ökoszisztémában. nyílt forráskódú AI.

Piaci hatás és geopolitikai impulzus

MI ökoszisztéma és modellverseny

Bár ez a lépés várhatóan nem fogja annyira felrázni a piacokat, mint korábban R1 és V3 az év elején, A V3.2-Exp nyomást gyakorolhat a hazai riválisokra, mint például Qwen (Alibaba) és az amerikai versenytársak, mint például Nyílt mesterséges intelligencia, Antropikus vagy xAI. A kulcs a demonstráció lesz nagy teljesítmény alacsonyabb áron, ami különösen érzékeny tényező a nagyszabású mesterséges intelligencia telepítések esetében.

A bevezetés összetett környezetben történik: több ország korlátozta a használatát DeepSeek kormányzati szerveknél (beleértve Olaszországot, az Egyesült Államokat és Dél-Korea), biztonsági aggályokra hivatkozva. Ezek a korlátozások arra kényszerítik a vállalatot, hogy megerősítse irányítás és garanciák ha intézményi jelenlétet szeretnél szerezni.

Az ipari szektorban Kína arra ösztönzi technológiai vállalatait, hogy csökkentsék a külföldi félvezetőktől való függőségüket. Az Nvidia chipek amerikai exportkorlátozásai (mint például Blackwell) és további korlátozások – például a RTX Pro 6000— A DeepSeek azt állítja, hogy kínai chipgyártókkal működik együtt optimalizálása érdekében végrehajtás helyi hardverenEbben a sorban az ágazat a következők támogatását jelezte: Huawei a legújabb modellfrissítéshez.

Exkluzív tartalom – Kattintson ide A Gemini Gems használata napi feladatai optimalizálásához: 4 fő funkció

Ha a modellnek sikerül fenntartania a teljesítményét a működési költségek felénél alacsonyabb áron, hosszú dokumentumokkal kapcsolatos esetek, hosszú beszélgetések vagy igényes analitikai feladatok különösen előnyösek lehetnek. Sok vállalat számára ez a kombináció hatékonyság + ár Olyan döntő fontosságú, mint néhány plusz pont a benchmarkokban.

A DeepSeek megközelítése a nyitottságot, a hatékonyságot és az azonnali rendelkezésre állást ötvözi egy olyan ütemtervvel, amely egy hatékonyabb architektúrát ígér. Ha a vállalat megszilárdítja a költségcsökkentéseket, miközben fenntartja a V3.1-Terminus által bemutatott szintet, Az új modell gyakorlati mércévé válhat a generatív mesterséges intelligencia nagymértékű bevezetéséhez anélkül, hogy az költségek az egekbe szöknének.Majd meglátjuk, hogy a DeepSeek képes lesz-e a hatékonyságot már nem technikai törekvéssé, hanem valódi versenyelőnnyé tenni a vállalatok és a fejlesztők számára.

Kapcsolódó cikk:

A DeepSeek használata a Visual Studio Code-ban

Alberto Navarro

Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.

Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.