A DeepSeek gázt üt: alacsonyabb költség, több kontextus és egy kínos rivális az OpenAI számára

Utolsó frissítés: 02/10/2025

  • Megjelent a DeepSeek-V3.2-Exp, egy köztes lépés a következő architektúra felé
  • Új DeepSeek Sparse Attention mechanizmus hosszú kontextusokhoz és alacsonyabb számítási teljesítményhez
  • Elérhető az alkalmazásban, a weben és az API-n, több mint 50%-os árcsökkentéssel.
  • Versenynyomás és alkalmazkodás a kínai chipekhez, az FP8 támogatásával és a BF16-on végzett munkával
DeepSeek V3.2-Expert

Épült V3.1-Terminus, az új modell DeepSeek V3.2-Expert bevezet egy szétszórt figyelem megközelítést amely a számítási terhelés csökkentésére törekszik a minőség feláldozása nélkül. A vállalat szerint Az API-árak több mint 50%-kal csökkentek azonnali hatállyalés hozzáférés Mostantól elérhető az alkalmazásodban, a weben és API-n keresztül, amellett, hogy a következő formátumban is elérhető nyílt forráskódú fejlesztőplatformokon, mint például Átölelő arc.

Technikai újítások: szétszórt figyelem és hosszú kontextus

Ritka figyelem technológia a mesterséges intelligencia modellekben

A frissítés lényege, hogy DeepSeek ritka figyelem (DSA), egy olyan mechanizmus, amely a kontextus releváns részeit rangsorolja a pontosabb feldolgozás érdekében. A vállalat részletezi egy Villámindexelő amely kiválasztja a kulcsfontosságú töredékeket és egy folyamatot „finomszemcsés tokenkiválasztás”, azzal a céllal, hogy nagy kontextuális ablakokat lefedjen, és egyszerre több gondolatmenetet kezeljen kevesebb információfelhasználással.

Exkluzív tartalom – Kattintson ide  Mik azok a Google Gemini bővítmények: Integráció más Google-szolgáltatásokkal

Ez a megközelítés a következőkre törekszik: fejlesztések mind a képzésben, mind a következtetésekben, felgyorsítva az időt és csökkentve a memóriafogyasztást. A DeepSeek azt jelzi, hogy a legújabb verziói már támogatja a 8. keretprogramot és dolgoznak a kompatibilitáson BF16, számformátumok, amelyek segítenek egyensúlyt teremteni a sebesség és a pontosság között, és megkönnyítik a végrehajtás helyi hardveren.

A cég hangsúlyozza, hogy ez egy bevezetés, azaz egy tesztelés amely a következő generációs architektúráját vetíti előre. Mégis, a belső tesztek Rámutatnak, hogy a V3.2-Exp (a kísérleti verzió) a V3.1-Terminus szintjén teljesít olyan feladatokban, mint a keresőügynökök, a kódolás vagy a matematika, azzal a további előnnyel, hogy hatékonyan használható hosszú kontextusú forgatókönyvekben.

A technikai részen túl a rendelkezésre állás széleskörű: a modell tesztelhető a app, a web és az API a vállalat. A árcsökkentés (több mint 50%) célja, hogy felgyorsítsa az alkalmazást a termékfejlesztő csapatok és a mérnöki osztályok körében, akik csökkenteni szeretnék az üzemeltetési költségeket.

Exkluzív tartalom – Kattintson ide  Kína új ekranoplánt tesztel: a „tengeri szörnyeteg” visszatér a globális színpadra

Közösségi fronton a megnyitó Ölelő Arc és GitHub Lehetővé teszi a kutatók és fejlesztők számára az auditálást, az újrafelhasználást és a fejlesztési javaslatok benyújtását, erősítve a DeepSeek profilját az ökoszisztémában. nyílt forráskódú AI.

Piaci hatás és geopolitikai impulzus

MI ökoszisztéma és modellverseny

Bár ez a lépés várhatóan nem fogja annyira felrázni a piacokat, mint korábban R1 és V3 az év elején, A V3.2-Exp nyomást gyakorolhat a hazai riválisokra, mint például Qwen (Alibaba) és az amerikai versenytársak, mint például OpenAI, Antropikus vagy xAI. A kulcs a demonstráció lesz nagy teljesítmény alacsonyabb áron, ami különösen érzékeny tényező a nagyszabású mesterséges intelligencia telepítések esetében.

A bevezetés összetett környezetben történik: több ország korlátozta a használatát DeepSeek kormányzati szerveknél (beleértve Olaszországot, az Egyesült Államokat és Dél-Korea), biztonsági aggályokra hivatkozva. Ezek a korlátozások arra kényszerítik a vállalatot, hogy megerősítse irányítás és garanciák ha intézményi jelenlétet szeretnél szerezni.

Az ipari szektorban Kína arra ösztönzi technológiai vállalatait, hogy csökkentsék a külföldi félvezetőktől való függőségüket. Az Nvidia chipek amerikai exportkorlátozásai (mint például Blackwell) és további korlátozások – például a RTX Pro 6000— A DeepSeek azt állítja, hogy kínai chipgyártókkal működik együtt optimalizálása érdekében végrehajtás helyi hardverenEbben a sorban az ágazat a következők támogatását jelezte: Huawei a legújabb modellfrissítéshez.

Exkluzív tartalom – Kattintson ide  Hogyan tudhatom meg az IQ-mat a tontométerrel?

Ha a modellnek sikerül fenntartania a teljesítményét a működési költségek felénél alacsonyabb áron, hosszú dokumentumokkal kapcsolatos esetek, hosszú beszélgetések vagy igényes analitikai feladatok különösen előnyösek lehetnek. Sok vállalat számára ez a kombináció hatékonyság + ár Olyan döntő fontosságú, mint néhány plusz pont a benchmarkokban.

A DeepSeek megközelítése a nyitottságot, a hatékonyságot és az azonnali rendelkezésre állást ötvözi egy olyan ütemtervvel, amely egy hatékonyabb architektúrát ígér. Ha a vállalat megszilárdítja a költségcsökkentéseket, miközben fenntartja a V3.1-Terminus által bemutatott szintet, Az új modell gyakorlati mércévé válhat a generatív mesterséges intelligencia nagymértékű bevezetéséhez anélkül, hogy az költségek az egekbe szöknének.Majd meglátjuk, hogy a DeepSeek képes lesz-e a hatékonyságot már nem technikai törekvéssé, hanem valódi versenyelőnnyé tenni a vállalatok és a fejlesztők számára.

Deepseek a VS Code-ban
Kapcsolódó cikk:
A DeepSeek használata a Visual Studio Code-ban