DeepSeek dodaje gas: niži troškovi, više konteksta i nezgodan konkurent za OpenAI

Zadnje ažuriranje: 02/10/2025

  • Objavljen DeepSeek-V3.2-Exp, međukorak prema sljedećoj arhitekturi
  • Novi DeepSeek mehanizam rijetke pažnje za duge kontekste i manje računanja
  • Dostupno u aplikaciji, webu i API-ju s popustom većim od 50%.
  • Konkurentski pritisak i prilagodba kineskim čipovima, uz podršku FP8 i rad na BF16
DeepSeek V3.2-Exp

Izgrađeno na V3.1-Terminal, novi model DeepSeek V3.2-Exp uvodi pristup raspršene pažnje koji nastoji smanjiti računalno opterećenje bez žrtvovanja kvalitete. Prema tvrtki, Cijene API-ja pale su za više od 50% s trenutnim učinkomi pristup Sada je dostupno u vašoj aplikaciji, na webu i putem API-ja, osim što se nudi u formatu open source na razvojnim platformama kao što su Zagrljeno lice.

Tehničke inovacije: raspršena pažnja i dugi kontekst

Tehnologija rijetke pažnje u AI modelima

Srž ovog ažuriranja je DeepSeek rijetka pažnja (DSA), mehanizam koji daje prioritet relevantnim dijelovima konteksta kako bi ih preciznije obradio. Tvrtka detaljno opisuje upotrebu Indeksator munja koji odabire ključne fragmente i proces „precizan odabir tokena“, s ciljem pokrivanja velikih kontekstualnih prozora i istovremenog rukovanja više tokova misli uz manje opterećenje informacijama.

Ekskluzivan sadržaj - Kliknite ovdje  Meta potiče utrku za superinteligencijom stvaranjem Superintelligence Labsa

Ovaj pristup teži poboljšanja i u obuci i u zaključivanju, ubrzavajući vrijeme i smanjujući potrošnju memorije. DeepSeek pokazuje da su njegove najnovije verzije već podrška FP8 i rade na kompatibilnosti s BF16, formate brojeva koji pomažu uravnotežiti brzinu i točnost te olakšavaju izvršavanje na lokalnom hardveru.

Tvrtka naglašava da se radi o lansiranju, tj. poligon što predviđa njegovu arhitekturu sljedeće generacije. Ipak, njegova interni testovi Ističu da V3.2-Exp (eksperimentalna verzija) radi na razini V3.1-Terminusa u zadacima poput agenata za pretraživanje, kodiranja ili matematike, uz dodatnu prednost učinkovitosti u scenarijima s dugim kontekstom.

Osim tehničkog dijela, dostupnost je široka: model se može testirati u aplikacija, web i API tvrtke. The smanjenje cijena (više od 50%) ima za cilj ubrzati usvajanje od strane proizvodnih timova i inženjerskih odjela koji žele smanjiti operativne troškove.

Ekskluzivan sadržaj - Kliknite ovdje  DeepSeek R2 bi mogao biti objavljen u travnju i označiti novu prekretnicu u AI

Na društvenom planu, otvaranje u Hugging Face i GitHub Omogućuje istraživačima i programerima reviziju, ponovnu upotrebu i predlaganje poboljšanja, jačajući DeepSeekov profil u ekosustavu. AI otvorenog koda.

Utjecaj na tržište i geopolitički puls

AI ekosustav i konkurencija modela

Iako se ne očekuje da će ovaj korak uzdrmati tržišta kao što je to učinio R1 i V3 na početku godine, V3.2-Exp može izvršiti pritisak na domaće rivale kao što su Qwen (Alibaba) i američki konkurenti kao što su OpenAI, Antropni ili xAI. Ključno će biti pokazati visoke performanse uz nižu cijenu, što je posebno osjetljiv faktor za velike implementacije umjetne inteligencije.

Lansiranje dolazi usred složenog okruženja: nekoliko zemalja je ograničilo upotrebu DeepSeek u vladinim agencijama (uključujući Italiju, Sjedinjene Američke Države i Južna Koreja), navodeći sigurnosne probleme. Ova ograničenja prisiljavaju tvrtku da ojača svoje upravljanje i jamstva ako želite steći institucionalnu prisutnost.

U industrijskom sektoru, Kina potiče svoje tehnološke tvrtke da smanje ovisnost o stranim poluvodičima. Američke kontrole izvoza Nvidia čipova (kao što je Blackwell) i dodatna ograničenja - na primjer, na RTX Pro 6000DeepSeek tvrdi da surađuje s kineskim proizvođačima čipova kako bi optimizirao svoje izvršavanje na lokalnom hardveruU tom smislu, sektor je naznačio podršku Huawei na najnovije ažuriranje modela.

Ekskluzivan sadržaj - Kliknite ovdje  Astronauti zarobljeni na Međunarodnoj svemirskoj stanici vraćaju se na Zemlju nakon devet mjeseci

Ako model uspije održati svoje performanse s upola manjim operativnim troškovima, slučajevi upotrebe s dugim dokumentima, dugi razgovori ili zahtjevni analitički zadaci mogli bi biti posebno korisni. Za mnoge tvrtke, kombinacija učinkovitost + cijena To je odlučujuće kao i nekoliko dodatnih bodova u referentnim vrijednostima.

DeepSeekov pristup kombinira otvorenost, učinkovitost i trenutnu dostupnost s planom koji obećava sposobniju arhitekturu. Ako tvrtka konsolidira smanjenje troškova uz održavanje razine koju je pokazao V3.1-Terminus, Novi model mogao bi postati praktična referentna vrijednost za primjenu generativne umjetne inteligencije u velikim razmjerima bez vrtoglavih troškova.Vidjet ćemo hoće li DeepSeek učinkovitost učiniti ne samo tehničkom težnjom, već stvarnom konkurentskom prednošću za tvrtke i developere.

Deepseek u VS kodu
Povezani članak:
Kako koristiti DeepSeek u Visual Studio Code