Mae DeepSeek yn taro'r nwy: cost is, mwy o gyd-destun, a chystadleuydd lletchwith i OpenAI

Diweddariad diwethaf: 02/10/2025

  • DeepSeek-V3.2-Exp wedi'i ryddhau, cam canolradd tuag at ei bensaernïaeth nesaf
  • Mecanwaith Sylw Gwan DeepSeek newydd ar gyfer cyd-destunau hir a chyfrifiadura is
  • Ar gael ar yr ap, y we, a'r API gyda gostyngiad pris o fwy na 50%.
  • Pwysau cystadleuol ac addasu i sglodion Tsieineaidd, gyda chefnogaeth FP8 a gwaith ar BF16
DeepSeek V3.2-Expert

Wedi'i adeiladu ar V3.1-Terminws, y model newydd DeepSeek V3.2-Expert yn cyflwyno dull sylw gwasgaredig sy'n ceisio lleihau'r llwyth cyfrifiadurol heb aberthu ansawdd. Yn ôl y cwmni, Prisiau API yn gostwng mwy na 50% gydag effaith ar unwaith, a mynediad Mae bellach ar gael yn eich ap, y we a thrwy API, yn ogystal â chael ei gynnig ar ffurf ffynhonnell agored ar lwyfannau datblygu fel Wyneb Hugging.

Arloesiadau technegol: sylw gwasgaredig a chyd-destun hir

Technoleg sylw prin mewn modelau AI

Calon y diweddariad hwn yw Sylw Gwan DeepSeek (DSA), mecanwaith sy'n blaenoriaethu rhannau perthnasol o'r cyd-destun i'w prosesu'n fwy cywir. Mae'r cwmni'n manylu ar y defnydd o Mynegeydd mellt sy'n dewis darnau allweddol a phroses o “dewis tocynnau manwl iawn”, gyda'r nod o gwmpasu ffenestri cyd-destun mawr a thrin sawl llinell feddwl ar unwaith gyda llai o wybodaeth uwchben.

Cynnwys unigryw - Cliciwch Yma  Mae Meta yn rhoi hwb i'r ras am uwch-ddeallusrwydd gyda chreu Labordai Uwch-ddeallusrwydd

Mae'r dull hwn yn dilyn gwelliannau mewn hyfforddiant a chasgliadau, gan gyflymu amseroedd a lleihau'r defnydd o gof. Mae DeepSeek yn nodi bod ei fersiynau diweddaraf eisoes cefnogi FP8 ac yn gweithio ar gydnawsedd â BF16, fformatau rhif sy'n helpu i gydbwyso cyflymder a chywirdeb, ac sy'n ei gwneud hi'n haws i gweithredu ar galedwedd lleol.

Mae'r cwmni'n pwysleisio mai lansiad yw hwn, hynny yw, a profi tir sy'n rhagweld ei bensaernïaeth genhedlaeth nesaf. Eto i gyd, ei profion mewnol Maent yn tynnu sylw at y ffaith bod V3.2-Exp (y fersiwn arbrofol) yn perfformio ar lefel V3.1-Terminus mewn tasgau fel asiantau chwilio, codio neu fathemateg, gyda'r fantais ychwanegol o effeithlonrwydd mewn senarios cyd-destun hir.

Yn ogystal â'r rhan dechnegol, mae argaeledd yn eang: gellir profi'r model yn y app, y we a'r API y cwmni. Y gostyngiad mewn prisiau (mwy na 50%) yn anelu at gyflymu mabwysiadu gan dimau cynnyrch ac adrannau peirianneg sy'n ceisio lleihau costau gweithredu.

Cynnwys unigryw - Cliciwch Yma  Gellid rhyddhau DeepSeek R2 ym mis Ebrill a nodi carreg filltir newydd yn AI

Ar flaen y gymuned, yr agoriad yn Wyneb Cofleidio a GitHub Mae'n galluogi ymchwilwyr a datblygwyr i archwilio, ailddefnyddio a chynnig gwelliannau, gan gryfhau proffil DeepSeek yn yr ecosystem. ffynhonnell agored AI.

Effaith y farchnad a phwls geo-wleidyddol

Ecosystem AI a chystadleuaeth modelu

Er nad oes disgwyl i'r cam hwn ysgwyd y marchnadoedd fel y gwnaeth R1 a V3 ar ddechrau'r flwyddyn, Gall V3.2-Exp roi pwysau ar gystadleuwyr domestig fel Qwen (Alibaba) a chystadleuwyr Americanaidd fel OpenAI, Anthropig neu xAI. Yr allwedd fydd dangos perfformiad uchel am gost is, ffactor arbennig o sensitif ar gyfer defnyddiau AI mawr.

Daw'r lansiad yng nghanol amgylchedd cymhleth: mae sawl gwlad wedi cyfyngu ar y defnydd o DeepSeek mewn asiantaethau'r llywodraeth (gan gynnwys yr Eidal, yr Unol Daleithiau a De Korea), gan nodi pryderon diogelwch. Mae'r cyfyngiadau hyn yn gorfodi'r cwmni i gryfhau ei llywodraethu a gwarantau os ydych chi am ennill presenoldeb sefydliadol.

Yn y sector diwydiannol, mae Tsieina yn gwthio ei chwmnïau technoleg i leihau eu dibyniaeth ar led-ddargludyddion tramor. Rheolaethau allforio'r Unol Daleithiau ar sglodion Nvidia (fel Blackwell) a chyfyngiadau ychwanegol—er enghraifft, ar RTX Pro 6000—, Mae DeepSeek yn honni ei fod yn cydweithio â gwneuthurwyr sglodion Tsieineaidd i optimeiddio ei gweithredu ar galedwedd lleolYn y llinell hon, mae'r sector wedi dangos cefnogaeth i Huawei i'r diweddariad model diweddaraf.

Cynnwys unigryw - Cliciwch Yma  Mae gofodwyr sy'n gaeth ar yr Orsaf Ofod Ryngwladol yn dychwelyd i'r Ddaear ar ôl naw mis

Os yw'r model yn llwyddo i gynnal ei berfformiad gyda hanner y gost weithredu, achosion defnydd gyda dogfennau hir, sgyrsiau hir, neu dasgau dadansoddol heriol a allai fod o fudd arbennig. I lawer o gwmnïau, y cyfuniad effeithlonrwydd + pris Mae mor bendant â rhai pwyntiau ychwanegol mewn meincnodau.

Mae dull DeepSeek yn cyfuno agoredrwydd, effeithlonrwydd, ac argaeledd ar unwaith gyda chynllun sy'n addo pensaernïaeth fwy galluog. Os bydd y cwmni'n cydgrynhoi'r gostyngiadau costau wrth gynnal y lefel a ddangoswyd gan V3.1-Terminus, Gallai'r model newydd ddod yn feincnod ymarferol ar gyfer defnyddio deallusrwydd artiffisial cynhyrchiol ar raddfa fawr heb i gostau godi'n sydyn.Fe welwn ni a all DeepSeek wneud effeithlonrwydd nid yn ddyhead technegol mwyach, ond yn fantais gystadleuol wirioneddol i gwmnïau a datblygwyr.

Deepseek yn y Cod VS
Erthygl gysylltiedig:
Sut i ddefnyddio DeepSeek yn Visual Studio Code