Hugging Face išleidžia atvirą DeepSeek-R1 modelio kloną

Paskutinis atnaujinimas: 2025-03-02

  • Hugging Face veikia Open-R1, atvirojo kodo DeepSeek-R1 klone.
  • Tikslas – pagerinti dirbtinio intelekto tyrimų skaidrumą ir atkuriamumą.
  • Projektu siekiama įveikti „juodosios dėžės“ modelių apribojimus.
  • Replikacijai bus naudojamas didelio našumo klasteris su 768 Nvidia H100 GPU.
DeepSeek-R1 atviras klonas

Hugging Face nusprendė priimti iššūkį atkartoti DeepSeek-R1 pažangų samprotavimo modelį, iniciatyva, kuri žada pakeisti dirbtinio intelekto įrankių kūrimo ir dalijimosi su pasauline bendruomene būdą. Šiuo projektu, pavadintu „Open-R1“, siekiama ne tik atkurti originalaus modelio galimybes, bet ir tai padaryti tam tikru būdu. skaidrus ir laikantis principų atvirojo kodo.

DeepSeek-R1 modelis, sukurtas Kinijos kompanijos, sukūrė didelių lūkesčių technologijų srityje dėl savo sustiprinimo mokymosi algoritmų sudėtingumo. Tačiau šis modelis turi keletą kliūčių skaidrumas, pavyzdžiui, atvirų duomenų ir informacijos apie jų mokymą trūkumas. Susidūrusi su tokia situacija, Hugging Face lažinasi dėl atviros alternatyvos, leidžiančios mokslininkams ir kūrėjams dirbti bendradarbiavimo aplinkoje.

Išskirtinis turinys – spustelėkite čia  Dirbtinis balsas ar žmogaus balsas: kada naudoti TTS (pvz., MAI-Voice-1) ir kada įrašyti save

Kas yra Open-R1 ir kaip planuojate jį plėtoti?

Apkabinimo veido projektas, skirtas „DeepSeek“ klonavimui

„Open-R1“ siekia būti funkcine „DeepSeek-R1“ kopija, bet su funkcijomis, kurios skatina bendradarbiavimo inovacijas ir atkuriamumą atliekant AI tyrimus. Pasak Leandro von Werra, Hugging Face tyrimų vadovo, tikslas yra įveikti „juodosios dėžės“ modelių keliamus iššūkius ir suteikti kitiems reikalingus įrankius savo tyrimams atlikti.

Komanda naudos Hugging Face Science Cluster, kuris turi savybių 768 Nvidia H100 GPU, kad būtų sukurti duomenų rinkiniai, kurie būtų kuo panašesni į tuos, kuriuos iš pradžių naudojo DeepSeek. Be to, jie kviečia pasaulinę bendruomenę dalyvauti kuriant projektą, pabrėždami, kad įvairios perspektyvos yra raktas į sudėtingų problemų sprendimą.

Požiūris į atvirumą ir skaidrumą

Apsikabinęs veidas Open-R1

Nors DeepSeek-R1 turi tam tikrų atviri elementai, kaip leistina licencija, Pagrindinės modelio detalės nėra visiškai prieinamos, todėl sunku replikuoti ir atlikti išsamų tyrimą. Inžinierius Elie Bakouch pabrėžė, kad atvirų duomenų rinkinių ir dokumentuotų eksperimentų trūkumas riboja mokslinių tyrimų bendruomenės galimybes tobulėti šioje srityje.

Išskirtinis turinys – spustelėkite čia  „Gemini“ pasirodo „Android Auto“ sistemoje ir perima valdymą iš Asistento

Su Open-R1 Hugging Face siekia ne tik įveikti šiuos apribojimus, bet ir Skatinti pasaulinį bendradarbiavimą. "Bendrinės pastangos gali turėti įtakos sprendžiant sudėtingas problemas", - sakė von Werra, pabrėždamas jų svarbą dalijimasis žiniomis atvirojo kodo bendruomenėje.

Kokius iššūkius kelia ši iniciatyva?

DeepSeek-R1 pakartotas modelis

Kaip ir bet kuris atvirojo kodo projektas, „Open-R1“ nėra atleistas nuo kritikos. Kai kurie ekspertai išreiškė susirūpinimą dėl galimo netinkamo tokio pažangaus modelio naudojimo.

Atsakydami į tai, Hugging Face kūrėjai mano Atviros platformos privalumai nusveria riziką. Pasak Bakouch, "Kai R1 architektūra bus atkartota, bus prieinamas visiems, turintiems reikiamus skaičiavimo išteklius«.

Kalbant apie infrastruktūrą, projektas ne tik siekia atkartoti originalų modelį, bet ir sudaryti tvirtą pagrindą tolesnei plėtrai. Tai galėtų apimti ir veiklos patobulinimus, ir naujus praktinius pritaikymus dirbtinio intelekto srityje.

Išskirtinis turinys – spustelėkite čia  Kurioms vartotojų kategorijoms bus naudingas „MiniAID“?

Poveikis technologijų pramonei

Hugging Face atviras DeepSeek-0 klonas

Iniciatyva Hugging Face gali turėti reikšmingų pasekmių technologijų pramonei. Siūlydami pakartotą DeepSeek-R1 modelį, bet su visiškai atvira infrastruktūra ir požiūriu, „Open-R1“ gali būti lūžio taškas kuriant ir dalijantis dirbtinio intelekto modeliais.

Be to, šis projektas galėtų būti pavyzdžiu kitoms įmonėms ir organizacijoms eiti panašiu keliu, skatinant a Didesnis skaidrumas ir bendradarbiavimas tokiose svarbiose srityse kaip dirbtinis intelektas.

Didelio našumo išteklių, aktyvios bendruomenės ir įsipareigojimo užimti atvirojo kodo pozicijas derinys Open-R1 kaip projektas, galintis ne tik atkartoti DeepSeek-R1bet taip pat ir iš Vadovavimas pokyčiams link labiau įtraukiančios ir prieinamesnės pramonės.