- Hugging Face veikia Open-R1, atvirojo kodo DeepSeek-R1 klone.
- Tikslas – pagerinti dirbtinio intelekto tyrimų skaidrumą ir atkuriamumą.
- Projektu siekiama įveikti „juodosios dėžės“ modelių apribojimus.
- Replikacijai bus naudojamas didelio našumo klasteris su 768 Nvidia H100 GPU.
Hugging Face nusprendė priimti iššūkį atkartoti DeepSeek-R1 pažangų samprotavimo modelį, iniciatyva, kuri žada pakeisti dirbtinio intelekto įrankių kūrimo ir dalijimosi su pasauline bendruomene būdą. Šiuo projektu, pavadintu „Open-R1“, siekiama ne tik atkurti originalaus modelio galimybes, bet ir tai padaryti tam tikru būdu. skaidrus ir laikantis principų atvirojo kodo.
DeepSeek-R1 modelis, sukurtas Kinijos kompanijos, sukūrė didelių lūkesčių technologijų srityje dėl savo sustiprinimo mokymosi algoritmų sudėtingumo. Tačiau šis modelis turi keletą kliūčių skaidrumas, pavyzdžiui, atvirų duomenų ir informacijos apie jų mokymą trūkumas. Susidūrusi su tokia situacija, Hugging Face lažinasi dėl atviros alternatyvos, leidžiančios mokslininkams ir kūrėjams dirbti bendradarbiavimo aplinkoje.
Kas yra Open-R1 ir kaip planuojate jį plėtoti?

„Open-R1“ siekia būti funkcine „DeepSeek-R1“ kopija, bet su funkcijomis, kurios skatina bendradarbiavimo inovacijas ir atkuriamumą atliekant AI tyrimus. Pasak Leandro von Werra, Hugging Face tyrimų vadovo, tikslas yra įveikti „juodosios dėžės“ modelių keliamus iššūkius ir suteikti kitiems reikalingus įrankius savo tyrimams atlikti.
Komanda naudos Hugging Face Science Cluster, kuris turi savybių 768 Nvidia H100 GPU, kad būtų sukurti duomenų rinkiniai, kurie būtų kuo panašesni į tuos, kuriuos iš pradžių naudojo DeepSeek. Be to, jie kviečia pasaulinę bendruomenę dalyvauti kuriant projektą, pabrėždami, kad įvairios perspektyvos yra raktas į sudėtingų problemų sprendimą.
Požiūris į atvirumą ir skaidrumą

Nors DeepSeek-R1 turi tam tikrų atviri elementai, kaip leistina licencija, Pagrindinės modelio detalės nėra visiškai prieinamos, todėl sunku replikuoti ir atlikti išsamų tyrimą. Inžinierius Elie Bakouch pabrėžė, kad atvirų duomenų rinkinių ir dokumentuotų eksperimentų trūkumas riboja mokslinių tyrimų bendruomenės galimybes tobulėti šioje srityje.
Su Open-R1 Hugging Face siekia ne tik įveikti šiuos apribojimus, bet ir Skatinti pasaulinį bendradarbiavimą. "Bendrinės pastangos gali turėti įtakos sprendžiant sudėtingas problemas", - sakė von Werra, pabrėždamas jų svarbą dalijimasis žiniomis atvirojo kodo bendruomenėje.
Kokius iššūkius kelia ši iniciatyva?

Kaip ir bet kuris atvirojo kodo projektas, „Open-R1“ nėra atleistas nuo kritikos. Kai kurie ekspertai išreiškė susirūpinimą dėl galimo netinkamo tokio pažangaus modelio naudojimo.
Atsakydami į tai, Hugging Face kūrėjai mano Atviros platformos privalumai nusveria riziką. Pasak Bakouch, "Kai R1 architektūra bus atkartota, bus prieinamas visiems, turintiems reikiamus skaičiavimo išteklius«.
Kalbant apie infrastruktūrą, projektas ne tik siekia atkartoti originalų modelį, bet ir sudaryti tvirtą pagrindą tolesnei plėtrai. Tai galėtų apimti ir veiklos patobulinimus, ir naujus praktinius pritaikymus dirbtinio intelekto srityje.
Poveikis technologijų pramonei

Iniciatyva Hugging Face gali turėti reikšmingų pasekmių technologijų pramonei. Siūlydami pakartotą DeepSeek-R1 modelį, bet su visiškai atvira infrastruktūra ir požiūriu, „Open-R1“ gali būti lūžio taškas kuriant ir dalijantis dirbtinio intelekto modeliais.
Be to, šis projektas galėtų būti pavyzdžiu kitoms įmonėms ir organizacijoms eiti panašiu keliu, skatinant a Didesnis skaidrumas ir bendradarbiavimas tokiose svarbiose srityse kaip dirbtinis intelektas.
Didelio našumo išteklių, aktyvios bendruomenės ir įsipareigojimo užimti atvirojo kodo pozicijas derinys Open-R1 kaip projektas, galintis ne tik atkartoti DeepSeek-R1bet taip pat ir iš Vadovavimas pokyčiams link labiau įtraukiančios ir prieinamesnės pramonės.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.