Hugging Face-ը թողարկում է DeepSeek-R1 մոդելի բաց կլոնը

Վերջին թարմացումը. 03/02/2025

  • Hugging Face-ն աշխատում է Open-R1-ում՝ DeepSeek-R1-ի բաց կոդով կլոնով:
  • Նպատակն է բարելավել արհեստական ​​ինտելեկտի հետազոտությունների թափանցիկությունն ու վերարտադրելիությունը:
  • Նախագիծը ձգտում է հաղթահարել «սև արկղերի» մոդելների սահմանափակումները։
  • Կրկնօրինակելու համար կօգտագործվի բարձր արդյունավետության կլաստեր՝ 768 Nvidia H100 GPU-ներով:
DeepSeek-R1 բաց կլոն

Hugging Face-ը որոշել է ստանձնել DeepSeek-R1 առաջադեմ տրամաբանական մոդելի կրկնօրինակման մարտահրավերը, նախաձեռնություն, որը խոստանում է փոխել արհեստական ​​ինտելեկտի գործիքների մշակման և համաշխարհային հանրության հետ կիսվելու ձևը: Այս նախագիծը, որը կոչվում է Open-R1, նպատակ ունի ոչ միայն վերարտադրել օրիգինալ մոդելի հնարավորությունները, այլև դա անել մի կերպ. թափանցիկ և սկզբունքներին համապատասխան բաց աղբյուր.

DeepSeek-R1 մոդելը, որը մշակվել է չինական ընկերության կողմից, մեծ ակնկալիքներ է առաջացրել տեխնոլոգիական ոլորտում՝ շնորհիվ իր ամրապնդման ուսուցման ալգորիթմների բարդության։ Այնուամենայնիվ, այս մոդելը ներկայացնում է մի քանի խոչընդոտներ թափանցիկություն, օրինակ՝ բաց տվյալների և նրանց վերապատրաստման վերաբերյալ մանրամասների բացակայությունը։ Հանդիպելով այս իրավիճակին՝ Hugging Face-ը խաղադրույք է կատարում բաց այլընտրանքի վրա, որը թույլ է տալիս հետազոտողներին և մշակողներին աշխատել համագործակցային միջավայրում:

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Tesla-ի Optimus ռոբոտը նոր տեսանյութում ցուցադրում է կունգ-ֆուի շարժումները

Ի՞նչ է Open-R1-ը և ինչպե՞ս եք նախատեսում զարգացնել այն:

Hugging Face Project՝ DeepSeek-ի կլոնավորման համար

Open-R1-ը նպատակ ունի լինել DeepSeek-R1-ի ֆունկցիոնալ կրկնօրինակը, բայց առանձնահատկություններով, որոնք նպաստում են համատեղ նորարարությանը և վերարտադրելիությանը AI հետազոտություններում: Ըստ Hugging Face-ի հետազոտության ղեկավար Լեանդրո ֆոն Վերայի, նպատակն է հաղթահարել «սև արկղերի» մոդելների առաջադրած մարտահրավերները և տրամադրել գործիքներ, որոնք անհրաժեշտ են ուրիշների համար սեփական հետազոտությունն իրականացնելու համար:

Թիմը կօգտագործի Hugging Face Science Cluster-ը, որն ունի առանձնահատկություններ 768 Nvidia H100 GPU, ստեղծելու տվյալների հավաքածուներ, որոնք հնարավորինս նման են DeepSeek-ի կողմից սկզբնապես օգտագործված տվյալներին: Բացի այդ, նրանք հրավիրում են համաշխարհային հանրությանը մասնակցելու նախագծի մշակմանը` ընդգծելով, որ բազմազան հեռանկարներ առանցքային են բարդ խնդիրների լուծման համար:

Բաց և թափանցիկության մոտեցում

Գրկած դեմք Open-R1

Չնայած DeepSeek-R1-ն ունի որոշակի բաց տարրերորպես թույլատրելի լիցենզիա, Մոդելի հիմնարար մանրամասները լիովին հասանելի չեն, ինչը դժվարացնում է կրկնօրինակումը և խորը ուսումնասիրությունը։ Ինժեներ Էլի Բաքուչը նշել է, որ բաց տվյալների հավաքածուների և փաստագրված փորձերի բացակայությունը սահմանափակում է հետազոտական ​​համայնքի ներուժը այս ոլորտում առաջխաղացման համար:

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Microsoft Phi-4 Multimodal. AI, որը հասկանում է ձայնը, պատկերները և տեքստը

Open-R1-ով Գրկած դեմքը ձգտում է ոչ միայն հաղթահարել այս սահմանափակումները, այլ նաև Խրախուսեք գլոբալ համագործակցությունը. «Հավաքական ջանքերը կարող են փոփոխություններ կատարել բարդ խնդիրների լուծման գործում», - ասաց ֆոն Վերան՝ ընդգծելով դրա կարևորությունը կիսվել գիտելիքներով բաց կոդով համայնքում:

Ի՞նչ մարտահրավերներ է ներկայացնում այս նախաձեռնությունը:

DeepSeek-R1 կրկնօրինակված մոդել

Ինչպես ցանկացած բաց կոդով նախագիծ, Open-R1-ը զերծ չէ քննադատությունից. Որոշ փորձագետներ մտահոգություն են հայտնել նման առաջադեմ մոդելի հնարավոր սխալ օգտագործման վերաբերյալ:

Ի պատասխան՝ Hugging Face-ի մշակողները համարում են, որ Բաց հարթակի առավելությունները գերազանցում են ռիսկերը. Ըստ Բաքուչի, «Երբ R1 ճարտարապետությունը կրկնօրինակվի, հասանելի կլինի բոլորին, ովքեր ունեն անհրաժեշտ հաշվողական ռեսուրսներ«.

Ենթակառուցվածքի առումով նախագիծը ոչ միայն ձգտում է կրկնօրինակել օրիգինալ մոդելը, այլև ստեղծել ամուր հիմք ապագա զարգացման համար. Սա կարող է ներառել ինչպես կատարողականի բարելավում, այնպես էլ նոր գործնական կիրառություններ արհեստական ​​ինտելեկտի ոլորտում:

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Ի՞նչ է խոսքի ճանաչումը և ինչպես է այն աշխատում:

Ազդեցությունը տեխնոլոգիական արդյունաբերության վրա

Գրկախառնված դեմքը DeepSeek-0-ի բաց կլոն

Hugging Face նախաձեռնությունը կարող է զգալի ազդեցություն ունենալ տեխնոլոգիական արդյունաբերության վրա: Առաջարկելով DeepSeek-R1-ի կրկնօրինակված մոդել, բայց ամբողջովին բաց ենթակառուցվածքով և մոտեցմամբ, Open-R1-ը կարող է շրջադարձային կետ նշանակել արհեստական ​​ինտելեկտի մոդելների մշակման և տարածման ճանապարհին.

Ավելին, այս նախագիծը կարող է օրինակ ծառայել այլ ընկերությունների և կազմակերպությունների համար՝ գնալու նմանատիպ ճանապարհով՝ խթանելով Ավելի մեծ թափանցիկություն և համագործակցություն այնպիսի կարևոր ոլորտում, ինչպիսին է արհեստական ​​ինտելեկտը.

Բարձր արդյունավետության ռեսուրսների, ակտիվ համայնքի և բաց կոդով պաշտոններին նվիրվածության համադրություն Open-R1-ը որպես նախագիծ, որը կարող է ոչ միայն կրկնօրինակել DeepSeek-R1-ը, բայց և Առաջնորդելով փոփոխություն դեպի ավելի ներառական և մատչելի արդյունաբերություն.