Hugging Face DeepSeek-R1 үлгісінің ашық клонын шығарады

Соңғы жаңарту: 03/02/2025

  • Hugging Face DeepSeek-R1 ашық бастапқы коды Open-R1 жүйесінде жұмыс істейді.
  • Мақсат – жасанды интеллект зерттеулеріндегі ашықтық пен қайталануды жақсарту.
  • Жоба «қара жәшік» модельдерінің шектеулерін еңсеруге тырысады.
  • Көшіру үшін 768 Nvidia H100 графикалық процессоры бар өнімділігі жоғары кластер пайдаланылады.
DeepSeek-R1 ашық клон

Hugging Face DeepSeek-R1 кеңейтілген ойлау моделін қайталау мәселесін шешуге шешім қабылдады., жасанды интеллект құралдарын әзірлеу және әлемдік қауымдастықпен бөлісу тәсілін өзгертуге уәде беретін бастама. Open-R1 деп аталатын бұл жоба түпнұсқа модельдің мүмкіндіктерін қайта шығаруға ғана емес, сонымен бірге оны белгілі бір жолмен жасауға бағытталған. мөлдір және принциптеріне сәйкес ашық көзі.

Қытайлық компания жасаған DeepSeek-R1 моделі, оқытудың күшейту алгоритмдерінің күрделілігіне байланысты технологиялық салада үлкен үміттер тудырды. Дегенмен, бұл модель бірнеше кедергілерді ұсынады ашықтық, мысалы, оларды оқыту туралы ашық деректер мен мәліметтердің жоқтығы. Осы жағдайға тап болған Hugging Face зерттеушілер мен әзірлеушілерге бірлескен ортада жұмыс істеуге мүмкіндік беретін ашық баламаға ставка жасайды.

Эксклюзивті мазмұн - Мұнда басыңыз  Humata AI дегеніміз не және бәрін оқымай-ақ күрделі PDF файлдарын қалай талдауға болады

Open-R1 дегеніміз не және оны қалай дамытуды жоспарлайсыз?

DeepSeek-ті клондау үшін Hugging Face жобасы

Open-R1 DeepSeek-R1 функционалдық көшірмесі болуды мақсат етеді, бірақ AI зерттеулерінде бірлескен инновацияларды және қайталануды ынталандыратын мүмкіндіктері бар. Hugging Face зерттеу бөлімінің басшысы Леандро фон Верраның айтуынша, мақсат - «қара жәшік» модельдері тудыратын қиындықтарды жеңу және басқалардың өз зерттеулерін жүргізуі үшін қажетті құралдармен қамтамасыз ету.

Команда мүмкіндіктері бар Hugging Face Science Cluster пайдаланады 768 Nvidia H100 графикалық процессоры, бастапқыда DeepSeek пайдаланғандарға мүмкіндігінше ұқсас деректер жиынын жасау үшін. Сонымен қатар, олар жаһандық қоғамдастықты жобаны әзірлеуге қатысуға шақырады әртүрлі көзқарастар күрделі мәселелерді шешудің кілті болып табылады.

Ашықтық пен транспаренттік көзқарас

Құшақтап тұрған бет Open-R1

DeepSeek-R1 белгілі болғанымен ашық элементтер, рұқсат беретін лицензия ретінде, Модельдің негізгі мәліметтері толық қол жетімді емес, бұл репликацияны және тереңдетіп зерттеуді қиындатады. Инженер Эли Бакуч ашық деректер жиынтығының және құжатталған эксперименттердің болмауы зерттеу қауымдастығының осы салада алға жылжу әлеуетін шектейтінін атап өтті.

Эксклюзивті мазмұн - Мұнда басыңыз  Apple Intelligence дегеніміз не: оны iPhone, iPad және Mac жүйесінде қалай пайдалануға болады

Open-R1 көмегімен Hugging Face осы шектеулерді еңсеруге ғана емес, сонымен қатар ұмтылады Жаһандық ынтымақтастықты ынталандыру. Фон Верра: «Ұжымдық күш-жігер күрделі мәселелерді шешуде өзгеріс жасай алады», - деді. біліммен бөлісу ашық бастапқы қоғамдастық ішінде.

Бұл бастама қандай қиындықтар туғызады?

DeepSeek-R1 қайталанатын үлгісі

Кез келген ашық бастапқы жоба сияқты, Open-R1 сыннан босатылмайды. Кейбір сарапшылар мұндай озық үлгіні теріс пайдалану мүмкіндігіне алаңдаушылық білдірді.

Жауап ретінде Hugging Face әзірлеушілері осылай деп есептейді Ашық платформаның пайдасы тәуекелдерден асып түседі. Бакучтың айтуынша,R1 архитектурасы қайталанғаннан кейін, қажетті есептеу ресурстары бар кез келген адам қол жетімді болады«.

Инфрақұрылым тұрғысынан жоба бастапқы үлгіні қайталауға ғана емес, сонымен бірге болашақ дамуы үшін берік негіз береді. Бұл жасанды интеллект саласындағы өнімділікті жақсартуды және жаңа практикалық қолданбаларды қамтуы мүмкін.

Эксклюзивті мазмұн - Мұнда басыңыз  Қайғылы оқиға және көптеген сұрақтар: ChatGPT өз-өзіне қол жұмсау ісі бойынша сотқа жүгінеді

Технология саласына әсері

Hugging Face ашық DeepSeek-0 клоны

Hugging Face бастамасы технологиялық индустрияға айтарлықтай әсер етуі мүмкін. DeepSeek-R1 қайталанатын үлгісін ұсына отырып, бірақ толығымен ашық инфрақұрылымы мен тәсілімен, Open-R1 AI модельдерін әзірлеу және ортақ пайдалану жолында бетбұрыс нүктесін белгілей алады.

Сонымен қатар, бұл жоба басқа компаниялар мен ұйымдарға ұқсас жолды ұстануға үлгі бола алады Жасанды интеллект сияқты маңызды салада үлкен ашықтық пен ынтымақтастық.

Жоғары өнімді ресурстардың, белсенді қауымдастықтың және ашық бастапқы ұстанымдарға берілгендіктің үйлесімі Open-R1 тек DeepSeek-R1-ді қайталамау мүмкіндігі бар жоба ретінде, сонымен қатар Неғұрлым инклюзивті және қолжетімді салаға қарай өзгерісті жүргізу.