Hugging Face Open-R1, адкрыты клон DeepSeek-R1

Hugging Face працуе на Open-R1, клоне DeepSeek-R1 з адкрытым зыходным кодам.
Мэта складаецца ў тым, каб палепшыць празрыстасць і ўзнаўляльнасць у даследаваннях штучнага інтэлекту.
Праект імкнецца пераадолець абмежаванні мадэляў «чорнай скрыні».
Для рэплікацыі будзе выкарыстоўвацца высокапрадукцыйны кластар з 768 графічнымі працэсарамі Nvidia H100.

Кампанія Hugging Face вырашыла ўзяць на сябе задачу паўтарыць перадавую мадэль разважанняў DeepSeek-R1, ініцыятыва, якая абяцае змяніць спосаб распрацоўкі і распаўсюджвання інструментаў штучнага інтэлекту з сусветнай супольнасцю. Гэты праект, які атрымаў назву Open-R1, накіраваны не толькі на тое, каб прайграць магчымасці арыгінальнай мадэлі, але і зрабіць гэта пэўным чынам празрысты і ў адпаведнасці з прынцыпамі ст з адкрытым зыходным кодам.

Мадэль DeepSeek-R1, распрацаваная кітайскай кампаніяй, спарадзіла вялікія чаканні ў тэхналагічнай сферы з-за складанасці алгарытмаў падмацавання навучання. Аднак гэтая мадэль уяўляе некалькі бар'ераў з пункту гледжання празрыстасць, напрыклад, адсутнасць адкрытых дадзеных і дэталяў аб іх навучанні. Сутыкнуўшыся з гэтай сітуацыяй, Hugging Face робіць стаўку на адкрытую альтэрнатыву, якая дазваляе даследчыкам і распрацоўшчыкам працаваць у асяроддзі сумеснай працы.

Эксклюзіўны кантэнт - націсніце тут Робат Optimus ад Tesla дэманструе прыёмы кунг-фу ў новым відэа

Што такое Open-R1 і як вы плануеце яго развіваць?

Праект Hugging Face для кланавання DeepSeek

Open-R1 імкнецца стаць функцыянальнай копіяй DeepSeek-R1, але з функцыямі, якія спрыяюць сумесным інавацыям і ўзнаўляльнасці ў даследаваннях штучнага інтэлекту. Па словах Леандра фон Вера, кіраўніка даследаванняў Hugging Face, мэта складаецца ў тым, каб пераадолець праблемы, звязаныя з мадэлямі "чорнай скрыні", і забяспечыць інструменты, неабходныя іншым для правядзення ўласных даследаванняў.

Каманда будзе выкарыстоўваць навуковы кластар Hugging Face, асаблівасці якога Графічны працэсар 768 Nvidia H100, каб стварыць наборы дадзеных, максімальна падобныя на тыя, якія першапачаткова выкарыстоўваў DeepSeek. Акрамя таго, яны запрашаюць сусветную супольнасць прыняць удзел у распрацоўцы праекта, падкрэсліваючы, што разнастайныя пункты гледжання з'яўляюцца ключавымі для вырашэння складаных задач.

Падыход да адкрытасці і празрыстасці

Абдымаючы твар Open-R1

Хоць DeepSeek-R1 мае пэўныя адкрытыя элементы, у якасці дазвольнай ліцэнзіі, Фундаментальныя дэталі мадэлі не цалкам даступныя, што ўскладняе рэплікацыю і паглыбленае вывучэнне. Інжынер Элі Бакуш адзначыў, што адсутнасць адкрытых набораў даных і задакументаваных эксперыментаў абмяжоўвае патэнцыял даследчай супольнасці для прасоўвання ў гэтай галіне.

Эксклюзіўны кантэнт - націсніце тут Мультымадальны Microsoft Phi-4: ШІ, які разумее голас, выявы і тэкст

З дапамогай Open-R1 Hugging Face імкнецца не толькі пераадолець гэтыя абмежаванні, але і Заахвочвайце глабальнае супрацоўніцтва. "Калектыўныя намаганні могуць змяніць сітуацыю ў вырашэнні складаных праблем", - сказаў фон Вера, падкрэсліўшы важнасць дзяліцца ведамі у супольнасці з адкрытым зыходным кодам.

Якія праблемы нясе гэтая ініцыятыва?

Дубляваная мадэль DeepSeek-R1

Як і любы праект з адкрытым зыходным кодам, Open-R1 не пазбаўлены крытыкі. Некаторыя эксперты выказалі заклапочанасць з нагоды патэнцыйнага няправільнага выкарыстання такой перадавой мадэлі.

У адказ на гэта лічаць распрацоўшчыкі Hugging Face Перавагі адкрытай платформы перавышаюць рызыкі. Па словах Бакуча, "Пасля таго, як архітэктура R1 будзе прайграна, будзе даступны ўсім, хто валодае неабходнымі вылічальнымі рэсурсамі«.

З пункту гледжання інфраструктуры, праект не толькі імкнецца паўтарыць арыгінальную мадэль, але і забяспечыць трывалую аснову для будучага развіцця. Гэта можа ўключаць як паляпшэнне прадукцыйнасці, так і новыя практычныя прымянення ў галіне штучнага інтэлекту.

Эксклюзіўны кантэнт - націсніце тут Што такое распазнаванне маўлення і як яно працуе?

Уплыў на індустрыю тэхналогій

Адкрыты клон Hugging Face DeepSeek-0

Ініцыятыва Hugging Face можа мець значныя наступствы для індустрыі тэхналогій. Прапаноўваючы копію мадэлі DeepSeek-R1, але з цалкам адкрытай інфраструктурай і падыходам, Open-R1 можа стаць паваротным момантам у тым, як распрацоўваюцца і распаўсюджваюцца мадэлі штучнага інтэлекту.

Акрамя таго, гэты праект мог бы служыць прыкладам для іншых кампаній і арганізацый, каб пайсці падобным шляхам, прасоўваючы a Большая празрыстасць і супрацоўніцтва ў такой крытычна важнай вобласці, як штучны інтэлект.

Спалучэнне высокапрадукцыйных рэсурсаў, актыўнай супольнасці і адданасці пазіцыям з адкрытым зыходным кодам Open-R1 як праект з патэнцыялам не толькі паўтарыць DeepSeek-R1, але таксама з Кіраванне зменамі ў бок больш інклюзіўнай і даступнай галіны.

Альберта Навара

Я энтузіяст тэхналогій, які ператварыў свае інтарэсы "гікаў" у прафесію. Я правёў больш за 10 гадоў свайго жыцця, выкарыстоўваючы перадавыя тэхналогіі і важдаючыся з рознымі праграмамі з чыстай цікаўнасці. Цяпер я спецыялізаваўся на камп'ютарных тэхналогіях і відэагульнях. Гэта таму, што больш за 5 гадоў я працаваў для розных вэб-сайтаў, прысвечаных тэхналогіям і відэагульням, ствараючы артыкулы, якія імкнуцца даць вам неабходную інфармацыю на мове, зразумелай кожнаму.

Калі ў вас ёсць якія-небудзь пытанні, я ведаю ўсё, што звязана з аперацыйнай сістэмай Windows і Android для мабільных тэлефонаў. І я перад вамі абавязаны: я заўсёды гатовы выдаткаваць некалькі хвілін і дапамагчы вам вырашыць любыя пытанні, якія могуць узнікнуць у гэтым свеце Інтэрнэту.