Hugging Face vabastab mudeli DeepSeek-R1 avatud klooni

Viimane uuendus: 03/02/2025

  • Hugging Face töötab Open-R1-l, mis on DeepSeek-R1 avatud lähtekoodiga kloon.
  • Eesmärk on parandada tehisintellektiuuringute läbipaistvust ja reprodutseeritavust.
  • Projekti eesmärk on ületada "musta kasti" mudelite piirangud.
  • Replikatsiooniks kasutatakse 768 Nvidia H100 GPU-ga suure jõudlusega klastrit.
DeepSeek-R1 avatud kloon

Hugging Face on otsustanud vastu võtta DeepSeek-R1 täiustatud arutlusmudeli kordamise väljakutse, algatus, mis lubab muuta viisi, kuidas tehisintellekti tööriistu arendatakse ja ülemaailmse kogukonnaga jagatakse. Selle projekti nimega Open-R1 eesmärk on mitte ainult reprodutseerida originaalmudeli võimalusi, vaid ka teha seda teatud viisil. läbipaistev ja kooskõlas põhimõtetega avatud lähtekoodiga.

DeepSeek-R1 mudel, mille on välja töötanud Hiina ettevõte, on tekitanud tehnoloogilises valdkonnas suuri ootusi tänu oma tugevdavate õppealgoritmide keerukusele. Sellel mudelil on aga mitmeid takistusi läbipaistvus, näiteks avaandmete ja nende koolituse üksikasjade puudumine. Sellise olukorraga silmitsi seistes panustab Hugging Face avatud alternatiivile, mis võimaldab teadlastel ja arendajatel töötada koostöökeskkonnas.

Eksklusiivne sisu – klõpsake siin  Disney+ avab platvormil ukse tehisintellektil põhinevale videote loomisele

Mis on Open-R1 ja kuidas kavatsete seda arendada?

Kallistava näo projekt DeepSeeki kloonimiseks

Open-R1 eesmärk on olla DeepSeek-R1 funktsionaalne koopia, kuid funktsioonidega, mis edendavad tehisintellektiuuringutes koostööalast innovatsiooni ja reprodutseeritavust. Hugging Face'i uuringute juhi Leandro von Werra sõnul on eesmärk ületada "musta kasti" mudelite tekitatud väljakutsed ja pakkuda teistele oma uurimistöö läbiviimiseks vajalikke tööriistu.

Meeskond kasutab Hugging Face Science Clusterit, millel on funktsioonid 768 Nvidia H100 GPU, et toota andmestikke, mis on võimalikult sarnased DeepSeeki poolt algselt kasutatud andmekogumitega. Lisaks kutsuvad nad ülemaailmset kogukonda projekti väljatöötamisel osalema, rõhutades, et erinevaid vaatenurki on keeruliste probleemide lahendamise võtmeks.

Lähenemine avatusele ja läbipaistvusele

Kallistav nägu Open-R1

Kuigi DeepSeek-R1-l on kindel avatud elemendid, lubava litsentsina, Mudeli põhidetailid pole täielikult kättesaadavad, mis muudab paljundamise ja põhjaliku uurimise keeruliseks. Insener Elie Bakouch on juhtinud tähelepanu sellele, et avatud andmekogumite ja dokumenteeritud katsete puudumine piirab teadlaskonna potentsiaali selles valdkonnas edasi liikuda.

Eksklusiivne sisu – klõpsake siin  Grok teeb arvutustabelite redigeerimise revolutsiooniliseks: kõik xAI uue pakkumise kohta

Open-R1 abil ei püüa Hugging Face mitte ainult neid piiranguid ületada, vaid ka Julgustada ülemaailmset koostööd. "Kollektiivsed jõupingutused võivad keeruliste probleemide lahendamisel midagi muuta," ütles von Werra, rõhutades nende tähtsust teadmisi jagada avatud lähtekoodiga kogukonnas.

Milliseid väljakutseid see algatus esitab?

DeepSeek-R1 kopeeritud mudel

Nagu iga avatud lähtekoodiga projekt, Open-R1 ei ole kriitikavaba. Mõned eksperdid on väljendanud muret sellise täiustatud mudeli võimaliku väärkasutuse pärast.

Vastuseks Hugging Face'i arendajad leiavad, et Avatud platvormi eelised kaaluvad üles riskid. Bakouchi sõnul "Kui R1 arhitektuur on paljundatud, on juurdepääsetav kõigile, kellel on vajalikud arvutusressursid«.

Infrastruktuuri osas ei püüa projekt mitte ainult kopeerida algset mudelit, vaid ka loovad tugeva aluse edasiseks arenguks. See võib hõlmata nii jõudluse parandamist kui ka uusi praktilisi rakendusi tehisintellekti valdkonnas.

Eksklusiivne sisu – klõpsake siin  Ai-Da, robotkunstnik, kes esitab kuningas Charles III portreega väljakutse inimkunstile

Mõju tehnoloogiatööstusele

Kallistava näo avatud DeepSeek-0 kloon

Hugging Face algatusel võib olla tehnoloogiatööstusele märkimisväärne mõju. Pakkudes DeepSeek-R1 paljundatud mudelit, kuid täiesti avatud infrastruktuuri ja lähenemisviisiga, Open-R1 võib tähistada pöördepunkti AI mudelite arendamise ja jagamise viisis.

Lisaks võiks see projekt olla eeskujuks teistele ettevõtetele ja organisatsioonidele, kes järgiksid sarnast teed, edendades a Suurem läbipaistvus ja koostöö sellises kriitilises valdkonnas nagu tehisintellekt.

Kõrge jõudlusega ressursside, aktiivse kogukonna ja avatud lähtekoodiga positsioonidele pühendumise kombinatsioon Open-R1 kui projekt, millel on potentsiaal mitte ainult DeepSeek-R1 kopeerimiseks, aga ka Juhtida muutust kaasavama ja juurdepääsetavama tööstuse suunas.