Hugging Face ngaluarkeun klon kabuka tina model DeepSeek-R1

Update terakhir: 03/02/2025

  • Hugging Face dijalankeun dina Open-R1, clone open source DeepSeek-R1.
  • Tujuanana nyaéta pikeun ningkatkeun transparansi sareng reproducibility dina panalungtikan intelijen buatan.
  • Proyék narékahan pikeun ngatasi watesan model "kotak hideung".
  • Klaster-kinerja tinggi kalawan 768 Nvidia H100 GPUs bakal dipaké pikeun réplikasi.
DeepSeek-R1 buka clone

Hugging Face parantos mutuskeun pikeun nanggung tangtangan pikeun ngulang modél penalaran canggih DeepSeek-R1, hiji prakarsa anu jangji baris ngarobah cara parabot kecerdasan jieunan anu dimekarkeun sarta dibagikeun kalawan komunitas global. Proyék ieu, anu disebat Open-R1, tujuanana henteu ngan ukur pikeun ngahasilkeun deui kamampuan modél aslina, tapi ogé pikeun ngalakukeunana ku cara. herang sarta luyu jeung prinsip sumber kabuka.

Model DeepSeek-R1, dikembangkeun ku perusahaan Cina, geus dihasilkeun ekspektasi hébat dina widang téhnologis alatan pajeulitna algoritma learning tulangan na. Sanajan kitu, model ieu presents sababaraha halangan dina watesan transparansi, kayaning kurangna data kabuka sarta detil ngeunaan latihan maranéhanana. Nyanghareupan kaayaan ieu, Hugging Face tohan dina alternatif kabuka anu ngamungkinkeun para panalungtik sareng pamekar tiasa damel di lingkungan kolaboratif.

Eusi ekslusif - Klik Ieuh  Disney + muka panto pikeun nyiptakeun pidéo anu didamel ku AI dina platform éta

Naon Open-R1 sareng kumaha anjeun badé ngembangkeunana?

Nangkeup Proyék Beungeut pikeun Kloning DeepSeek

Open-R1 boga tujuan pikeun jadi réplika fungsional DeepSeek-R1, tapi mibanda fitur nu ngamajukeun inovasi kolaborasi jeung reproducibility dina panalungtikan AI. Numutkeun ka Leandro von Werra, kapala panalungtikan di Hugging Face, tujuanana nyaéta pikeun ngatasi tantangan anu ditimbulkeun ku modél "kotak hideung" sareng nyayogikeun alat anu dipikabutuh pikeun batur pikeun ngalaksanakeun panalungtikan sorangan.

Tim bakal ngagunakeun Hugging Face Science Cluster, anu gaduh ciri 768 Nvidia H100 GPU, Pikeun ngahasilkeun datasets anu sabisa-bisa sarua jeung nu asalna dipaké ku DeepSeek. Sajaba ti éta, maranéhna ngajak masarakat global pikeun ilubiung dina ngembangkeun proyék, panyorot yén éta rupa-rupa perspéktif mangrupakeun konci pikeun ngarengsekeun masalah kompléks.

Hiji pendekatan ka openness jeung transparansi

Nangkeup beungeut Buka-R1

Sanajan DeepSeek-R1 geus tangtu elemen kabuka, salaku lisénsi permisif, Rincian dasar modél henteu sayogi, nu ngajadikeun réplikasi jeung ulikan di-jero hésé. Insinyur Elie Bakouch parantos nunjukkeun yén kurangna set data kabuka sareng percobaan anu didokumentasikeun ngabatesan poténsi komunitas panalungtikan pikeun maju dina widang ieu.

Eusi ekslusif - Klik Ieuh  Grok revolutionizes éditan spreadsheet: sadayana ngeunaan panawaran anyar xAI

Kalayan Open-R1, Hugging Face henteu ngan ukur pikeun ngatasi watesan ieu, tapi ogé Ajak kolaborasi global. "Usaha koléktif tiasa ngadamel bédana dina ngarengsekeun masalah anu rumit," saur von Werra, negeskeun pentingna babagi pangaweruh dina komunitas open source.

Tantangan naon anu aya dina inisiatif ieu?

DeepSeek-R1 replicated model

Sapertos proyék open source, Buka-R1 teu dibebaskeun tina kritik. Sababaraha ahli parantos nyatakeun prihatin ngeunaan kamungkinan nyalahgunakeun modél canggih sapertos kitu.

Salaku réspon, pamekar Hugging Face nganggap éta Mangpaat platform kabuka langkung ageung tibatan résiko. Numutkeun Bakouch, "Sakali arsitéktur R1 parantos direplikasi, bakal diaksés ku saha waé anu gaduh sumber komputasi anu diperyogikeun«.

Dina hal infrastruktur, proyék éta henteu ngan ukur narékahan pikeun niron modél aslina, tapi ogé nyadiakeun pondasi padet pikeun pangwangunan hareup. Ieu bisa ngawengku duanana perbaikan kinerja sarta aplikasi praktis anyar dina widang kecerdasan jieunan.

Eusi ekslusif - Klik Ieuh  Ai-Da, seniman robot anu nantang seni manusa kalayan potret Raja Charles III

Dampak dina industri téhnologi

Nangkeup raray muka klon DeepSeek-0

Inisiatif Hugging Face tiasa gaduh implikasi anu signifikan pikeun industri téknologi. Ku nawiskeun modél replika DeepSeek-R1, tapi kalayan infrastruktur sareng pendekatan anu lengkep, Open-R1 tiasa nandaan titik balik dina cara modél AI dikembangkeun sareng dibagi.

Saterusna, proyék ieu bisa ngawula ka salaku conto pikeun pausahaan séjén sarta organisasi nuturkeun jalur sarupa, promosi a Transparansi sareng kolaborasi langkung ageung di daérah kritis sapertos intelijen buatan.

Kombinasi sumberdaya-kinerja tinggi, komunitas aktip, sareng komitmen pikeun posisi open source Open-R1 salaku proyék anu berpotensi henteu ngan ukur ngayakeun réplikasi DeepSeek-R1, tapi ogé tina Anjog parobahan ka arah industri anu langkung inklusif sareng diaksés.