Hugging Face merilis tiruan terbuka dari model DeepSeek-R1

Pembaruan terakhir: 03/02/2025

  • Hugging Face berjalan pada Open-R1, tiruan sumber terbuka dari DeepSeek-R1.
  • Sasarannya adalah untuk meningkatkan transparansi dan reproduktifitas dalam penelitian kecerdasan buatan.
  • Proyek ini berupaya mengatasi keterbatasan model "kotak hitam".
  • Klaster berkinerja tinggi dengan 768 GPU Nvidia H100 akan digunakan untuk replikasi.
Klon terbuka DeepSeek-R1

Hugging Face telah memutuskan untuk mengambil tantangan mereplikasi model penalaran tingkat lanjut DeepSeek-R1, sebuah inisiatif yang menjanjikan untuk mengubah cara alat kecerdasan buatan dikembangkan dan dibagikan kepada komunitas global. Proyek ini, yang dijuluki Open-R1, bertujuan tidak hanya untuk mereproduksi kemampuan model asli, tetapi juga melakukannya dengan cara transparan dan sesuai dengan prinsip-prinsip sumber terbuka.

Model DeepSeek-R1, yang dikembangkan oleh perusahaan Tiongkok, telah menghasilkan harapan besar di bidang teknologi karena kompleksitas algoritma pembelajaran penguatannya. Namun, model ini memiliki beberapa hambatan dalam hal transparansi, seperti kurangnya data terbuka dan rincian tentang pelatihan mereka. Menghadapi situasi ini, Hugging Face bertaruh pada alternatif terbuka yang memungkinkan peneliti dan pengembang bekerja dalam lingkungan kolaboratif.

Konten eksklusif - Klik Disini  Google Maps akan memindai tangkapan layar Anda untuk membantu Anda merencanakan perjalanan

Apa itu Open-R1 dan bagaimana Anda berencana mengembangkannya?

Proyek Hugging Face untuk Mengkloning DeepSeek

Open-R1 bertujuan untuk menjadi replika fungsional DeepSeek-R1, tetapi dengan fitur yang mempromosikan inovasi kolaboratif dan reproduktifitas dalam penelitian AI. Menurut Leandro von Werra, kepala penelitian di Hugging Face, tujuannya adalah untuk mengatasi tantangan yang ditimbulkan oleh model "kotak hitam" dan menyediakan alat yang diperlukan bagi orang lain untuk melakukan penelitian mereka sendiri.

Tim akan menggunakan Hugging Face Science Cluster, yang menampilkan Kartu Grafis Nvidia H768 100, untuk menghasilkan kumpulan data yang semirip mungkin dengan kumpulan data yang awalnya digunakan oleh DeepSeek. Selain itu, mereka mengundang masyarakat global untuk berpartisipasi dalam pengembangan proyek tersebut, dengan menekankan bahwa beragam perspektif adalah kunci untuk memecahkan masalah yang rumit.

Pendekatan terhadap keterbukaan dan transparansi

Memeluk wajah Open-R1

Meskipun DeepSeek-R1 memiliki elemen terbuka, sebagai lisensi permisif, Rincian dasar model belum tersedia secara lengkap, yang membuat replikasi dan studi mendalam menjadi sulit. Insinyur Elie Bakouch telah menunjukkan bahwa kurangnya kumpulan data terbuka dan eksperimen yang terdokumentasi membatasi potensi komunitas penelitian untuk maju dalam bidang ini.

Konten eksklusif - Klik Disini  OpenAI akan menambahkan kontrol orangtua ke ChatGPT dengan akun keluarga, peringatan risiko, dan batasan penggunaan.

Dengan Open-R1, Hugging Face tidak hanya berusaha mengatasi keterbatasan ini, tetapi juga Dorong kolaborasi global. “Upaya kolektif dapat membuat perbedaan dalam mengatasi masalah-masalah yang kompleks,” kata von Werra, menekankan pentingnya Berbagi ilmu dalam komunitas sumber terbuka.

Tantangan apa saja yang dihadirkan inisiatif ini?

Model replikasi DeepSeek-R1

Seperti proyek sumber terbuka lainnya, Open-R1 tidak luput dari kritik. Beberapa ahli telah menyatakan kekhawatiran tentang potensi penyalahgunaan model canggih tersebut.

Sebagai tanggapan, pengembang Hugging Face menganggap bahwa Manfaat platform terbuka lebih besar daripada risikonya. Menurut Bakouch, "Setelah arsitektur R1 direplikasi, akan dapat diakses oleh siapa saja yang memiliki sumber daya komputasi yang diperlukan«.

Dalam hal infrastruktur, proyek ini tidak hanya berupaya untuk meniru model aslinya, tetapi juga memberikan landasan yang kuat untuk pengembangan di masa depan. Ini dapat mencakup peningkatan kinerja dan aplikasi praktis baru di bidang kecerdasan buatan.

Konten eksklusif - Klik Disini  Microsoft meningkatkan taruhannya pada kecerdasan super humanistik

Dampak pada industri teknologi

Hugging Face membuka klon DeepSeek-0

Inisiatif Hugging Face dapat memiliki implikasi signifikan bagi industri teknologi. Dengan menawarkan model replikasi DeepSeek-R1, tetapi dengan infrastruktur dan pendekatan yang sepenuhnya terbuka, Open-R1 dapat menandai titik balik dalam cara model AI dikembangkan dan dibagikan.

Selain itu, proyek ini dapat menjadi contoh bagi perusahaan dan organisasi lain untuk mengikuti jalur serupa, mempromosikan Transparansi dan kolaborasi yang lebih besar dalam bidang penting seperti kecerdasan buatan.

Kombinasi sumber daya berkinerja tinggi, komunitas aktif, dan komitmen terhadap posisi sumber terbuka Open-R1 sebagai proyek dengan potensi tidak hanya mereplikasi DeepSeek-R1tetapi juga dari Memimpin perubahan menuju industri yang lebih inklusif dan mudah diakses.