- Hugging Face는 DeepSeek-R1의 오픈 소스 복제본인 Open-R1에서 실행됩니다.
- 목표는 인공지능 연구의 투명성과 재현성을 개선하는 것입니다.
- 이 프로젝트는 "블랙박스" 모델의 한계를 극복하는 것을 목표로 합니다.
- 768개의 Nvidia H100 GPU를 탑재한 고성능 클러스터가 복제에 사용됩니다.
Hugging Face는 DeepSeek-R1 고급 추론 모델을 복제하는 과제를 수행하기로 결정했습니다.인공지능 도구가 개발되어 글로벌 커뮤니티와 공유되는 방식을 바꾸겠다고 약속한 이니셔티브입니다. Open-R1이라는 이름의 이 프로젝트는 원래 모델의 기능을 재현하는 것뿐만 아니라 이를 다음과 같은 방식으로 구현하는 것을 목표로 합니다. 투명한 그리고 원칙에 따라 오픈 소스.
중국 회사가 개발한 DeepSeek-R1 모델, 강화 학습 알고리즘의 복잡성으로 인해 기술 분야에서 큰 기대를 모았습니다. 그러나 이 모델은 다음과 같은 측면에서 여러 가지 장벽을 제시합니다. 투명도예를 들어, 공개 데이터가 부족하고 훈련에 대한 세부 정보가 부족한 것입니다. 이러한 상황에 직면하여, Hugging Face는 연구자와 개발자가 협업 환경에서 작업할 수 있는 개방형 대안을 선택하고 있습니다.
Open-R1은 무엇이고 어떻게 개발할 계획인가요?

Open-R1은 DeepSeek-R1의 기능적 복제본이 되는 것을 목표로 합니다.하지만 AI 연구에서 협력적 혁신과 재현성을 촉진하는 특징이 있습니다. 허깅 페이스의 연구 책임자인 레안드로 폰 베라에 따르면, 목표는 "블랙박스" 모델이 제기하는 과제를 극복하고 다른 사람들이 자신의 연구를 수행하는 데 필요한 도구를 제공하는 것입니다.
이 팀은 Hugging Face Science Cluster를 사용할 것입니다. 768 엔비디아 H100 GPUDeepSeek에서 원래 사용한 데이터 세트와 최대한 유사한 데이터 세트를 생성합니다. 또한 그들은 글로벌 커뮤니티가 프로젝트 개발에 참여하도록 초대하며 다음과 같은 점을 강조합니다. 다양한 관점 복잡한 문제를 해결하는 데 중요합니다.
개방성과 투명성에 대한 접근 방식

DeepSeek-R1에는 특정 열린 요소, 허용 라이센스로서, 모델의 기본 세부 사항은 완전히 제공되지 않습니다., 이로 인해 재현과 심층 연구가 어렵습니다. 엔지니어 엘리 바쿠치는 공개 데이터 세트와 문서화된 실험 결과가 부족하여 이 분야에서 연구 커뮤니티가 발전할 수 있는 잠재력이 제한된다고 지적했습니다.
Open-R1을 통해 Hugging Face는 이러한 제한을 극복할 뿐만 아니라 글로벌 협업을 장려하다. von Werra는 "집단적 노력은 복잡한 문제를 해결하는 데 변화를 가져올 수 있습니다."라고 말하며 다음과 같은 중요성을 강조했습니다. 지식을 공유하다 오픈소스 커뮤니티 내에서.
이 이니셔티브는 어떤 과제를 제시합니까?

모든 오픈 소스 프로젝트와 마찬가지로 Open-R1도 비판에서 자유롭지 않다. 일부 전문가들은 이러한 진보된 모델이 오용될 가능성이 있다는 우려를 표명했습니다.
이에 대해 Hugging Face 개발자들은 다음과 같이 생각합니다. 개방형 플랫폼의 이점은 위험보다 더 큽니다.. Bakouch에 따르면, "R1 아키텍처가 복제되면 필요한 컴퓨팅 리소스가 있는 모든 사람이 접근할 수 있습니다.«.
인프라 측면에서 이 프로젝트는 원래 모델을 복제하는 것뿐만 아니라 미래 개발을 위한 견고한 기반을 제공하다. 여기에는 성능 향상과 인공지능 분야의 새로운 실용적 응용 분야가 모두 포함될 수 있습니다.
기술 산업에 미치는 영향

허깅 페이스 이니셔티브는 기술 산업에 상당한 영향을 미칠 수 있습니다. DeepSeek-R1의 복제 모델을 제공하면서도 완전히 개방된 인프라와 접근 방식을 통해 Open-R1은 AI 모델이 개발되고 공유되는 방식에 있어서 전환점을 가져올 수 있습니다..
또한 이 프로젝트는 다른 회사와 조직이 유사한 경로를 따라가도록 하는 모범 사례가 될 수 있습니다. 인공 지능과 같은 중요한 분야에서 더 큰 투명성과 협업.
고성능 리소스, 활발한 커뮤니티, 오픈 소스 포지션에 대한 헌신의 결합 DeepSeek-R1을 복제할 수 있는 잠재력을 가진 프로젝트로서의 Open-R1,뿐만 아니라 보다 포괄적이고 접근 가능한 산업으로의 변화 선도.
나는 그의 "괴짜" 관심을 직업으로 바꾼 기술 열광자입니다. 나는 10년 넘게 최첨단 기술을 사용하고 순수한 호기심으로 온갖 프로그램을 만지작거리며 살아왔습니다. 이제 저는 컴퓨터 기술과 비디오 게임을 전공했습니다. 왜냐하면 저는 5년 넘게 기술 및 비디오 게임에 관한 다양한 웹사이트에 글을 쓰고 모든 사람이 이해할 수 있는 언어로 필요한 정보를 제공하려는 기사를 작성해 왔기 때문입니다.
질문이 있으시면 제가 알고 있는 지식은 Windows 운영 체제는 물론 휴대폰용 Android까지 다양합니다. 그리고 저는 여러분을 위한 헌신을 하고 있습니다. 저는 항상 몇 분씩만 시간을 내어 이 인터넷 세계에서 여러분이 가질 수 있는 모든 질문을 해결하도록 도와드릴 의향이 있습니다.