Hugging Face wypuszcza otwarty klon modelu DeepSeek-R1

Ostatnia aktualizacja: 20.09.2023

  • Hugging Face działa na platformie Open-R1, która jest klonem DeepSeek-R1 o otwartym kodzie źródłowym.
  • Celem jest poprawa przejrzystości i powtarzalności badań nad sztuczną inteligencją.
  • Projekt ma na celu przezwyciężenie ograniczeń modeli „czarnej skrzynki”.
  • Do replikacji zostanie wykorzystany klaster o wysokiej wydajności wyposażony w 768 procesorów graficznych Nvidia H100.
DeepSeek-R1 otwarty klon

Hugging Face postanowiło podjąć wyzwanie odtworzenia zaawansowanego modelu rozumowania DeepSeek-R1, inicjatywa, która obiecuje zmienić sposób, w jaki narzędzia sztucznej inteligencji są opracowywane i udostępniane społeczności globalnej. Projekt ten, nazwany Open-R1, ma na celu nie tylko odtworzenie możliwości oryginalnego modelu, ale także zrobienie tego w sposób przezroczysty i zgodnie z zasadami otwarte źródło.

Model DeepSeek-R1 opracowany przez chińską firmę, wzbudził duże oczekiwania w świecie technologii ze względu na złożoność algorytmów uczenia się przez wzmacnianie. Jednakże model ten stwarza szereg barier pod względem przezroczystość, takich jak brak otwartych danych i szczegółów na temat ich szkolenia. W obliczu tej sytuacji Hugging Face stawia na otwartą alternatywę, która umożliwia badaczom i twórcom pracę w środowisku współpracy.

Ekskluzywna zawartość — kliknij tutaj  Jak zainstalować Qwen AI lokalnie w systemie Windows 11

Czym jest Open-R1 i w jaki sposób planujecie go rozwijać?

Projekt Hugging Face sklonuje DeepSeek

Open-R1 ma być funkcjonalną repliką DeepSeek-R1ale z funkcjami promującymi współpracę innowacyjną i powtarzalność badań nad sztuczną inteligencją. Jak twierdzi Leandro von Werra, szef działu badań w Hugging Face, celem jest przezwyciężenie wyzwań stawianych przez modele „czarnej skrzynki” i dostarczenie narzędzi niezbędnych innym do prowadzenia własnych badań.

Zespół będzie korzystał z klastra naukowego Hugging Face, który zawiera 768 Procesor graficzny Nvidia H100, aby wytworzyć zbiory danych możliwie najbardziej podobne do tych pierwotnie używanych przez DeepSeek. Ponadto zapraszają społeczność globalną do udziału w rozwoju projektu, podkreślając, że różne perspektywy są kluczem do rozwiązania złożonych problemów.

Podejście do otwartości i przejrzystości

Przytulanie twarzy Open-R1

Chociaż DeepSeek-R1 ma pewne otwarte elementyjako licencja zezwalająca, Podstawowe szczegóły modelu nie są w pełni dostępne, co utrudnia powtórzenie i dogłębne badanie. Inżynier Elie Bakouch zauważył, że brak otwartych zbiorów danych i udokumentowanych eksperymentów ogranicza potencjał społeczności naukowej do rozwoju w tej dziedzinie.

Ekskluzywna zawartość — kliknij tutaj  Google Scholar Labs: Tak działa nowe wyszukiwanie akademickie oparte na sztucznej inteligencji

Dzięki Open-R1 Hugging Face nie tylko stara się pokonać te ograniczenia, ale także Zachęcaj do globalnej współpracy. „Wspólny wysiłek może mieć znaczenie w rozwiązywaniu złożonych problemów” – powiedział von Werra, podkreślając znaczenie dzielenie się wiedzą w społeczności open source.

Jakie wyzwania stawia ta inicjatywa?

Model replikowany DeepSeek-R1

Jak każdy projekt typu open source, Open-R1 nie jest wolny od krytyki. Niektórzy eksperci wyrazili obawy dotyczące potencjalnego niewłaściwego wykorzystania tak zaawansowanego modelu.

W odpowiedzi twórcy Hugging Face uważają, że Korzyści płynące z otwartej platformy przewyższają ryzyko. Według Bakoucha „Po replikacji architektury R1 będzie dostępny dla każdego, kto posiada niezbędne zasoby komputerowe«.

Pod względem infrastruktury projekt nie tylko ma na celu odtworzenie oryginalnego modelu, ale także zapewnić solidne podstawy dla przyszłego rozwoju. Może to obejmować zarówno poprawę wydajności, jak i nowe praktyczne zastosowania w dziedzinie sztucznej inteligencji.

Ekskluzywna zawartość — kliknij tutaj  OpenAI otwiera drzwi do erotycznego ChatGPT z weryfikacją wieku

Wpływ na branżę technologiczną

Hugging Face otwarty klon DeepSeek-0

Inicjatywa Hugging Face może mieć istotne znaczenie dla branży technologicznej. Oferując replikowany model DeepSeek-R1, ale z całkowicie otwartą infrastrukturą i podejściem, Open-R1 może stanowić punkt zwrotny w sposobie opracowywania i udostępniania modeli sztucznej inteligencji.

Ponadto projekt ten może służyć jako przykład dla innych firm i organizacji, które mogą pójść podobną drogą, promując Większa przejrzystość i współpraca w tak ważnym obszarze jak sztuczna inteligencja.

Połączenie zasobów o wysokiej wydajności, aktywnej społeczności i zaangażowania w stanowiska open source Open-R1 jako projekt, który ma potencjał nie tylko replikować DeepSeek-R1ale także Przewodzenie zmianom w kierunku bardziej inkluzywnego i dostępnego przemysłu.