Hugging Face llança un clon obert del model DeepSeek-R1

Darrera actualització: 03/02/2025

  • Hugging Face treballa a Open-R1, un clon de codi obert de DeepSeek-R1.
  • L'objectiu és millorar la transparència i la reproductibilitat en la investigació d'intel·ligència artificial.
  • El projecte busca superar les limitacions dels models de “caixa negra”.
  • Es farà servir un clúster d'alt rendiment amb 768 GPU Nvidia H100 per a la replicació.
clon obert de DeepSeek-R1

Hugging Face ha decidit assumir el desafiament de replicar el model de raonament avançat DeepSeek-R1, una iniciativa que promet fer un gir a la manera com les eines d'intel·ligència artificial són desenvolupades i compartides amb la comunitat global. Aquest projecte, batejat com a Open-R1, té com a objectiu no només reproduir les capacitats del model original, sinó també fer-ho de manera transparent i d'acord amb els principis del codi obert.

El model DeepSeek-R1, desenvolupat per una empresa xinesa, ha generat gran expectació a l'àmbit tecnològic a causa de la complexitat dels seus algorismes d'aprenentatge per reforç. No obstant això, aquest model presenta diverses barreres en termes de transparència, com la manca de dades obertes i detalls sobre el seu entrenament. Davant d'aquesta situació, Hugging Face aposta per una alternativa oberta que permeti a investigadors i desenvolupadors treballar en un entorn col·laboratiu.

Contingut exclusiu - Clic Aquí  Què és Humata AI i com analitzar PDFs complexos sense llegir-ho tot

Què és Open-R1 i com planegen desenvolupar-lo?

Projecte de Hugging Face per clonar DeepSeek

Open-R1 pretén ser una rèplica funcional de DeepSeek-R1, però amb característiques que promoguin la innovació col·laborativa i la reproductibilitat en la investigació d'IA. Segons declaracions de Leandro von Werra, cap de recerca de Hugging Face, l'objectiu és superar els desafiaments imposats pels models de «caixa negra» i proporcionar les eines necessàries perquè altres puguin fer les seves pròpies investigacions.

L'equip utilitzarà el Science Cluster de Hugging Face, que compta amb 768 GPU Nvidia H100, per produir conjunts de dades que siguin el més similars possibles als utilitzats originalment per DeepSeek. A més, conviden a la comunitat global a participar en el desenvolupament del projecte, destacant que les perspectives diverses són clau per resoldre problemes complexos.

Un enfocament cap a l'obertura i la transparència

Hugging face Open-R1

Tot i que DeepSeek-R1 compta amb certs elements oberts, com una llicència permissiva, els detalls fonamentals del model no estan completament disponibles, cosa que dificulta la replicació i l'estudi en profunditat. L'enginyer Elie Bakouch ha assenyalat que la manca de conjunts de dades obertes i experiments documentats limita el potencial de la comunitat investigadora per avançar en aquest camp.

Contingut exclusiu - Clic Aquí  Com utilitzar les Gems de Gemini per optimitzar les teves tasques diàries: 4 funcions principals

Amb Open-R1, Hugging Face busca no només superar aquestes limitacions, sinó també incentivar una col·laboració global. «Un esforç col·lectiu pot marcar la diferència en abordar problemes complexos», va afirmar von Werra, destacant la importància de compartir coneixement dins de la comunitat de codi obert.

Quins reptes presenta aquesta iniciativa?

model replicat de DeepSeek-R1

Com qualsevol projecte de codi obert, Open-R1 no està exempt de crítiques. Alguns experts han expressat la seva preocupació pel possible ús indegut que es podria donar a un model tan avançat.

En resposta, els desenvolupadors de Hugging Face consideren que els beneficis duna plataforma oberta superen els riscos. Segons Bakouch, «un cop replicat l'arquitectura de R1, serà accessible per a qualsevol amb els recursos computacionals necessaris«.

En termes d'infraestructura, el projecte no només cerca replicar el model original, sinó també proporcionar una base sòlida per al desenvolupament futur. Això podria incloure tant millores en el rendiment com noves aplicacions pràctiques a l'àmbit de la intel·ligència artificial.

Contingut exclusiu - Clic Aquí  Google desenvolupa Gemini Kids: una IA adaptada a l'aprenentatge infantil

Impacte a la indústria tecnològica

Hugging Face clon obert de DeepSeek-0

La iniciativa de Hugging Face pot tenir implicacions significatives a la indústria tecnològica. En oferir un model replicat de DeepSeek-R1, però amb una infraestructura i un enfocament completament oberts, Open-R1 podria marcar un abans i un després en la manera com es desenvolupen i comparteixen els models d'IA.

A més, aquest projecte podria servir com un exemple perquè altres empreses i organitzacions segueixin un camí similar, promovent-ne una major transparència i col·laboració en una àrea crítica com és la intel·ligència artificial.

La combinació de recursos d'alt rendiment, una comunitat activa i el compromís amb el codi obert posiciona a Open-R1 com un projecte amb el potencial de no només replicar DeepSeek-R1, Sinó també de liderar un canvi cap a una indústria més inclusiva i accessible.