Mistral 3: la nova onada de models oberts per a IA distribuïda

Darrera actualització: 04/12/2025

  • Mistral 3 reuneix deu models oberts, des d'un frontier multimodal fins a la sèrie compacta Ministral 3.
  • L'arquitectura Mixture of Experts permet alta precisió amb menys consum i desplegaments eficients a edge.
  • Els models petits poden executar-se offline en una sola GPU o dispositius amb pocs recursos, reforçant la sobirania digital.
  • Europa guanya pes a IA gràcies a l'enfocament obert de Mistral i les seves aliances amb organismes públics i empreses.
Mistral 3

La startup francesa Mistral AI s'ha col·locat al centre del debat sobre la intel·ligència artificial a Europa amb el llançament de Mistral 3, una nova família de models oberts pensats per funcionar tant a grans centres de dades com a dispositius amb recursos molt limitats. Lluny d'entrar a una carrera cega per la mida dels models, la companyia aposta per una intel·ligència distribuïda que pugui executar-se on calgui: al núvol, a l'edge o fins i tot sense connexió a internet.

Aquesta estratègia col·loca a Mistral com una de les poques alternatives europees capaces de plantar cara a gegants com OpenAI, Google o Anthropic, i oferir alternatives a ChatGPT, però des d'una òptica diferent: models open-weight sota llicència permissiva, adaptables a les necessitats d'empreses i administracions públiques, i amb un fort focus en idiomes europeus i desplegaments sobirans dins del continent.

Què és Mistral 3 i per què és rellevant?

Família de models Mistral 3

la família Mistral 3 està formada per deu models open weight alliberats sota llicència Apache 2.0, el que permet el seu ús comercial gairebé sense restriccions. Inclou un model insígnia de tipus frontier, Mistral Large 3, i una línia de models compactes sota la marca Ministral 3, que es presenten en tres mides aproximades (14.000, 8.000 i 3.000 milions de paràmetres) i diverses variants segons el tipus de tasca.

La novetat clau és que el model gran no es limita al text: Mistral Large 3 és multimodal i multilingüe, capaç de treballar amb text i imatges dins de la mateixa arquitectura i amb suport robust per a idiomes europeus. A diferència d'altres enfocaments que combinen models de llenguatge i visió per separat, aquí s'aposta per un únic sistema integrat que pot analitzar documents extensos, comprendre imatges i actuar com a assistent avançat per a tasques complexes.

Al mateix temps, la sèrie Ministral 3 està dissenyada per funcionar a escenaris on l'accés al núvol és limitat o directament inexistent. Aquests models es poden executar en dispositius amb prou feines 4 GB de memòria o en una sola GPU, cosa que obre la porta al seu ús en portàtils, mòbils, robots, drones o sistemes encastats sense dependre d'una connexió constant a Internet ni de proveïdors externs.

Per a l'ecosistema europeu, on la conversa sobre sobirania digital i control de dades és molt present, aquesta combinació de model frontier obert i models lleugers desplegables localment resulta especialment rellevant, tant per a empreses privades com per a administracions públiques que busquen alternatives a les grans plataformes nord-americanes i xineses.

Arquitectura Mixture of Experts i enfocament tècnic

Capacitats Mistral 3

El cor tècnic de Mistral Large 3 és una arquitectura de Mescla d'experts (MoE), un disseny en què el model compta amb múltiples «experts» interns, però només activa una part per processar cada token. A la pràctica, el sistema maneja 41.000 milions de paràmetres actius més d'un total de 675.000 Milions, cosa que permet combinar gran capacitat de raonament amb un consum energètic i de còmput més controlat que un model dens equivalent.

Contingut exclusiu - Clic Aquí  Xbox introdueix Copilot for Gaming: la IA que transformarà lexperiència de joc

Aquesta arquitectura, unida a una finestra de context de fins a 256.000 tokens, permet que Mistral Large 3 processi volums d'informació molt amplis, com ara contractes extensos, documentació tècnica o grans bases de coneixement corporatives. El model s'orienta a casos d'ús com anàlisi de documents, assistència en programació, creació de contingut, agents d'IA i automatització de fluxos de treball.

En paral·lel, els models Ministral 3 s'ofereixen en tres variants principals: Base (model preentrenat genèric), Instruir (optimitzat per a conversa i tasques d'assistent) i Raonament (ajustat per a raonament lògic i anàlisis més profundes). Totes les versions suporten visió i manegen contextos amplis —entre 128K i 256K tokens—, mantenint compatibilitat amb múltiples idiomes.

La idea de fons, segons explica el cofundador i científic en cap Guillaume Lample, és que en «més del 90%» dels casos d'ús empresarials, un model petit ben afinat és suficient i, a més, més eficient. Mitjançant tècniques com l'ús de dades sintètiques per a tasques concretes, la companyia defensa que aquests models poden acostar-se o fins i tot superar opcions tancades més grans en aplicacions molt específiques, reduint alhora costos, latència i riscos per a la privadesa.

Tot aquest ecosistema s'integra amb una gamma més àmplia de productes de la companyia: des de Mistral Agents API, amb connectors per a execució de codi, cerca web o generació d'imatges, fins Mistral Code per assistència al programador, el model de raonament Magistral i la plataforma Estudi d'IA per desplegar aplicacions, gestionar analítiques i mantenir registres dús.

Col·laboració amb NVIDIA i desplegament en supercòmput i edge

Mistral AI i NVIDIA

Un element destacat del llançament és l'aliança entre Mistral AI i NVIDIA, que situa Mistral 3 com una família de models afinada per als sistemes de supercòmput i plataformes edge del fabricant nord-americà. Mistral Large 3, combinat amb infraestructures com NVIDIA GB200 NVL72, obté segons NVIDIA millores de rendiment de fins a deu vegades respecte a la generació anterior basada en GPU H200, aprofitant paral·lelisme avançat, memòria compartida mitjançant NVLink i formats numèrics optimitzats com NVFP4.

El treball conjunt no es queda al costat de maquinari dalt nivell. La sèrie Ministral 3 s'ha optimitzat per funcionar amb rapidesa en entorns com PCs i portàtils amb GPUs RTX, dispositius Jetson i plataformes edge, facilitant inferències locals en escenaris industrials, de robòtica o de consum. Frameworks populars com Truca.cpp i Ollama s'han adaptat per treure partit a aquests models, fet que simplifica el seu desplegament per part de desenvolupadors i equips d'IT.

A més, la integració amb l'ecosistema NVIDIA NeMo —incloent eines com Data Designer, Guardrails i Agent Toolkit— permet a les empreses realitzar fine-tuning, control de seguretat, orquestració d'agents i disseny de dades sobre la base de Mistral 3. Alhora, s'han optimitzat motors d'inferència com TensorRT-LLM, SGLang i vLLM per reduir el cost per token i millorar-ne l'eficiència energètica.

Els models Mistral 3 ja estan disponibles als principals proveïdors cloud i repositoris oberts, i arribaran també en forma de microserveis NIM dins del catàleg de NVIDIA, una cosa especialment interessant per a empreses europees que ja operen sobre stacks d'aquest fabricant i volen adoptar IA generativa amb més control sobre el desplegament.

Tot aquest entramat fa que Mistral 3 pugui viure tant als grans centres de dades com a dispositius de vora, reforçant la seva narrativa d'una IA realment ubiqua i distribuïda, menys dependent de serveis remots i més adaptada a les necessitats concretes de cada client.

Contingut exclusiu - Clic Aquí  Emmagatzematge virtual: L'opció més econòmica

Models petits, desplegament offline i casos d'ús a l'edge

Models Mistral 3 d'intel·ligència artificial

Un dels pilars del discurs de Mistral és que la majoria d'aplicacions reals no necessiten el model més gran possible, sinó un que encaixi bé amb el cas dús i pugui afinar-se amb dades pròpies. Aquí entren en joc els nou models de la sèrie Ministral 3, densos, d'alt rendiment i disponibles en diferents mides i variants per ajustar-se a requisits de cost, velocitat o capacitat.

Aquests models estan pensats per funcionar a una sola GPU o fins i tot en maquinari modest, el que permet desplegaments locals a servidors propis, ordinadors portàtils, robots industrials o dispositius que operen en entorns remots. Per a empreses que manegen informació sensible —des de fabricants fins a entitats financeres o administracions—, poder executar la IA dins de la seva pròpia infraestructura, sense enviar dades al núvol, és un avantatge significatiu.

La companyia cita exemples com robots de fàbrica que analitzen dades de sensors en temps real sense connectar-se a internet, drones per a emergències i rescats, vehicles amb assistents de IA plenament funcionals a zones sense cobertura o eines educatives que ofereixen ajuda offline a estudiants. En processar les dades directament al dispositiu, es reforça a més la privadesa i el control de la informació dels usuaris.

Lample insisteix que l'accessibilitat és part central de la missió de Mistral: n'hi ha milers de milions de persones amb mòbil o portàtil però sense accés fiable a internet, que podrien beneficiar-se de models capaços dexecutar-se en local. D'aquesta manera, la companyia intenta allunyar la idea que la IA avançada sempre ha d'estar lligada a grans centres de dades en mans d'un petit grup d'empreses.

En paral·lel, Mistral ha començat a treballar amb socis internacionals en l'àmbit de la trucada IA física. Entre les col·laboracions esmentades figuren l'agència de ciència i tecnologia HTX de Singapur per a robots, ciberseguretat i sistemes de protecció contra incendis; l'alemanya Helsing, centrada en defensa, amb models de visió-llenguatge-acció per a drones; i fabricants del sector de l'automoció que busquen assistents d'IA a l'habitacle més eficients i controlables.

Impacte a Europa: sobirania digital i ecosistema publicoprivat

Més enllà de la part tècnica, Mistral ha esdevingut un referent del debat sobre sobirania digital a Europa. Tot i que la companyia es defineix com una «col·laboració transatlàntica» —amb equips i entrenament de models repartits entre Europa i els Estats Units—, la seva aposta per models oberts i amb fort suport per a idiomes europeus ha estat ben rebuda per institucions públiques del continent.

L'empresa ha tancat acords amb l'exèrcit francès, l'agència pública d'ocupació de França, el govern de Luxemburg i altres organitzacions europees interessades a desplegar IA sota marcs regulatoris estrictes i mantenint el control de les dades en territori comunitari. En paral·lel, la Comissió Europea n'ha presentat una estratègia per impulsar eines d'IA europees que reforcin la competitivitat industrial sense renunciar a la seguretat i la resiliència.

El context geopolític també empeny la regió a reaccionar. Es reconeix que Europa ha anat darrere dels Estats Units i la Xina a la carrera pels models d'última generació, mentre a països com la Xina estan sorgint alternatives obertes com DeepSeek, Alibaba o Kimi, que comencen a competir amb solucions com ChatGPT en certes tasques. Mistral intenta cobrir part d'aquest lloc amb models oberts, polivalents i alineats amb les necessitats reguladores europees.

Contingut exclusiu - Clic Aquí  Com desar marcadors amb HiDrive?

Financerament, la startup ha recaptat al voltant de 2.700 milions de dòlars i s'ha mogut en valoracions properes als 14.000 Milions, xifres molt inferiors a les de gegants com OpenAI o Anthropic però significatives per a l'ecosistema europeu. Bona part del model de negoci passa per oferir, més enllà dels pesos oberts, serveis de personalització, eines de desplegament i productes empresarials com l'API Mistral Agents o la suite Le Chat amb integracions corporatives.

El posicionament és clar: ser un proveïdor d'infraestructura d'IA oberta i flexible que permeti a empreses europees (i d'altres regions) innovar sense dependre del tot de plataformes nord-americanes, mantenint un cert control sobre on i com s'executen els models, i facilitant integracions amb eines ja implantades als seus sistemes.

Debat sobre obertura real i reptes pendents

Tot i l'entusiasme que genera Mistral 3 en part de la comunitat tecnològica, no falten veus crítiques que qüestionen fins a quin punt aquests models es poden considerar veritablement «de codi obert». La companyia s'ha decantat per un enfocament open weight: allibera els pesos per a ús i adaptació, però no necessàriament tots els detalls sobre les dades d'entrenament i els processos interns necessaris per reproduir el model des de zero.

Investigadors com Andreas Liesenfeld, cofundador de l'European Open Source AI Index, assenyalen que el gran coll d'ampolla per a la IA a Europa no és només l'accés a models, fins que dades d'entrenament a gran escala. Des d'aquesta òptica, Mistral 3 contribueix a millorar l'oferta de models utilitzablesperò no resol del tot el problema de fons d'un ecosistema europeu que continua tenint dificultats per generar i compartir datasets massius de qualitat.

Des de la mateixa Mistral s'admet que els models oberts de la casa van «una mica per darrere» de les solucions tancades més avançades, però insisteix que la bretxa s'està reduint ràpidament i que el punt clau és la relació cost-benefici: si un model una mica menys potent es pot desplegar amb baix cost, afinar-se per a una tasca concreta i executar-se a prop de l'usuari, pot resultar més interessant per a moltes empreses que un model top a què només s'accedeix via API remota.

Tot i així, persisteixen desafiaments: des de la competència internacional ferotge fins a la necessitat de garantir seguretat, traçabilitat i compliment normatiu en contextos com el sanitari, financer o governamental. L'equilibri entre obertura, control i responsabilitat continuarà marcant el pas de Mistral i de la resta d'actors europeus els propers anys.

El llançament de Mistral 3 consolida la idea que la IA d'avantguarda no ha de limitar-se a models gegants i tancats, i ofereix a Europa —ia qualsevol organització que valori la sobirania tecnològica— una paleta d'eines obertes que combinen un model frontier multimodal amb una gamma de models lleugers capaços de funcionar a l'edge, fora de línia i amb un nivell de personalització difícil d'igualar per les plataformes purament propietàries.

Com utilitzar el teu PC com a hub local d'IA
Article relacionat:
Com utilitzar el teu PC com a hub local d'IA: Guia pràctica i comparativa