Mistral 3: ang bagong wave ng mga bukas na modelo para sa distributed AI

Huling pag-update: 04/12/2025

  • Pinagsasama-sama ng Mistral 3 ang sampung bukas na modelo, mula sa isang multimodal na hangganan hanggang sa compact na serye ng Ministral 3.
  • Ang arkitektura ng Mixture of Experts ay nagbibigay-daan sa mataas na katumpakan na may mas mababang paggamit ng kuryente at mahusay na pag-deploy sa gilid.
  • Maaaring tumakbo offline ang mas maliliit na modelo sa iisang GPU o mga device na mababa ang mapagkukunan, na nagpapatibay sa digital na soberanya.
  • Ang Europa ay nakakakuha ng lupa sa AI salamat sa bukas na diskarte ng Mistral at sa pakikipagtulungan nito sa mga pampublikong katawan at kumpanya.
Mistral 3

Ang French startup Mistral AI Inilagay nito ang sarili sa gitna ng debate sa artificial intelligence sa Europe kasama ang Paglulunsad ng Mistral 3Isang bagong pamilya ng mga bukas na modelo na idinisenyo upang gumana sa parehong malalaking data center at mga device na may napakalimitadong mapagkukunan. Malayo sa pagpasok sa isang blind race para sa laki ng modelo, ang kumpanya Nagsusulong ito para sa distributed intelligence na maaaring ipatupad kung saan kinakailangan.: sa cloud, sa gilid, o kahit na walang koneksyon sa internet.

Ang diskarte na ito ay naglalagay Ang Mistral bilang isa sa ilang mga alternatibong European na may kakayahang tumayo sa mga higante tulad ng OpenAI, Google o Anthropic, at alok mga alternatibo sa ChatGPTNgunit mula sa ibang pananaw: open-weight na mga modelo sa ilalim ng permissive na lisensyanaaangkop sa mga pangangailangan ng mga kumpanya at pampublikong administrasyon, at may matinding pagtutok sa mga wikang Europeo at mga sovereign deployment sa loob ng kontinente.

Ano ang Mistral 3 at bakit ito nauugnay?

Mistral 3 modelong pamilya

Ang pamilya Mistral 3 Ito ay nabuo sa pamamagitan ng sampung modelo ng bukas na timbang inilabas sa ilalim ng Apache License 2.0Nagbibigay-daan ito para sa komersyal na paggamit nito nang halos walang mga paghihigpit. May kasama itong flagship na Frontier-type na modelo. Mistral Large 3at isang linya ng mga compact na modelo sa ilalim ng tatak Ministerial 3na may tatlong tinatayang laki (14.000, 8.000 at 3.000 milyong parameter) at ilang variant depende sa uri ng gawain.

Ang pangunahing pagbabago ay ang malaking modelo ay hindi limitado sa teksto: Ang Mistral Large 3 ay multimodal at multilingualIto ay may kakayahang magtrabaho kasama ang teksto at mga larawan sa loob ng parehong arkitektura at nag-aalok ng matatag na suporta para sa mga wikang European. Hindi tulad ng iba pang mga diskarte na pinagsasama-sama ang mga modelo ng wika at paningin, umaasa ang isang ito sa isang pinagsamang sistema na maaaring magsuri ng malalaking dokumento, maunawaan ang mga larawan, at kumilos bilang isang advanced na katulong para sa mga kumplikadong gawain.

Kasabay nito, ang serye Ministerial 3 Idinisenyo ito upang gumana sa mga sitwasyon kung saan limitado o wala ang cloud access. Ang mga modelong ito ay maaaring tumakbo sa mga device na may kasing liit 4 GB ng memorya o sa isang GPU, na nagbubukas ng pinto sa paggamit nito mga laptop, mobile phone, robot, drone, o mga naka-embed na system nang hindi umaasa sa patuloy na koneksyon sa internet o mga panlabas na provider.

Para sa European ecosystem, kung saan ang pag-uusap tungkol sa digital na soberanya at kontrol ng data Ang kumbinasyong ito ng isang open frontier na modelo at mga locally deployable na magaan na modelo ay napaka-present at partikular na nauugnay, kapwa para sa mga pribadong kumpanya at pampublikong administrasyon na naghahanap ng mga alternatibo sa malalaking platform ng US at Chinese.

Arkitektura, Pinaghalong Eksperto, at Teknikal na Pagdulog

Mga Kakayahang Mistral 3

Ang teknikal na puso ng Mistral Large 3 ay isang arkitektura ng Mixture of Experts (MoE), isang disenyo kung saan ang modelo Mayroon itong maraming panloob na "eksperto".Pero ina-activate lamang ang isang bahagi ng mga ito upang iproseso ang bawat tokenSa pagsasagawa, pinangangasiwaan ng system 41.000 bilyong aktibong parameter sa kabuuan ng 675.000 millonesNagbibigay-daan ito para sa pagsasama-sama ng mataas na kapasidad sa pangangatwiran na may higit na kontroladong pagkonsumo ng enerhiya at pag-compute kaysa sa isang katumbas na modelong siksik.

Eksklusibong nilalaman - Mag-click Dito  Ano ang SearchGPT at kung paano gumagana ang bagong AI-based na search engine

Ang arkitektura na ito, na sinamahan ng isang window ng konteksto na hanggang 256.000 tokenNagbibigay-daan ito sa Mistral Large 3 na magproseso ng napakalaking dami ng impormasyon, tulad ng mahahabang kontrata, teknikal na dokumentasyon, o malalaking corporate knowledge base. Ang modelo ay nakatuon sa mga kaso ng paggamit tulad ng pagsusuri ng dokumento, tulong sa programming, paggawa ng nilalaman, mga ahente ng AI, at automation ng daloy ng trabaho.

Sa parallel, ang mga modelo Ministerial 3 Inaalok ang mga ito sa tatlong pangunahing variant: Base (generic na pretrained na modelo), Tagubilin (na-optimize para sa pag-uusap at mga katulong na gawain) at pangangatwiran (Inaayos para sa lohikal na pangangatwiran at mas malalim na pagsusuri). Sinusuportahan ng lahat ng mga bersyon pangitain at pinangangasiwaan nila ang malawak na konteksto —sa pagitan ng 128K at 256K na mga token—, habang pinapanatili ang pagiging tugma sa maraming wika.

Ang pinagbabatayan na ideya, tulad ng ipinaliwanag ng co-founder at punong siyentipiko na si Guillaume Lample, ay na sa "higit sa 90%" ng mga kaso ng paggamit ng negosyo, Ang isang maliit, maayos na modelo ay sapat na. at, bukod dito, mas mahusay. Sa pamamagitan ng mga teknik tulad ng paggamit ng sintetikong data para sa mga partikular na gawainAng kumpanya ay nangangatwiran na ang mga modelong ito ay maaaring lumapit o kahit na malampasan ang mas malaki, saradong mga opsyon sa napaka-tiyak na mga application, habang binabawasan ang mga gastos, latency, at mga panganib sa privacy.

Ang buong ecosystem na ito ay isinama sa mas malawak na hanay ng mga produkto ng kumpanya: mula sa Mistral Agents APIna may mga konektor para sa pagpapatupad ng code, paghahanap sa web, o pagbuo ng imahe, hanggang sa Mistral Code Para sa tulong ng programmer, ang modelo ng pangangatwiran Mahusay at ang platform AI Studio upang mag-deploy ng mga application, pamahalaan ang analytics, at mapanatili ang mga log ng paggamit.

Pakikipagtulungan sa NVIDIA at pag-deploy sa supercomputing at edge computing

Mistral AI at NVIDIA

Ang isang highlight ng paglulunsad ay ang alyansa sa pagitan Mistral AI at NVIDIA, na nagpoposisyon sa Mistral 3 bilang isang pamilya ng mga modelong nakaayos para sa mga supercomputing system at edge platform ng American manufacturer. Mistral Large 3pinagsama sa imprastraktura tulad ng NVIDIA GB200 NVL72, ayon sa NVIDIA pagpapabuti ng pagganap ng hanggang sampung beses kumpara sa nakaraang henerasyon batay sa mga H200 GPU, sinasamantala ang advanced parallelism, shared memory sa pamamagitan ng NVLink, at mga naka-optimize na numerical na format gaya ng NVFP4.

Ang pagtutulungang gawain ay hindi tumitigil sa high-end na hardware. Ang serye Ministerial 3 Ito ay na-optimize upang tumakbo nang mabilis sa mga kapaligiran tulad ng Mga PC at laptop na may mga RTX GPU, Jetson device, at edge platformpinapadali ang mga lokal na hinuha sa mga pang-industriya, robotics, o mga senaryo ng consumer. Mga sikat na balangkas tulad ng Llama.cpp at Ollama Ang mga ito ay iniakma upang samantalahin ang mga modelong ito, na nagpapasimple sa kanilang pag-deploy ng mga developer at IT team.

Higit pa rito, pagsasama sa ecosystem NVIDIA NeMo —kabilang ang mga tool tulad ng Data Designer, Guardrails, at Agent Toolkit—ay nagbibigay-daan sa mga kumpanya na gumanap fine-tuning, kontrol sa seguridad, orkestrasyon ng ahente, at disenyo ng data batay sa Mistral 3. Kasabay nito, ang mga inference engine tulad ng TensorRT-LLM, SGLang at vLLM upang bawasan ang gastos sa bawat token at pagbutihin ang kahusayan sa enerhiya.

Ang mga modelo ng Mistral 3 ay magagamit na ngayon sa mga pangunahing retailer cloud provider at bukas na mga repositoryoat darating din sila sa anyo ng Mga microservice ng NIM sa loob ng katalogo ng NVIDIA, isang bagay na partikular na kawili-wili para sa mga kumpanyang European na nagpapatakbo na sa mga stack ng manufacturer na ito at gustong gumamit ng generative AI na may higit na kontrol sa pag-deploy.

Ang lahat ng balangkas na ito ay nagbibigay-daan sa Mistral 3 na manirahan pareho sa malalaking data center at sa mga edge device, na nagpapatibay sa salaysay nito ng isang tunay na nasa lahat ng dako at ipinamahagi na AI, hindi gaanong umaasa sa mga malalayong serbisyo at mas inangkop sa mga partikular na pangangailangan ng bawat kliyente.

Eksklusibong nilalaman - Mag-click Dito  Paano samantalahin ang task manager sa IONOS?

Mga maliliit na modelo, offline na pag-deploy, at mga kaso ng paggamit sa gilid

Mistral 3 mga modelo ng artificial intelligence

Isa sa mga haligi ng diskurso ni Mistral ay iyon Karamihan sa mga real-world na application ay hindi nangangailangan ng pinakamalaking posibleng modelo.ngunit isa na angkop na angkop sa kaso ng paggamit at maaaring maayos sa partikular na data. Doon papasok ang siyam na modelo sa serye. Ministerial 3siksik, mataas ang pagganap, at available sa iba't ibang laki at variant upang umangkop sa mga kinakailangan sa gastos, bilis, o kapasidad.

Ang mga modelong ito ay idinisenyo upang gumana isang GPU o kahit na sa katamtamang hardwareNagbibigay-daan ito para sa mga lokal na deployment sa mga in-house na server, laptop, pang-industriya na robot, o device na tumatakbo sa mga malalayong kapaligiran. Para sa mga kumpanyang nangangasiwa ng sensitibong impormasyon—mula sa mga tagagawa hanggang sa mga institusyong pampinansyal o ahensya ng gobyerno—ang kakayahang magpatakbo ng AI sa loob ng kanilang sariling imprastraktura, nang hindi nagpapadala ng data sa cloud, ay isang malaking kalamangan.

Ang kumpanya ay nagbanggit ng mga halimbawa tulad ng Mga factory robot na nagsusuri ng data ng sensor sa real time nang walang koneksyon sa internet, mga drone para sa mga emerhensiya at rescue, mga sasakyan na may mga fully functional na AI assistant sa mga lugar na walang coverage o mga tool na pang-edukasyon na nag-aalok ng offline na tulong sa mga mag-aaral. Sa pamamagitan ng pagpoproseso ng data nang direkta sa device, ang privacy at kontrol ng impormasyon ng mga gumagamit.

Iginiit ni Lample na ang accessibility ay isang sentral na bahagi ng misyon ng Mistral: mayroon Bilyun-bilyong tao na may mga mobile phone o laptop ngunit walang maaasahang internet accessna maaaring makinabang mula sa mga modelong may kakayahang tumakbo nang lokal. Sa ganitong paraan, sinusubukan ng kumpanya na iwaksi ang paniwala na ang advanced AI ay dapat palaging nakatali sa malalaking data center na kinokontrol ng isang maliit na grupo ng mga kumpanya.

Kaayon, nagsimulang magtrabaho ang Mistral sa mga internasyonal na kasosyo sa lugar ng kung ano ang kilala bilang Pisikal na AIKabilang sa mga pakikipagtulungang binanggit ay ang HTX science and technology agency ng Singapore para sa mga robot, cybersecurity, at fire protection system; at ang Aleman Helsing, na nakatuon sa pagtatanggol, na may mga modelo ng pagkilos sa vision-language para sa mga drone; at naghahanap ng mga automotive manufacturer AI assistants sa cabin mas mahusay at nakokontrol.

Epekto sa Europe: digital sovereignty at public-private ecosystem

Higit pa sa teknikal na aspeto, naging benchmark ang Mistral sa debate sa Digital na soberanya sa EuropaBagama't tinukoy ng kumpanya ang sarili nito bilang isang "transatlantic collaboration" —na may mga koponan at modelong pagsasanay na kumalat sa pagitan ng Europa at Estados Unidos—, ang pangako nitong magbukas ng mga modelo na may malakas na suporta para sa mga wikang European ay tinanggap ng mga pampublikong institusyon sa kontinente.

Ang kumpanya ay nagsara ng mga deal sa ang hukbong Pranses, ang ahensya ng pampublikong pagtatrabaho sa Pransya, ang pamahalaan ng Luxembourg, at iba pang mga organisasyong European interesado sa pag-deploy ng AI sa ilalim ng mahigpit na mga balangkas ng regulasyon at pagpapanatili ng kontrol sa data sa loob ng EU. Sa parallel, ang European Commission ay nagpakita ng isang diskarte upang mapalakas ang mga tool sa AI sa Europa na nagpapalakas sa industriyal na kompetisyon nang hindi isinasakripisyo ang kaligtasan at katatagan.

Ang geopolitical na konteksto ay nagtutulak din sa rehiyon na mag-react. Ito ay kinikilala na Ang Europa ay nahulog sa likod ng Estados Unidos at China Sa karera para sa mga susunod na henerasyong modelo, habang sa mga bansang tulad ng China ay umuusbong ang mga bukas na alternatibo gaya ng DeepSeek, Alibaba, at Kimi at nagsisimulang makipagkumpitensya sa mga solusyon tulad ng ChatGPT sa ilang partikular na gawain, sinusubukan ng Mistral na punan ang bahagi ng puwang na iyon ng bukas, maraming nalalaman na mga modelo na nakahanay sa mga kinakailangan sa regulasyon ng Europa.

Eksklusibong nilalaman - Mag-click Dito  Paano gamitin ang Google Drive upang mag-imbak ng mga presentasyon?

Sa pananalapi, ang startup ay tumaas sa paligid 2.700 milyong at lumipat sa loob ng mga valuation malapit sa 14.000 millonesAng mga figure na ito ay malayong mas mababa kaysa sa mga higante tulad ng OpenAI o Anthropic, ngunit makabuluhan para sa European ecosystem. Ang isang malaking bahagi ng modelo ng negosyo ay nagsasangkot ng pag-aalok, lampas sa mga bukas na timbang, mga serbisyo sa pagpapasadya, mga tool sa pag-deploy, at mga produkto ng enterprise gaya ng Mistral Agents API o ang Le Chat suite na may mga corporate integration.

Malinaw ang pagpoposisyon: ang maging a provider ng bukas at flexible na imprastraktura ng AI na nagbibigay-daan sa mga kumpanyang European (at iba pang rehiyonal) na mag-innovate nang hindi lubos na umaasa sa mga platform ng US, habang pinapanatili ang ilang kontrol sa kung saan at paano pinapatakbo ang mga modelo, at pinapadali ang mga pagsasama sa mga tool na ipinatupad na sa kanilang mga system.

Debate sa tunay na pagiging bukas at mga nakabinbing hamon

Sa kabila ng sigasig na nabubuo ng Mistral 3 sa bahagi ng komunidad ng teknolohiya, walang kakulangan ng mga kritikal na boses na nagtatanong hanggang saan talaga maisasaalang-alang ang mga modelong ito "open source"Ang kumpanya ay nag-opt para sa isang diskarte bukas na timbangInilalabas nito ang mga timbang para sa paggamit at pag-aangkop, ngunit hindi lahat ng mga detalye tungkol sa data ng pagsasanay at mga panloob na proseso na kinakailangan upang kopyahin ang modelo mula sa simula.

Ang mga mananaliksik tulad ng Andreas Liesenfeld, co-founder ng European Open Source AI Index, Itinuturo nila na ang pangunahing bottleneck para sa AI sa Europa ay hindi lamang pag-access sa mga modelo, ngunit sa malakihang data ng pagsasanayMula sa pananaw na iyon, ang Mistral 3 ay nag-aambag sa pagbutihin ang hanay ng mga magagamit na modeloGayunpaman, hindi nito lubusang nalulutas ang pinagbabatayan na problema ng isang European ecosystem na patuloy na nagpupumilit na bumuo at magbahagi ng mga de-kalidad na napakalaking dataset.

Inamin mismo ng Mistral na ang mga open-plan na modelo nito ay "medyo nasa likod" ng mas advanced na mga closed solution, ngunit Iginiit niya na ang puwang ay mabilis na lumiliit. at iyon ang pangunahing punto ay ang cost-benefit ratioKung ang isang medyo hindi gaanong makapangyarihang modelo ay maaaring i-deploy sa murang halaga, maayos para sa isang partikular na gawain, at tumakbo malapit sa user, Ito ay maaaring mas kawili-wili para sa maraming kumpanya kaysa sa isang nangungunang modelo na maa-access lamang sa pamamagitan ng remote na API.

Gayunpaman, nananatili ang mga hamon: mula sa matinding internasyonal na kompetisyon Umaabot ito sa pangangailangang garantiyahan ang seguridad, kakayahang masubaybayan, at pagsunod sa regulasyon sa mga konteksto gaya ng pangangalagang pangkalusugan, pananalapi, at pamahalaan. Ang balanse sa pagitan ng pagiging bukas, kontrol, at responsibilidad ay patuloy na gagabay sa Mistral at iba pang mga manlalaro sa Europa sa mga darating na taon.

Ang paglulunsad ng Mistral 3 Pinatitibay nito ang ideya na ang cutting-edge na AI ay hindi kailangang limitado sa mga higante, saradong mga modelo.at nag-aalok ng Europe — at anumang organisasyong nagpapahalaga sa teknolohikal na soberanya — isang palette ng mga bukas na tool na pinagsasama ang isang multimodal na frontier na modelo na may hanay ng magaan na mga modelo na may kakayahang magtrabaho sa gilid, offline, at may isang antas ng pag-customize na mahirap itugma sa pamamagitan ng purong pagmamay-ari na mga platform.

Paano gamitin ang iyong PC bilang isang lokal na AI hub
Kaugnay na artikulo:
Paano Gamitin ang Iyong PC bilang Lokal na AI Hub: Isang Praktikal at Pahambing na Gabay