Mistral 3: Otvorené a efektívne modely pre distribuovanú umelú inteligenciu

Mistral 3 spája desať otvorených modelov, od multimodálneho hraničného modelu až po kompaktný rad Ministral 3.
Architektúra Mixture of Experts umožňuje vysokú presnosť s nižšou spotrebou energie a efektívnym nasadením na okraji siete.
Menšie modely môžu bežať offline na jednej grafickej karte alebo na zariadeniach s nízkymi nárokmi na zdroje, čím posilňujú digitálnu suverenitu.
Európa získava na význame v oblasti umelej inteligencie vďaka otvorenému prístupu spoločnosti Mistral a jej partnerstvám s verejnými orgánmi a spoločnosťami.

Francúzsky startup Mistral AI Dostala sa do centra diskusie o umelej inteligencii v Európe. Štart rakety Mistral 3Nová rodina otvorených modelov navrhnutých pre prácu vo veľkých dátových centrách aj v zariadeniach s veľmi obmedzenými zdrojmi. Spoločnosť sa zďaleka nepúšťa do slepých pretekov o veľkosť modelu, ale Zasadzuje sa za distribuovanú inteligenciu, ktorú možno implementovať kdekoľvek je to potrebné.v cloude, na okraji siete alebo dokonca bez internetového pripojenia.

Táto stratégia umiestňuje Mistral ako jedna z mála európskych alternatív schopných postaviť sa gigantom ako OpenAI, Google alebo Anthropica ponúknuť alternatívy k ChatGPTAle z iného pohľadu: modely s otvorenou hmotnosťou pod povolenou licenciouprispôsobiteľné potrebám spoločností a verejnej správy a so silným zameraním na európske jazyky a suverénne nasadenie v rámci kontinentu.

Čo je Mistral 3 a prečo je dôležitý?

Modelová rodina Mistral 3

Rodina Mistral 3 Je tvorený desať modelov s otvorenou hmotnosťou vydané pod licenciou Apache 2.0To umožňuje jeho komerčné využitie prakticky bez obmedzení. Zahŕňa vlajkový model typu Frontier. Mistral Large 3a rad kompaktných modelov pod značkou Ministerský 3.ktoré sa dodávajú v troch približných veľkostiach (14 000, 8 000 a 3 000 miliónov parametrov) a niekoľkých variantoch v závislosti od typu úlohy.

Kľúčovou inováciou je, že veľký model nie je obmedzený len na text: Mistral Large 3 je multimodálny a viacjazyčnýJe schopný pracovať s textom a obrázkami v rámci rovnakej architektúry a ponúka robustnú podporu pre európske jazyky. Na rozdiel od iných prístupov, ktoré kombinujú jazykové a vizuálne modely samostatne, tento sa spolieha na jeden integrovaný systém, ktorý dokáže analyzovať rozsiahle dokumenty, rozumieť obrázkom a fungovať ako pokročilý asistent pre zložité úlohy.

Zároveň séria Ministerský 3. Je navrhnutý tak, aby fungoval v situáciách, kde je prístup do cloudu obmedzený alebo neexistuje. Tieto modely môžu bežať na zariadeniach s minimálnou kapacitou 4 GB pamäte alebo na jednej GPU, čo otvára dvere k jej použitiu v notebooky, mobilné telefóny, roboty, drony alebo vstavané systémy bez závislosti od neustáleho internetového pripojenia alebo externých poskytovateľov.

Pre európsky ekosystém, kde sa diskusia o digitálna suverenita a kontrola údajov Táto kombinácia modelu otvorených hraníc a lokálne nasaditeľných ľahkých modelov je veľmi aktuálna a obzvlášť relevantná, a to ako pre súkromné spoločnosti, tak aj pre verejné správy, ktoré hľadajú alternatívy k veľkým americkým a čínskym platformám.

Architektúra, zmiešanie odborníkov a technický prístup

Možnosti Mistralu 3

Technické srdce Mistral Large 3 je architektúra Zmes odborníkov (MŽP), dizajn, v ktorom model Má viacero interných „expertov“.Ale aktivuje iba časť z nich na spracovanie každého tokenuV praxi systém zvláda 41.000 miliárd aktívnych parametrov viac ako celkom 675.000 millonesTo umožňuje kombinovať vysokú kapacitu uvažovania s kontrolovanejšou spotrebou energie a výpočtov ako ekvivalentný model s vysokou hustotou.

Exkluzívny obsah – kliknite sem Google predstavuje Gemini Live s novými funkciami AI v reálnom čase

Táto architektúra v kombinácii s kontextové okno s až 256.000 XNUMX XNUMX tokenmiVďaka tomu dokáže Mistral Large 3 spracovávať veľmi veľké objemy informácií, ako sú napríklad dlhé zmluvy, technická dokumentácia alebo rozsiahle firemné znalostné bázy. Model je zameraný na prípady použitia, ako napríklad analýza dokumentov, pomoc s programovaním, tvorba obsahu, agenti umelej inteligencie a automatizácia pracovných postupov.

Súbežne s tým modely Ministerský 3. Ponúkané sú v troch hlavných variantoch: základňa (generický predtrénovaný model), Poučiť (optimalizované pre konverzácie a úlohy asistenta) a uvažovanie (Upravené pre logické uvažovanie a hlbšiu analýzu). Všetky verzie podporujú vyhliadka a spracovávajú široké kontexty – medzi 128 000 a 256 000 tokenmi – pričom si zachovávajú kompatibilitu s viacerými jazykmi.

Základná myšlienka, ako ju vysvetlil spoluzakladateľ a hlavný vedec Guillaume Lample, spočíva v tom, že vo „viac ako 90 %“ prípadov použitia v podnikoch, Postačuje malý, dobre vyladený model. a navyše efektívnejšie. Prostredníctvom techník, ako je použitie syntetické dáta pre špecifické úlohySpoločnosť tvrdí, že tieto modely sa môžu vo veľmi špecifických aplikáciách priblížiť alebo dokonca prekonať väčšie, uzavreté možnosti a zároveň znížiť náklady, latenciu a riziká pre súkromie.

Celý tento ekosystém je integrovaný so širšou škálou produktov spoločnosti: od API agentov Mistrals konektormi na vykonávanie kódu, vyhľadávanie na webe alebo generovanie obrázkov, až Mistralský kód Pre pomoc programátorom, model uvažovania Majstrovsky a platformu AI Studio nasadzovať aplikácie, spravovať analytické údaje a udržiavať protokoly používania.

Spolupráca so spoločnosťou NVIDIA a nasadenie v oblasti superpočítačov a edge computingu

Vrcholom spustenia je spojenectvo medzi Mistral AI a NVIDIA, čo predstavuje Mistral 3 ako rodinu modelov vyladených pre superpočítačové systémy a edge platformy amerického výrobcu. Mistral Large 3v kombinácii s infraštruktúrou, ako napr. NVIDIA GB200 NVL72, podľa spoločnosti NVIDIA až desaťnásobné zlepšenie výkonu v porovnaní s predchádzajúcou generáciou založenou na grafických procesoroch H200, využívajúc pokročilý paralelizmus, zdieľanú pamäť cez NVLink a optimalizované numerické formáty, ako napríklad NVFP4.

Spolupráca sa nekončí len pri špičkovom hardvéri. Séria Ministerský 3. Bol optimalizovaný pre rýchly chod v prostrediach ako napríklad Počítače a notebooky s grafickými kartami RTX, zariadenia Jetson a edge platformyuľahčenie lokálnych inferencií v priemyselných, robotických alebo spotrebiteľských scenároch. Populárne rámce ako napr. Llama.cpp a Ollama Boli prispôsobené tak, aby využívali výhody týchto modelov, čo zjednodušuje ich nasadenie vývojármi a IT tímami.

Okrem toho, integrácia s ekosystémom NVIDIA NeMo – vrátane nástrojov ako Data Designer, Guardrails a Agent Toolkit – umožňuje spoločnostiam vykonávať jemné doladenie, kontrola zabezpečenia, orchestrácia agentov a návrh dát založené na Mistral 3. Zároveň inferenčné nástroje, ako napríklad TensorRT-LLM, SGLang a vLLM znížiť náklady na token a zlepšiť energetickú účinnosť.

Modely Mistral 3 sú teraz dostupné u veľkých predajcov. poskytovatelia cloudových služieb a otvorené repozitárea prídu aj vo forme Mikroslužby NIM v rámci katalógu NVIDIA, čo je obzvlášť zaujímavé pre európske spoločnosti, ktoré už fungujú na platformách tohto výrobcu a chcú prijať generatívnu umelú inteligenciu s väčšou kontrolou nad nasadením.

Vďaka tomuto rámcu môže Mistral 3 fungovať vo veľkých dátových centrách aj na okrajových zariadeniach, čo posilňuje jeho naratív... skutočne všadeprítomná a distribuovaná umelá inteligencia, menej závislé od vzdialených služieb a viac prispôsobené špecifickým potrebám každého klienta.

Exkluzívny obsah – kliknite sem OpenAI zabezpečuje pamäť a centrá v Kórei so spoločnosťami Samsung a SK Hynix

Malé modely, offline nasadenie a prípady použitia na okraji siete

Modely umelej inteligencie Mistral 3

Jedným z pilierov Mistralovej diskusie je, že Väčšina reálnych aplikácií nevyžaduje najväčší možný model.ale taký, ktorý dobre vyhovuje prípadu použitia a dá sa doladiť pomocou konkrétnych údajov. A práve tu prichádza na rad deväť modelov v sérii. Ministerský 3.husté, vysoko výkonné a dostupné v rôznych veľkostiach a variantoch, aby vyhovovali požiadavkám na cenu, rýchlosť alebo kapacitu.

Tieto modely sú navrhnuté na prácu v jednej grafickej karte alebo dokonca na skromnom hardvériTo umožňuje lokálne nasadenie na interných serveroch, notebookoch, priemyselných robotoch alebo zariadeniach pracujúcich vo vzdialených prostrediach. Pre spoločnosti pracujúce s citlivými informáciami – od výrobcov až po finančné inštitúcie alebo vládne agentúry – je možnosť prevádzkovať umelú inteligenciu v rámci vlastnej infraštruktúry bez odosielania údajov do cloudu významnou výhodou.

Spoločnosť uvádza príklady ako napr. Továrenské roboty, ktoré analyzujú dáta zo senzorov v reálnom čase bez internetového pripojenia, drony pre núdzové situácie a záchranné akcie, vozidlá s plne funkčnými asistentmi s umelou inteligenciou v oblastiach bez pokrytia alebo vzdelávacie nástroje, ktoré ponúkajú študentom offline pomoc. Spracovaním údajov priamo na zariadení súkromie a kontrola informácií používateľov.

Lample trvá na tom, že prístupnosť je ústrednou súčasťou poslania spoločnosti Mistral: existujú Miliardy ľudí s mobilnými telefónmi alebo notebookmi, ale bez spoľahlivého prístupu na internetktoré by mohli ťažiť z modelov schopných lokálneho spustenia. Týmto spôsobom sa spoločnosť snaží vyvrátiť predstavu, že pokročilá umelá inteligencia musí byť vždy viazaná na veľké dátové centrá ovládané malou skupinou spoločností.

Súbežne s tým začala spoločnosť Mistral spolupracovať s medzinárodnými partnermi v oblasti tzv. Fyzická umelá inteligenciaMedzi spomínanými spoluprácami sú singapurská agentúra pre vedu a technológie HTX pre roboty, kybernetickú bezpečnosť a systémy protipožiarnej ochrany a nemecká Helsing, zameraný na obranu, s modelmi vízie, jazyka a akcie pre drony; a výrobcovia automobilov hľadajúci Asistenti s umelou inteligenciou v kabíne efektívnejšie a kontrolovateľnejšie.

Dopad v Európe: digitálna suverenita a verejno-súkromný ekosystém

Okrem technických aspektov sa Mistral stal referenčným bodom v diskusii o Digitálna suverenita v EurópeHoci sa spoločnosť definuje ako „transatlantická spolupráca“ – s tímami a modelovým školením rozmiestneným medzi Európou a Spojenými štátmi –, jej záväzok k otvoreným modelom so silnou podporou európskych jazykov bol pozitívne prijatý verejnými inštitúciami na kontinente.

Spoločnosť uzavrela dohody s francúzska armáda, francúzsky úrad práce, luxemburská vláda a ďalšie európske organizácie majú záujem o zavádzanie umelej inteligencie v rámci prísnych regulačných rámcov a zachovanie kontroly nad údajmi v rámci EÚ. Súbežne Európska komisia predložila stratégia na podporu európskych nástrojov umelej inteligencie ktoré posilňujú priemyselnú konkurencieschopnosť bez toho, aby obetovali bezpečnosť a odolnosť.

Geopolitický kontext tiež núti región reagovať. Uznáva sa, že Európa zaostala za Spojenými štátmi a Čínou V pretekoch o modely novej generácie, zatiaľ čo v krajinách ako Čína sa objavujú otvorené alternatívy ako DeepSeek, Alibaba a Kimi, ktoré začínajú v určitých úlohách konkurovať riešeniam ako ChatGPT, sa Mistral snaží časť tejto medzery vyplniť otvorenými a všestrannými modelmi, ktoré sú v súlade s európskymi regulačnými požiadavkami.

Exkluzívny obsah – kliknite sem Ako vložiť dokument pomocou OneDrive?

Startup finančne získal približne 2.700 miliónov a pohyboval sa v rámci ocenení blízkych 14.000 millonesTieto čísla sú oveľa nižšie ako u gigantov ako OpenAI alebo Anthropic, ale pre európsky ekosystém sú významné. Veľká časť obchodného modelu zahŕňa ponúkanie, okrem otvorených váh, aj služby prispôsobenia, nástroje na nasadenie a podnikové produkty ako napríklad Mistral Agents API alebo balík Le Chat s firemnými integráciami.

Pozícia je jasná: byť poskytovateľ otvorenej a flexibilnej infraštruktúry umelej inteligencie čo umožňuje európskym (a iným regionálnym) spoločnostiam inovovať bez toho, aby boli úplne závislé od amerických platforiem, pričom si zachovávajú určitú kontrolu nad tým, kde a ako sa modely prevádzkujú, a uľahčujú integrácie s nástrojmi, ktoré sú už implementované v ich systémoch.

Diskusia o skutočnej otvorenosti a čakajúcich výzvach

Napriek nadšeniu, ktoré Mistral 3 vyvoláva v časti technologickej komunity, nie je núdza o kritické hlasy, ktoré spochybňujú... do akej miery možno tieto modely skutočne považovať za „otvorený zdroj“Spoločnosť sa rozhodla pre prístup otvorená hmotnosťUvoľňuje váhy na použitie a adaptáciu, ale nie nevyhnutne všetky podrobnosti o tréningových dátach a interných procesoch potrebných na reprodukciu modelu od začiatku.

Výskumníci ako napr. Andreas Liesenfeld, spoluzakladateľ Európskeho indexu umelej inteligencie s otvoreným zdrojovým kódom, Poukazujú na to, že hlavnou prekážkou umelej inteligencie v Európe nie je len prístup k modelom, ale do rozsiahle tréningové dátaZ tohto hľadiska Mistral 3 prispieva k zlepšiť škálu použiteľných modelovAvšak úplne to nerieši základný problém európskeho ekosystému, ktorý sa naďalej trápi s generovaním a zdieľaním vysokokvalitných rozsiahlych súborov údajov.

Samotný Mistral pripúšťa, že jeho modely s otvoreným pôdorysom „trochu zaostávajú“ za pokročilejšími uzavretými riešeniami, ale Trvá na tom, že rozdiel sa rýchlo zmenšuje. a že kľúčovým bodom je pomer nákladov a výnosovAk je možné nasadiť o niečo menej výkonný model za nízku cenu, doladiť ho pre konkrétnu úlohu a spustiť ho blízko používateľa, Toto môže byť pre mnohé spoločnosti zaujímavejšie ako špičkový model. ku ktorému je možné pristupovať iba prostredníctvom vzdialeného API.

Napriek tomu pretrvávajú výzvy: od tvrdá medzinárodná konkurencia To sa vzťahuje aj na potrebu zaručiť bezpečnosť, sledovateľnosť a súlad s predpismi v kontextoch, ako je zdravotníctvo, financie a vláda. Rovnováha medzi otvorenosťou, kontrolou a zodpovednosťou bude v nasledujúcich rokoch naďalej viesť spoločnosť Mistral a ďalších európskych hráčov.

Začatie projektu Mistral 3 Posilňuje to myšlienku, že špičková umelá inteligencia sa nemusí obmedzovať len na obrovské, uzavreté modely.a ponúka Európe – a každej organizácii, ktorá si cení technologickú suverenitu – paletu otvorených nástrojov, ktoré kombinujú multimodálny hraničný model s radom ľahkých modelov schopných fungovať na okraji siete, offline a s úrovňou prispôsobenia, ktorú je ťažké dosiahnuť čisto proprietárnymi platformami.

Súvisiaci článok:

Ako používať počítač ako lokálne centrum umelej inteligencie: Praktický a porovnávací sprievodca

Alberto navarro

Som technologický nadšenec, ktorý zo svojich „geekovských“ záujmov urobil povolanie. Strávil som viac ako 10 rokov svojho života používaním špičkových technológií a hraním so všetkými druhmi programov z čistej zvedavosti. Teraz som sa špecializoval na počítačovú techniku a videohry. Je to preto, že už viac ako 5 rokov píšem pre rôzne webové stránky o technológiách a videohrách a vytváram články, ktoré sa snažia poskytnúť vám potrebné informácie v jazyku, ktorý je zrozumiteľný pre každého.

Ak máte nejaké otázky, moje znalosti siahajú od všetkého, čo súvisí s operačným systémom Windows, ako aj Androidom pre mobilné telefóny. A môj záväzok je voči vám, vždy som ochotný venovať pár minút a pomôcť vám vyriešiť akékoľvek otázky, ktoré môžete mať v tomto internetovom svete.