- A Mistral 3 tíz nyitott modellt egyesít magában, a multimodális határtól a kompakt Ministral 3 sorozatig.
- A Mixture of Experts architektúra nagy pontosságot tesz lehetővé alacsonyabb energiafogyasztás és hatékony peremhálózati telepítések mellett.
- A kisebb modellek offline is futtathatók egyetlen GPU-n vagy alacsony erőforrás-igényű eszközökön, megerősítve a digitális szuverenitást.
- Európa egyre nagyobb teret hódít a mesterséges intelligencia területén a Mistral nyílt megközelítésének, valamint a közintézményekkel és vállalatokkal kötött partnerségeinek köszönhetően.
A francia startup Mistral AI Az európai mesterséges intelligenciáról szóló vita középpontjába került azzal, hogy Mistral 3 indításaEgy új, nyílt modellekből álló család, amelyet úgy terveztek, hogy mind nagy adatközpontokban, mind nagyon korlátozott erőforrásokkal rendelkező eszközökben működjenek. A vállalat messze nem egy vak versenybe bocsátkozik a modellek méretéért, Az elosztott intelligenciát szorgalmazza, amely bárhol alkalmazható, ahol szükséges.: a felhőben, a peremhálózaton, vagy akár internetkapcsolat nélkül is.
Ez a stratégia A Mistral egyike azon kevés európai alternatíváknak, amelyek képesek felvenni a versenyt olyan óriásokkal, mint az OpenAI, a Google vagy az Anthropic, és ajánlatot alternatívák a ChatGPT-hezDe más szemszögből: nyitott súlyú modellek engedélyezett licenc alapjánalkalmazkodóképes a vállalatok és a közigazgatások igényeihez, és nagy hangsúlyt fektet az európai nyelvekre és a kontinensen belüli szuverén telepítésekre.
Mi a Mistral 3 és miért fontos?

A család Mistral 3 Az alkotja tíz nyitott súlyú modell Apache License 2.0 alatt kiadvaEz gyakorlatilag korlátozás nélküli kereskedelmi célú felhasználást tesz lehetővé. Tartalmaz egy Frontier típusú zászlóshajó modellt is. Mistral Nagy 3és a márka alatt kompakt modellek sora Miniszteri 3amelyek hozzávetőlegesen három méretben (14 000, 8 000 és 3 000 millió paraméter) és a feladat típusától függően számos változatban kaphatók.
A legfontosabb újítás, hogy a nagyméretű modell nem korlátozódik szövegre: A Mistral Large 3 multimodális és többnyelvűKépes szövegekkel és képekkel dolgozni ugyanazon architektúrán belül, és robusztus támogatást nyújt az európai nyelvekhez. Más megközelítésekkel ellentétben, amelyek külön-külön kombinálják a nyelvi és vizuális modelleket, ez egyetlen integrált rendszerre támaszkodik, amely képes elemezni a nagy dokumentumokat, megérteni a képeket, és fejlett asszisztensként működni az összetett feladatokhoz.
Ugyanakkor a sorozat Miniszteri 3 Úgy tervezték, hogy olyan helyzetekben működjön, ahol a felhőalapú hozzáférés korlátozott vagy nem létezik. Ezek a modellek olyan eszközökön is futtathatók, amelyek akár csak 4 GB memória vagy egyetlen GPU-n, ami megnyitja az utat a felhasználása előtt laptopok, mobiltelefonok, robotok, drónok vagy beágyazott rendszerek anélkül, hogy állandó internetkapcsolatra vagy külső szolgáltatókra lenne szükség.
Az európai ökoszisztéma számára, ahol a párbeszéd a következőkről folyik: digitális szuverenitás és adatkontroll A nyílt határokon átívelő modell és a helyben telepíthető könnyűszerkezetes modellek ezen kombinációja nagyon is jelen van és különösen releváns mind a magánvállalatok, mind a közigazgatások számára, amelyek alternatívákat keresnek a nagy amerikai és kínai platformokkal szemben.
Építészet, szakértők keveréke és műszaki megközelítés

A technikai szív Mistral Nagy 3 építészete Szakértők keveréke (ME), egy olyan terv, amelyben a modell Több belső "szakértője" is van., de csak egy részüket aktiválja az egyes tokenek feldolgozásáhozA gyakorlatban a rendszer kezeli 41.000 milliárd aktív paraméter összesen 675.000 millonesEz lehetővé teszi a nagyfokú logikai kapacitás kombinálását a kontrolláltabb energia- és számítási fogyasztással, mint egy hasonló sűrű modell esetében.
Ez az architektúra, kombinálva egy akár 256.000 XNUMX XNUMX token kontextusablakEz lehetővé teszi a Mistral Large 3 számára, hogy nagyon nagy mennyiségű információt dolgozzon fel, például hosszú szerződéseket, műszaki dokumentációkat vagy nagy vállalati tudásbázisokat. A modell olyan felhasználási esetekre van felkészítve, mint például dokumentumelemzés, programozási segítségnyújtás, tartalomkészítés, mesterséges intelligencia alapú ügynökök és munkafolyamat-automatizálás.
Ezzel párhuzamosan a modellek Miniszteri 3 Három fő változatban kínálják őket: Bázis (általános előképzett modell), utasít (beszélgetésekre és asszisztensi feladatokra optimalizálva) és Érvelés (Logikai gondolkodáshoz és mélyebb elemzéshez igazítva). Minden verzió támogatja kilátás és széles kontextusokat kezelnek – 128K és 256K tokenek között –, miközben több nyelvvel is kompatibilisek.
Az alapötlet, ahogy azt a társalapító és vezető tudós, Guillaume Lample kifejtette, az, hogy a vállalati felhasználási esetek „több mint 90%-ában” Egy kicsi, jól hangolt modell is elég. és ráadásul hatékonyabb. Olyan technikák segítségével, mint a szintetikus adatok meghatározott feladatokhozA vállalat azzal érvel, hogy ezek a modellek megközelíthetik, vagy akár felül is múlhatják a nagyobb, zárt megoldásokat nagyon specifikus alkalmazásokban, miközben csökkentik a költségeket, a késleltetést és az adatvédelmi kockázatokat.
Ez a teljes ökoszisztéma integrálva van a vállalat termékeinek szélesebb skálájával: a következőktől: Mistral Agents APIcsatlakozókkal kódfuttatáshoz, webes kereséshez vagy képgeneráláshoz, akár Mistral-kód Programozói segítségként a következtetési modell Mesteri és a platform AI Stúdió alkalmazások telepítéséhez, elemzések kezeléséhez és használati naplók karbantartásához.
Együttműködés az NVIDIA-val és telepítés a szuperszámítástechnika és az edge computing területén
A bevezetés egyik kiemelkedő pontja a következők közötti szövetség Mistral AI és NVIDIA, amely a Mistral 3-at az amerikai gyártó szuperszámítógépes rendszereihez és peremhálózati platformjaihoz finomhangolt modellcsaládként pozicionálja. Mistral Nagy 3olyan infrastruktúrával kombinálva, mint például NVIDIA GB200 NVL72az NVIDIA szerint akár tízszeres teljesítménynövekedés az előző, H200 GPU-kon alapuló generációhoz képest, kihasználva a fejlett párhuzamosságot, az NVLinken keresztül megosztott memóriát és az optimalizált numerikus formátumokat, mint például NVFP4.
Az együttműködés nem áll meg a csúcskategóriás hardvereknél. A sorozat Miniszteri 3 Optimalizálták, hogy gyorsan fusson olyan környezetekben, mint például RTX GPU-kkal felszerelt PC-k és laptopok, Jetson eszközök és edge platformokhelyi következtetések levonásának elősegítése ipari, robotikai vagy fogyasztói forgatókönyvekben. Népszerű keretrendszerek, mint például Llama.cpp és Ollama Úgy alakították át őket, hogy kihasználják ezeket a modelleket, ami leegyszerűsíti a fejlesztők és az informatikai csapatok általi telepítésüket.
Továbbá, az ökoszisztémával való integráció NVIDIA NeMo – beleértve az olyan eszközöket, mint a Data Designer, a Guardrails és az Agent Toolkit – lehetővé teszi a vállalatok számára, hogy finomhangolás, biztonsági ellenőrzés, ügynökök összehangolása és adattervezés a Mistral 3 alapján. Ugyanakkor olyan következtetőmotorok, mint a TensorRT-LLM, SGLang és vLLM a tokenenkénti költség csökkentése és az energiahatékonyság javítása érdekében.
A Mistral 3 modellek már kaphatók a nagyobb kiskereskedőknél. felhőszolgáltatók és nyílt adattárakés ők is érkezni fognak formájában NIM mikroszolgáltatások az NVIDIA katalógusán belül, ami különösen érdekes az európai vállalatok számára, amelyek már a gyártó platformjain működnek, és generatív mesterséges intelligenciát szeretnének bevezetni, nagyobb kontrollal a telepítés felett.
Ez a keretrendszer lehetővé teszi, hogy a Mistral 3 mind nagy adatközpontokban, mind peremhálózati eszközökön működjön, megerősítve a… narratíváját. valóban mindenütt jelenlévő és elosztott mesterséges intelligencia, kevésbé függ a távoli szolgáltatásoktól, és jobban igazodik az egyes ügyfelek egyedi igényeihez.
Kis modellek, offline telepítés és peremhálózati használati esetek

Mistral diskurzusának egyik pillére az, hogy A legtöbb valós alkalmazás nem igényli a lehető legnagyobb modellt.de olyat, ami jól illeszkedik a felhasználási esethez, és specifikus adatokkal finomhangolható. Itt jön képbe a sorozat kilenc modellje. Miniszteri 3sűrű, nagy teljesítményű, és különböző méretekben és változatokban kapható, hogy megfeleljen a költség-, sebesség- vagy kapacitásigényeknek.
Ezeket a modelleket úgy tervezték, hogy működjenek egyetlen GPU-n vagy akár szerény hardveren isEz lehetővé teszi a helyi telepítéseket házon belüli szervereken, laptopokon, ipari robotokon vagy távoli környezetben működő eszközökön. Az érzékeny információkat kezelő vállalatok – a gyártóktól a pénzügyi intézményeken át a kormányzati szervekig – számára jelentős előnyt jelent, hogy a mesterséges intelligenciát saját infrastruktúrájukon belül, adatok felhőbe küldése nélkül futtathatják.
A cég példákat említ, mint például Gyári robotok, amelyek valós időben, internetkapcsolat nélkül elemzik az érzékelők adatait, drónok vészhelyzetekhez és mentésekhez, járművek teljes funkcionalitású MI-asszisztensekkel lefedett területeken vagy olyan oktatási eszközök, amelyek offline segítséget nyújtanak a diákoknak. Az adatok közvetlen feldolgozásával az eszközön a adatvédelem és az információk ellenőrzése felhasználók számára.
Lample ragaszkodik ahhoz, hogy az akadálymentesítés a Mistral küldetésének központi eleme: vannak Milliárdok embernek van mobiltelefonja vagy laptopja, de nincs megbízható internet-hozzáféréseamely profitálhatna a lokálisan futtatható modellekből. Ily módon a vállalat megpróbálja eloszlatni azt az elképzelést, hogy a fejlett mesterséges intelligenciát mindig egy kis vállalatcsoport által irányított nagy adatközpontokhoz kell kötni.
Ezzel párhuzamosan a Mistral nemzetközi partnerekkel kezdett együttműködni az ún. Fizikai mesterséges intelligenciaAz említett együttműködések között szerepel a szingapúri HTX tudományos és technológiai ügynökség, amely robotikával, kiberbiztonsággal és tűzvédelmi rendszerekkel foglalkozik; valamint a német… Helsing, a védelemre összpontosítva, drónokhoz készült látás-nyelv-cselekvés modellekkel; és az autógyártók, akik MI asszisztensek az utastérben hatékonyabb és kontrollálhatóbb.
Hatás Európában: digitális szuverenitás és köz-magán ökoszisztéma
A technikai szempontokon túl a Mistral mércévé vált a vitában. Digitális szuverenitás EurópábanBár a vállalat „transzatlanti együttműködésként” definiálja magát – csapatokkal és modellképzéssel Európa és az Egyesült Államok között –, a nyílt modellek iránti elkötelezettségét, amely erősen támogatja az európai nyelveket, a kontinens közintézményei jól fogadták.
A cég megállapodásokat kötött a a francia hadsereg, a francia állami foglalkoztatási ügynökség, Luxemburg kormánya és más európai szervezetek érdekeltek a mesterséges intelligencia szigorú szabályozási keretek között történő telepítésében és az adatok feletti ellenőrzés fenntartásában az EU-n belül. Ezzel párhuzamosan az Európai Bizottság benyújtott egy stratégia az európai mesterséges intelligenciaeszközök fellendítésére amelyek erősítik az ipari versenyképességet a biztonság és az ellenálló képesség feláldozása nélkül.
A geopolitikai kontextus szintén reakcióra készteti a régiót. Elismert tény, hogy Európa lemaradt az Egyesült Államok és Kína mögé A következő generációs modellekért folyó versenyben, miközben olyan országokban, mint Kína, olyan nyílt alternatívák jelennek meg, mint a DeepSeek, az Alibaba és a Kimi, és bizonyos feladatokban versenyezni kezdenek olyan megoldásokkal, mint a ChatGPT, a Mistral megpróbálja részben betölteni ezt a hiányt nyílt, sokoldalú, az európai szabályozási követelményeknek megfelelő modellekkel.
A startup anyagilag körülbelül 2.700 millió és az értékelések közelébe mozdultak el 14.000 millonesEzek a számok jóval alacsonyabbak, mint az olyan óriáscégeké, mint az OpenAI vagy az Anthropic, de jelentősek az európai ökoszisztéma szempontjából. Az üzleti modell nagy része a nyílt súlyokon túlmutató kínálatot foglal magában, testreszabási szolgáltatások, telepítési eszközök és vállalati termékek mint például a Mistral Agents API vagy a vállalati integrációkkal ellátott Le Chat csomag.
A pozicionálás egyértelmű: lenni egy nyílt és rugalmas mesterséges intelligencia infrastruktúra szolgáltatója amely lehetővé teszi az európai (és más regionális) vállalatok számára az innovációt anélkül, hogy teljesen függenének az amerikai platformoktól, miközben bizonyos mértékig kontrollálják a modellek futtatásának helyét és módját, valamint megkönnyíti az integrációt a rendszereikben már implementált eszközökkel.
Vita a valódi nyitottságról és a függőben lévő kihívásokról
Annak ellenére, hogy a Mistral 3 lelkesedést vált ki a technológiai közösség egy részéből, nincs hiány kritikus hangokból, amelyek megkérdőjelezik mennyire tekinthetők ezek a modellek valóban "nyílt forráskódú"A vállalat egy olyan megközelítést választott, nyitott súlyFelszabadítja a súlyokat felhasználásra és adaptálásra, de nem feltétlenül az összes részletet a betanítási adatokról és a modell nulláról történő reprodukálásához szükséges belső folyamatokról.
Olyan kutatók, mint Andreas Liesenfeld, az Európai Nyílt Forráskódú MI Index társalapítója, Rámutatnak, hogy a mesterséges intelligencia fő szűk keresztmetszete Európában nem csak a modellekhez való hozzáférés, hanem ahhoz nagyméretű képzési adatokEbből a szempontból a Mistral 3 hozzájárul bővíteni a használható modellek körétEz azonban nem oldja meg teljesen az európai ökoszisztéma alapvető problémáját, amely továbbra is küzd a kiváló minőségű, hatalmas adatkészletek előállításával és megosztásával.
Maga a Mistral is elismeri, hogy nyitott terű modelljei „kissé lemaradnak” a fejlettebb, zárt megoldásokhoz képest, de Ragaszkodik hozzá, hogy a szakadék rohamosan csökken. és hogy a lényeg az a költség-haszon arányHa egy valamivel kevésbé hatékony modell alacsony költséggel telepíthető, egy adott feladathoz finomhangolható, és a felhasználó közelében futtatható, Ez sok vállalat számára érdekesebb lehet, mint egy csúcsmodell amely csak távoli API-n keresztül érhető el.
Ennek ellenére továbbra is fennállnak kihívások: a kiélezett nemzetközi verseny Ez kiterjed a biztonság, a nyomon követhetőség és a szabályozási megfelelés garantálásának szükségességére olyan területeken, mint az egészségügy, a pénzügy és a kormányzat. A nyitottság, az ellenőrzés és a felelősség közötti egyensúly továbbra is a Mistralt és más európai szereplőket fogja vezérelni az elkövetkező években.
A Mistral 3 Megerősíti azt az elképzelést, hogy a legmodernebb mesterséges intelligenciának nem kell óriási, zárt modellekre korlátozódnia.és Európának – és minden olyan szervezetnek, amely nagyra értékeli a technológiai szuverenitást – nyílt eszközök olyan palettáját kínálja, amely a multimodális határmodellt ötvözi a könnyűsúlyú modellek széles skálájával, amelyek képesek a peremhálózaton, offline módon működni, és olyan testreszabhatóságot biztosítanak, amelyet a tisztán zárt platformok nehezen tudnának elérni.
Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.
Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.

