- „Mistral 3“ apjungia dešimt atvirų modelių – nuo daugiarūšio pravažumo modelio iki kompaktiškos „Ministral 3“ serijos.
- „Mixture of Experts“ architektūra užtikrina didelį tikslumą, mažesnes energijos sąnaudas ir efektyvų diegimą periferiniuose tinkluose.
- Mažesni modeliai gali veikti neprisijungus prie interneto su vienu GPU arba mažai išteklių naudojančiais įrenginiais, taip sustiprindami skaitmeninį suverenitetą.
- Dėl „Mistral“ atvirojo požiūrio ir partnerystės su viešosiomis įstaigomis bei įmonėmis Europa stiprina savo pozicijas dirbtinio intelekto srityje.
Prancūzų startuolis Mistral AI Ji atsidūrė Europos diskusijų apie dirbtinį intelektą centre, „Mistral 3“ paleidimasNauja atvirų modelių šeima, sukurta veikti tiek dideliuose duomenų centruose, tiek įrenginiuose su labai ribotais ištekliais. Bendrovė toli gražu nedalyvauja aklose lenktynėse dėl modelių dydžio, Ji pasisako už paskirstytą intelektą, kurį galima įdiegti visur, kur reikia.debesyje, periferijoje ar net be interneto ryšio.
Ši strategija pozicionuoja „Mistral“ – viena iš nedaugelio Europos alternatyvų, galinčių konkuruoti su tokiais milžinais kaip „OpenAI“, „Google“ ar „Anthropic“., ir pasiūlyti „ChatGPT“ alternatyvosBet iš kitos perspektyvos: atviro svorio modeliai pagal leidžiamąją licencijąpritaikomas įmonių ir viešojo administravimo institucijų poreikiams, daugiausia dėmesio skiriant Europos kalboms ir suvereniems diegimams žemyne.
Kas yra „Mistral 3“ ir kodėl jis svarbus?

Šeima Mistralis 3 Jį sudaro dešimt atviro svorio modelių išleista pagal „Apache“ licenciją 2.0Tai leidžia jį naudoti komerciniais tikslais praktiškai be jokių apribojimų. Į komplektą įeina pavyzdinis „Frontier“ tipo modelis. „Mistral Large“ 3ir kompaktiškų modelių linija pagal prekės ženklą Ministrų 3kurie būna trijų apytikslių dydžių (14 000, 8 000 ir 3 000 milijonų parametrų) ir kelių variantų, priklausomai nuo užduoties tipo.
Pagrindinė naujovė yra ta, kad didelis modelis neapsiriboja tekstu: „Mistral Large 3“ yra multimodalinis ir daugiakalbisJis gali dirbti su tekstu ir vaizdais toje pačioje architektūroje ir siūlo patikimą Europos kalbų palaikymą. Skirtingai nuo kitų metodų, kurie atskirai derina kalbos ir regos modelius, šis remiasi viena integruota sistema, kuri gali analizuoti didelius dokumentus, suprasti vaizdus ir atlikti sudėtingų užduočių atlikimo kaip pažangi asistentė.
Tuo pačiu metu, serialas Ministrų 3 Jis sukurtas veikti tais atvejais, kai prieiga prie debesies yra ribota arba jos visai nėra. Šie modeliai gali veikti įrenginiuose, kuriuose yra vos 4 GB de memoria arba viename GPU, o tai atveria duris jo naudojimui nešiojamieji kompiuteriai, mobilieji telefonai, robotai, dronai arba įterptosios sistemos nepriklausant nuo nuolatinio interneto ryšio ar išorinių tiekėjų.
Europos ekosistemai, kurioje vyksta diskusija apie skaitmeninis suverenitetas ir duomenų kontrolė Šis atvirų sienų modelio ir vietoje diegiamų lengvų modelių derinys yra labai paplitęs ir ypač aktualus tiek privačioms įmonėms, tiek viešojo administravimo įstaigoms, ieškančioms alternatyvų didelėms JAV ir Kinijos platformoms.
Architektūra, ekspertų mišinys ir techninis požiūris

Techninė širdis „Mistral Large“ 3 yra architektūra Ekspertų mišinys (EM), dizainas, kuriame modelis Jame dirba keli vidiniai „ekspertai“., bet aktyvuoja tik dalį jų, kad apdorotų kiekvieną žetonąPraktiškai sistema tvarko 41.000 milijardai aktyvių parametrų daugiau nei iš viso 675.000 milijardoTai leidžia derinti didelius mąstymo pajėgumus su labiau kontroliuojamomis energijos ir skaičiavimo sąnaudomis, palyginti su lygiaverčiu tankiu modeliu.
Ši architektūra, kartu su kontekstinis langas iki 256 000 žetonųTai leidžia „Mistral Large 3“ apdoroti labai didelius informacijos kiekius, tokius kaip ilgos sutartys, techninė dokumentacija ar didelės įmonių žinių bazės. Modelis pritaikytas tokiems naudojimo atvejams kaip dokumentų analizė, programavimo pagalba, turinio kūrimas, dirbtinio intelekto agentai ir darbo eigos automatizavimas.
Lygiagrečiai, modeliai Ministrų 3 Jie siūlomi trimis pagrindiniais variantais: Base (bendrinis iš anksto apmokytas modelis), Instruct (optimizuota pokalbiams ir asistento užduotims) ir Reasoning (Pritaikyta loginiam samprotavimui ir gilesnei analizei). Visos versijos palaiko vizija ir jie tvarko plačius kontekstus – nuo 128 tūkst. iki 256 tūkst. žetonų – išlaikydami suderinamumą su keliomis kalbomis.
Pagrindinė idėja, kaip paaiškino bendraįkūrėjas ir vyriausiasis mokslininkas Guillaume'as Lample'as, yra ta, kad „daugiau nei 90 %“ įmonių naudojimo atvejų Pakanka mažo, gerai suderinto modelio. ir, be to, efektyviau. Naudojant tokius metodus kaip sintetiniai duomenys konkrečioms užduotimsBendrovė teigia, kad šie modeliai gali priartėti prie didesnių, uždarų variantų ar net juos pranokti labai specifinėse programose, tuo pačiu sumažindami išlaidas, delsą ir privatumo riziką.
Visa ši ekosistema yra integruota su platesniu įmonės produktų asortimentu: nuo „Mistral Agents“ APIsu jungtimis kodo vykdymui, paieškai internete arba vaizdų generavimui, iki Mistralio kodas Programuotojo pagalbai, samprotavimo modelis Magistral ir platforma AI Studio diegti programas, valdyti analizę ir tvarkyti naudojimo žurnalus.
Bendradarbiavimas su NVIDIA ir diegimas superkompiuterių bei periferinių skaičiavimų srityse
Svarbiausias pristatymo akcentas – aljansas tarp Mistral AI ir NVIDIA, kuris „Mistral 3“ pozicionuoja kaip modelių šeimą, tiksliai suderintą su amerikiečių gamintojo superkompiuterių sistemomis ir periferinėmis platformomis. „Mistral Large“ 3kartu su tokia infrastruktūra kaip NVIDIA GB200 NVL72, pasak NVIDIA našumo pagerėjimas iki dešimties kartų palyginti su ankstesne karta, pagrįsta H200 GPU, pasinaudojant pažangiu lygiagretumu, bendra atmintimi per NVLink ir optimizuotais skaitmeniniais formatais, tokiais kaip NVFP4.
Bendradarbiavimas neapsiriboja vien aukščiausios klasės įranga. Serija Ministrų 3 Jis buvo optimizuotas greitam veikimui tokiose aplinkose kaip Stacionarūs ir nešiojamieji kompiuteriai su RTX GPU, „Jetson“ įrenginiais ir kraštinėmis platformomispalengvinant vietinių išvadų darymą pramonės, robotikos ar vartotojų scenarijuose. Populiarios sistemos, tokios kaip Llama.cpp ir Ollama Jie buvo pritaikyti pasinaudoti šiais modeliais, o tai supaprastina jų diegimą kūrėjams ir IT komandoms.
Be to, integracija su ekosistema NVIDIA NeMo — įskaitant tokias priemones kaip „Data Designer“, „Guardrails“ ir „Agent Toolkit“, — leidžia įmonėms atlikti tikslusis derinimas, saugumo kontrolė, agentų orkestravimas ir duomenų projektavimas remiantis „Mistral 3“. Tuo pačiu metu, išvadų mechanizmai, tokie kaip TensorRT-LLM, SGLang ir vLLM sumažinti vieno žetono kainą ir pagerinti energijos vartojimo efektyvumą.
„Mistral 3“ modeliai dabar parduodami didžiuosiuose prekybos centruose. debesijos paslaugų teikėjai ir atviros saugyklosir jie taip pat atvyks pavidalu NIM mikropaslaugos „NVIDIA“ kataloge – tai ypač įdomu Europos įmonėms, kurios jau dirba su šio gamintojo sistemomis ir nori diegti generatyvinį dirbtinį intelektą, suteikiant didesnę diegimo kontrolę.
Visa ši sistema leidžia „Mistral 3“ veikti tiek dideliuose duomenų centruose, tiek periferiniuose įrenginiuose, sustiprindama jos naratyvą apie tikrai visur esantis ir paskirstytas dirbtinis intelektas, mažiau priklausomos nuo nuotolinių paslaugų ir labiau pritaikytos konkretiems kiekvieno kliento poreikiams.
Maži modeliai, diegimas neprisijungus ir naudojimo periferijoje atvejai

Vienas iš Mistralo diskurso ramsčių yra tas, kad Daugumai realaus pasaulio programų nereikia kuo didesnio modelio.tačiau tokį, kuris gerai atitiktų naudojimo atvejį ir kurį būtų galima tiksliai suderinti su konkrečiais duomenimis. Štai čia ir praverčia devyni serijos modeliai. Ministrų 3tankūs, našūs ir įvairių dydžių bei variantų, kad atitiktų kainos, greičio ar talpos reikalavimus.
Šie modeliai yra skirti darbui vienas GPU arba net ir kuklioje aparatinėje įrangojeTai leidžia diegti dirbtinį intelektą (DI) įmonės serveriuose, nešiojamuosiuose kompiuteriuose, pramoniniuose robotuose ar įrenginiuose, veikiančiuose nuotolinėje aplinkoje. Įmonėms, tvarkančioms slaptą informaciją – nuo gamintojų iki finansų įstaigų ar vyriausybinių agentūrų – galimybė naudoti dirbtinį intelektą savo infrastruktūroje, nesiunčiant duomenų į debesį, yra didelis pranašumas.
Įmonė pateikia pavyzdžių, pvz. Gamykliniai robotai, kurie realiuoju laiku analizuoja jutiklių duomenis be interneto ryšio, dronai avarinėms situacijoms ir gelbėjimui, transporto priemonės su pilnai veikiančiais dirbtinio intelekto asistentais teritorijose, kuriose nėra interneto ryšio. arba edukacinius įrankius, kurie siūlo pagalbą mokiniams neprisijungus. Apdorojant duomenis tiesiai įrenginyje, privatumas ir informacijos kontrolė vartotojų.
Lample tvirtina, kad prieinamumas yra pagrindinė „Mistral“ misijos dalis: yra Milijardai žmonių turi mobiliuosius telefonus ar nešiojamuosius kompiuterius, bet neturi patikimo interneto ryšiokuriam galėtų būti naudingi modeliai, galintys veikti vietoje. Tokiu būdu bendrovė bando išsklaidyti mintį, kad pažangus dirbtinis intelektas visada turi būti susietas su dideliais duomenų centrais, kuriuos kontroliuoja nedidelė įmonių grupė.
Tuo pačiu metu „Mistral“ pradėjo bendradarbiauti su tarptautiniais partneriais srityje, vadinamoje Fizinis dirbtinis intelektasTarp paminėtų bendradarbiavimo projektų yra Singapūro mokslo ir technologijų agentūra HTX, skirta robotams, kibernetiniam saugumui ir priešgaisrinės apsaugos sistemoms, ir Vokietijos... Helsing, orientuota į gynybą, kurianti dronams skirtus regėjimo, kalbos ir veiksmų modelius; ir automobilių gamintojams, siekiantiems Dirbtinio intelekto asistentai salone efektyvesnis ir labiau kontroliuojamas.
Poveikis Europoje: skaitmeninis suverenitetas ir viešojo bei privačiojo sektorių ekosistema
Be techninių aspektų, „Mistral“ tapo etalonu diskusijose apie Skaitmeninis suverenitetas EuropojeNors bendrovė save apibūdina kaip „transatlantinio bendradarbiavimo“ įmonę – kurios komandos ir modelių mokymai vyksta tiek Europoje, tiek Jungtinėse Valstijose – jos įsipareigojimas atviriems modeliams su tvirta parama Europos kalboms sulaukė palankios viešųjų institucijų visoje žemyne.
Įmonė yra sudariusi sandorius su Prancūzijos armija, Prancūzijos valstybinė įdarbinimo agentūra, Liuksemburgo vyriausybė ir kitos Europos organizacijos suinteresuotos diegti dirbtinį intelektą laikantis griežtų reguliavimo sistemų ir išlaikyti duomenų kontrolę ES. Tuo pačiu metu Europos Komisija pateikė strategija, skirta Europos dirbtinio intelekto priemonėms stiprinti kurie stiprina pramonės konkurencingumą neaukojant saugos ir atsparumo.
Geopolitinis kontekstas taip pat skatina regioną reaguoti. Pripažįstama, kad Europa atsilieka nuo Jungtinių Valstijų ir Kinijos Lenktynėse dėl naujos kartos modelių, tokiose šalyse kaip Kinija atsiranda atvirų alternatyvų, tokių kaip „DeepSeek“, „Alibaba“ ir „Kimi“, kurios tam tikrose užduotyse pradeda konkuruoti su tokiais sprendimais kaip „ChatGPT“, „Mistral“ bando užpildyti dalį šios spragos atvirais, universaliais modeliais, suderintais su Europos reguliavimo reikalavimais.
Finansiškai startuolis surinko apie 2.700 mln. dolerių ir vertinimai pakilo artimoje riboje 14.000 milijardoŠie skaičiai yra gerokai mažesni nei tokių gigantų kaip „OpenAI“ ar „Anthropic“, tačiau reikšmingi Europos ekosistemai. Didelė verslo modelio dalis apima ne tik atvirų svorių, bet ir kitų funkcijų siūlymą. pritaikymo paslaugos, diegimo įrankiai ir įmonės produktai pavyzdžiui, „Mistral Agents“ API arba „Le Chat“ programų paketas su įmonių integracijomis.
Pozicionavimas aiškus: būti atviros ir lanksčios dirbtinio intelekto infrastruktūros teikėjas tai leidžia Europos (ir kitoms regioninėms) įmonėms diegti inovacijas visiškai nepriklausant nuo JAV platformų, tuo pačiu išlaikant tam tikrą modelių vykdymo vietos ir būdo kontrolę bei palengvinant integraciją su jų sistemose jau įdiegtais įrankiais.
Diskusija apie tikrąjį atvirumą ir laukiančius iššūkius
Nepaisant entuziazmo, kurį „Mistral 3“ kelia dalyje technologijų bendruomenės, netrūksta kritiškai vertinančių balsų. kiek iš tikrųjų galima atsižvelgti į šiuos modelius „atvirojo kodo“Įmonė pasirinko tokį požiūrį atviras svorisTai leidžia naudoti ir pritaikyti svorius, bet nebūtinai visą informaciją apie mokymo duomenis ir vidinius procesus, reikalingus modeliui atkurti nuo nulio.
Tyrėjai, tokie kaip Andreas Liesenfeld, Europos atvirojo kodo dirbtinio intelekto indekso bendraįkūrėjas, Jie atkreipia dėmesį, kad pagrindinė dirbtinio intelekto kliūtis Europoje yra ne tik prieiga prie modelių, bet į didelio masto mokymo duomenysŠiuo požiūriu „Mistral 3“ prisideda prie išplėsti naudojamų modelių asortimentąTačiau tai iki galo neišsprendžia pagrindinės Europos ekosistemos problemos, kuriai ir toliau sunku generuoti ir dalytis aukštos kokybės didžiuliais duomenų rinkiniais.
Pati „Mistral“ pripažįsta, kad jos atviro plano modeliai „šiek tiek atsilieka“ nuo pažangesnių uždarų sprendimų, tačiau Jis tvirtina, kad atotrūkis sparčiai mažėja. ir kad svarbiausias dalykas yra sąnaudų ir naudos santykisJei šiek tiek mažiau galingą modelį galima įdiegti mažomis sąnaudomis, tiksliai suderinti jį su konkrečia užduotimi ir naudoti arti vartotojo, Daugeliui įmonių tai gali būti įdomiau nei geriausias modelis prie kurios galima prisijungti tik per nuotolinę API.
Nepaisant to, iššūkių išlieka: nuo arši tarptautinė konkurencija Tai apima ir poreikį užtikrinti saugumą, atsekamumą ir atitiktį teisės aktams tokiose srityse kaip sveikatos apsauga, finansai ir vyriausybė. Atvirumo, kontrolės ir atsakomybės pusiausvyra ir toliau bus „Mistral“ ir kitų Europos žaidėjų vadovavimo pagrindas ateinančiais metais.
Paleidimas Mistralis 3 Tai sustiprina mintį, kad pažangiausias dirbtinis intelektas nebūtinai turi apsiriboti milžiniškais, uždarais modeliais.ir siūlo Europai – bei bet kuriai organizacijai, vertinančiai technologinį suverenitetą – atvirų įrankių paletę, kurioje derinamas multimodalinis tarpinis modelis su įvairiais lengvaisiais modeliais, galinčiais veikti periferijoje, neprisijungus prie interneto ir pasižyminčiais pritaikymo lygiu, kurį sunku pasiekti naudojant grynai patentuotas platformas.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.

