Mistral 3: новая хваля адкрытых мадэляў для размеркаванага штучнага інтэлекту

Апошняе абнаўленне: 04/12/2025

  • Mistral 3 аб'ядноўвае дзесяць адкрытых мадэляў, ад мультымадальнай мяжы да кампактнай серыі Ministral 3.
  • Архітэктура «Сумесі экспертаў» забяспечвае высокую дакладнасць з нізкім спажываннем энергіі і эфектыўным разгортваннем на перыферыі.
  • Меншыя мадэлі могуць працаваць у аўтаномным рэжыме на адным графічным працэсары або прыладах з нізкім спажываннем рэсурсаў, што ўмацоўвае лічбавы суверэнітэт.
  • Еўропа набірае абароты ў галіне штучнага інтэлекту дзякуючы адкрытаму падыходу Mistral і партнёрству з дзяржаўнымі органамі і кампаніямі.
Містраль 3

Французскі стартап Mistral AI Яна апынулася ў цэнтры дыскусіі аб штучным інтэлекце ў Еўропе. Запуск ракеты «Містраль-3»Новае сямейства адкрытых мадэляў, прызначаных для працы як у буйных цэнтрах апрацоўкі дадзеных, так і на прыладах з вельмі абмежаванымі рэсурсамі. Кампанія не збіраецца ўступаць у сляпую гонку за памерам мадэлі, а Ён выступае за размеркаваны інтэлект, які можна ўкараніць усюды, дзе гэта неабходна.у воблаку, на перыферыі або нават без падключэння да Інтэрнэту.

Гэтая стратэгія ставіць «Містраль» — адна з нямногіх еўрапейскіх альтэрнатыў, здольная супрацьстаяць такім гігантам, як OpenAI, Google ці Anthropic.і прапанова альтэрнатывы ChatGPTАле з іншага пункту гледжання: мадэлі з адкрытай вагой пад дазвольнай ліцэнзіяйадаптуецца да патрэб кампаній і дзяржаўных адміністрацый, з моцным акцэнтам на еўрапейскія мовы і суверэннае разгортванне на кантыненце.

Што такое «Містраль-3» і чаму ён актуальны?

Мадэльнае сямейства Mistral 3

Сям'я Містраль 3 Ён утвораны дзесяць мадэляў адкрытай вагі выпушчана пад ліцэнзіяй Apache 2.0Гэта дазваляе яго камерцыйнае выкарыстанне практычна без абмежаванняў. У яго ўваходзіць флагманская мадэль тыпу Frontier. Вялікі Містраль 3і лінейку кампактных мадэляў пад брэндам Міністры 3якія выпускаюцца ў трох прыблізных памерах (14 000, 8 000 і 3 000 мільёнаў параметраў) і некалькіх варыянтах у залежнасці ад тыпу задачы.

Ключавая навіна заключаецца ў тым, што вялікая мадэль не абмяжоўваецца тэкстам: Mistral Large 3 — мультымадальны і шматмоўны рэйс.Ён здольны працаваць з тэкстам і выявамі ў межах адной архітэктуры і прапануе надзейную падтрымку еўрапейскіх моў. У адрозненне ад іншых падыходаў, якія асобна спалучаюць моўныя і візуальныя мадэлі, гэты абапіраецца на адзіную інтэграваную сістэму, якая можа аналізаваць вялікія дакументы, разумець выявы і выступаць у якасці пашыранага памочніка для выканання складаных задач.

Адначасова, серыя Міністры 3 Ён распрацаваны для працы ў сітуацыях, калі доступ да воблака абмежаваны або адсутнічае. Гэтыя мадэлі могуць працаваць на прыладах з мінімальным 4 GB de memoria або на адным графічным працэсары, што адкрывае магчымасці для яго выкарыстання ў ноўтбукі, мабільныя тэлефоны, робаты, беспілотнікі або ўбудаваныя сістэмы без залежнасці ад пастаяннага падключэння да Інтэрнэту або знешніх пастаўшчыкоў.

Для еўрапейскай экасістэмы, дзе размова пра лічбавы суверэнітэт і кантроль дадзеных Гэта спалучэнне мадэлі адкрытых межаў і лакальна разгортваемых лёгкіх мадэляў вельмі распаўсюджана і асабліва актуальна як для прыватных кампаній, так і для дзяржаўных адміністрацый, якія шукаюць альтэрнатывы буйным амерыканскім і кітайскім платформам.

Архітэктура, спалучэнне экспертаў і тэхнічны падыход

Магчымасці «Містраля 3»

Тэхнічнае сэрца Вялікі Містраль 3 Гэта архітэктура, Сумесь экспертаў (MoE), дызайн, у якім мадэль У ім ёсць некалькі ўнутраных «экспертаў»., але актывуе толькі частку з іх для апрацоўкі кожнага токенаНа практыцы сістэма апрацоўвае 41.000 мільярд актыўных параметраў з агульнай колькасці 675.000 мільёнаўГэта дазваляе спалучаць высокую прадукцыйнасць разважанняў з больш кантраляваным спажываннем энергіі і вылічэнняў, чым эквівалентная шчыльная мадэль.

Эксклюзіўны кантэнт - націсніце тут  Астранаўты, якія апынуліся ў пастцы Міжнароднай касмічнай станцыі, вяртаюцца на Зямлю праз дзевяць месяцаў

Гэтая архітэктура ў спалучэнні з ventana de contexto de hasta 256.000 tokensГэта дазваляе Mistral Large 3 апрацоўваць вельмі вялікія аб'ёмы інфармацыі, такія як працяглыя кантракты, тэхнічная дакументацыя або вялікія карпаратыўныя базы ведаў. Мадэль арыентавана на такія выпадкі выкарыстання, як аналіз дакументаў, дапамога ў праграмаванні, стварэнне кантэнту, агенты штучнага інтэлекту і аўтаматызацыя працоўных працэсаў.

Паралельна, мадэлі Міністры 3 Яны прапануюцца ў трох асноўных варыянтах: Base (агульная папярэдне навучаная мадэль), Instruct (аптымізаваны для размоў і задач памочніка) і Reasoning (З улікам лагічных разважанняў і больш глыбокага аналізу). Падтрымліваюцца ўсе версіі visión і яны апрацоўваюць шырокія кантэксты — ад 128 тыс. да 256 тыс. токенаў — захоўваючы пры гэтым сумяшчальнасць з некалькімі мовамі.

Асноўная ідэя, як тлумачыць сузаснавальнік і галоўны навуковец Гіём Лампл, заключаецца ў тым, што ў «больш чым 90%» выпадкаў выкарыстання ў прадпрыемствах, Дастаткова невялікай, добра настроенай мадэлі. і, больш за тое, больш эфектыўныя. Дзякуючы такім метадам, як выкарыстанне сінтэтычныя дадзеныя для канкрэтных задачКампанія сцвярджае, што гэтыя мадэлі могуць наблізіцца або нават перасягнуць больш буйныя закрытыя варыянты ў вельмі спецыфічных прыкладаннях, адначасова зніжаючы выдаткі, затрымкі і рызыкі для прыватнасці.

Уся гэтая экасістэма інтэгравана з больш шырокім спектрам прадуктаў кампаніі: ад API агентаў Mistralз раздымамі для выканання кода, вэб-пошуку або стварэння малюнкаў, да Код Містраля Для дапамогі праграмісту, мадэль разважанняў Magistral і платформы AI Studio разгортваць праграмы, кіраваць аналітыкай і весці журналы выкарыстання.

Супрацоўніцтва з NVIDIA і ўкараненне ў суперкамп'ютарах і перыферыйных вылічэннях

Mistral AI і NVIDIA

Адметнай падзеяй запуску з'яўляецца альянс паміж Mistral AI і NVIDIA, што пазіцыянуе Mistral 3 як сямейства мадэляў, дасканала настроеных для суперкамп'ютэрных сістэм і перыферыйных платформаў амерыканскага вытворцы. Вялікі Містраль 3у спалучэнні з такой інфраструктурай, як NVIDIA GB200 NVL72, паводле звестак NVIDIA паляпшэнне прадукцыйнасці да дзесяці разоў у параўнанні з папярэднім пакаленнем на базе графічных працэсараў H200, выкарыстоўваючы перавагі пашыранага паралелізму, агульнай памяці праз NVLink і аптымізаваных лікавых фарматаў, такіх як НВФП4.

Сумесная праца не абмяжоўваецца толькі высакаякасным абсталяваннем. Серыя Міністры 3 Ён аптымізаваны для хуткай працы ў такіх асяроддзях, як ПК і ноўтбукі з відэакартамі RTX, прылады Jetson і перыферыйныя платформыспрашчэнне лакальных высноў у прамысловых, робататэхнічных або спажывецкіх сцэнарыях. Папулярныя фрэймворкі, такія як Llama.cpp і Ollama Яны былі адаптаваныя для выкарыстання гэтых мадэляў, што спрашчае іх разгортванне распрацоўшчыкамі і ІТ-камандамі.

Акрамя таго, інтэграцыя з экасістэмай NVIDIA NeMo — у тым ліку такія інструменты, як Data Designer, Guardrails і Agent Toolkit — дазваляюць кампаніям выконваць тонкая налада, кантроль бяспекі, аркестроўка агентаў і праектаванне дадзеных на аснове Mistral 3. У той жа час, такія механізмы вываду, як TensorRT-LLM, SGLang і vLLM каб знізіць кошт аднаго токена і павысіць энергаэфектыўнасць.

Мадэлі Mistral 3 цяпер даступныя ў буйных рознічных гандляроў. пастаўшчыкі хмарных паслуг і адкрытыя рэпазіторыіі яны таксама прыбудуць у выглядзе Мікрасэрвісы NIM у каталогу NVIDIA, што асабліва цікава для еўрапейскіх кампаній, якія ўжо працуюць на стэках гэтага вытворцы і жадаюць укараніць генератыўны штучны інтэлект з большым кантролем над разгортваннем.

Уся гэтая структура дазваляе Mistral 3 працаваць як у буйных цэнтрах апрацоўкі дадзеных, так і на перыферыйных прыладах, што ўзмацняе яго апавяданне пра... сапраўды ўсюдыісны і размеркаваны штучны інтэлект, менш залежныя ад дыстанцыйных паслуг і больш адаптаваныя да канкрэтных патрэб кожнага кліента.

Эксклюзіўны кантэнт - націсніце тут  Што такое IDrive?

Невялікія мадэлі, афлайн-разгортванне і выпадкі выкарыстання на перыферыі

Мадэлі штучнага інтэлекту Mistral 3

Адзін са слупоў дыскурсу Містраля заключаецца ў тым, што Большасць рэальных прыкладанняў не патрабуюць максімальна вялікай мадэлі.але такую, якая добра адпавядае канкрэтнаму выпадку выкарыстання і можа быць дакладна настроена з улікам канкрэтных дадзеных. Вось тут і з'яўляюцца дзевяць мадэляў серыі. Міністры 3шчыльныя, высокапрадукцыйныя і даступныя ў розных памерах і варыянтах у залежнасці ад патрабаванняў да кошту, хуткасці або ёмістасці.

Гэтыя мадэлі прызначаны для працы ў адзін графічны працэсар або нават на сціплым абсталяванніГэта дазваляе лакальна разгортваць сістэмы на ўласных серверах, ноўтбуках, прамысловых робатах або прыладах, якія працуюць у аддаленых асяроддзях. Для кампаній, якія апрацоўваюць канфідэнцыйную інфармацыю — ад вытворцаў да фінансавых устаноў або дзяржаўных устаноў — магчымасць запускаць штучны інтэлект у межах уласнай інфраструктуры без адпраўкі дадзеных у воблака з'яўляецца значнай перавагай.

Кампанія прыводзіць такія прыклады, як Фабрычныя робаты, якія аналізуюць дадзеныя датчыкаў у рэжыме рэальнага часу без падключэння да Інтэрнэту, беспілотнікі для надзвычайных сітуацый і выратавання, транспартныя сродкі з паўнафункцыянальнымі памочнікамі штучнага інтэлекту ў зонах без пакрыцця або адукацыйныя інструменты, якія прапануюць студэнтам дапамогу ў аўтаномным рэжыме. Апрацоўваючы дадзеныя непасрэдна на прыладзе, канфідэнцыяльнасць і кантроль інфармацыі de los usuarios.

Лэмпл настойвае на тым, што даступнасць з'яўляецца цэнтральнай часткай місіі «Містраль»: ёсць Мільярды людзей з мабільнымі тэлефонамі або ноўтбукамі, але без надзейнага доступу да Інтэрнэтуякія маглі б атрымаць выгаду ад мадэляў, здольных працаваць лакальна. Такім чынам кампанія спрабуе развеяць меркаванне, што перадавы штучны інтэлект заўсёды павінен быць прывязаны да буйных цэнтраў апрацоўкі дадзеных, якія кантралююцца невялікай групай кампаній.

Паралельна з гэтым, «Містраль» пачаў працаваць з міжнароднымі партнёрамі ў галіне, вядомай як Фізіка штучнага інтэлектуСярод згаданых супрацоўніцтваў — навукова-тэхнічнае агенцтва HTX з Сінгапура, якое займаецца распрацоўкай робатаў, кібербяспекі і сістэм пажарнай абароны, а таксама нямецкае... Helsing, арыентаваны на абарону, з мадэлямі бачання-мовы-дзеяння для беспілотнікаў; і вытворцы аўтамабіляў, якія імкнуцца Памочнікі са штучным інтэлектам у салоне больш эфектыўнымі і кантраляванымі.

Уплыў у Еўропе: лічбавы суверэнітэт і дзяржаўна-прыватная экасістэма

Акрамя тэхнічных аспектаў, «Містраль» стаў эталонам у дыскусіі аб Лічбавы суверэнітэт у ЕўропеНягледзячы на ​​тое, што кампанія вызначае сябе як «трансатлантычнае супрацоўніцтва» — з камандамі і навучаннем мадэляў, размеркаванымі паміж Еўропай і Злучанымі Штатамі, — яе імкненне да адкрытых мадэляў з моцнай падтрымкай еўрапейскіх моў было добра ўспрынята дзяржаўнымі ўстановамі на кантыненце.

Кампанія заключыла здзелкі з французская армія, французскае агенцтва дзяржаўнай занятасці, урад Люксембурга і іншыя еўрапейскія арганізацыі зацікаўлены ва ўкараненні штучнага інтэлекту ў строгіх рэгулятарных рамках і падтрыманні кантролю над дадзенымі ў ЕС. Паралельна з гэтым Еўрапейская камісія прадставіла стратэгія па развіцці еўрапейскіх інструментаў штучнага інтэлекту якія ўмацоўваюць канкурэнтаздольнасць прамысловасці без шкоды для бяспекі і ўстойлівасці.

Геапалітычны кантэкст таксама падштурхоўвае рэгіён да рэакцыі. Прызнаецца, што Еўропа адстала ад ЗША і Кітая У гонцы за мадэлямі наступнага пакалення, у той час як у такіх краінах, як Кітай, з'яўляюцца адкрытыя альтэрнатывы, такія як DeepSeek, Alibaba і Kimi, якія пачынаюць канкураваць з такімі рашэннямі, як ChatGPT, у пэўных задачах, Mistral спрабуе часткова запоўніць гэты прабел адкрытымі, універсальнымі мадэлямі, якія адпавядаюць еўрапейскім рэгулятыўным патрабаванням.

Эксклюзіўны кантэнт - націсніце тут  Microsoft прадстаўляе Copilot Vision: новую эру прагляду вэб-старонак з дапамогай AI

Фінансава стартап сабраў каля 2.700 мільёнаў долараў і перамясцілася ў межах ацэнак, блізкіх да 14.000 мільёнаўГэтыя лічбы значна ніжэйшыя, чым у такіх гігантаў, як OpenAI або Anthropic, але значныя для еўрапейскай экасістэмы. Значная частка бізнес-мадэлі прадугледжвае прапанову, акрамя адкрытых вагаў, паслугі па наладжванні, інструменты разгортвання і карпаратыўныя прадукты такія як API Mistral Agents або пакет Le Chat з карпаратыўнымі інтэграцыямі.

Пазіцыя зразумелая: быць пастаўшчык адкрытай і гнуткай інфраструктуры штучнага інтэлекту што дазваляе еўрапейскім (і іншым рэгіянальным) кампаніям укараняць інавацыі, не будучы цалкам залежнымі ад амерыканскіх платформаў, захоўваючы пры гэтым пэўны кантроль над тым, дзе і як працуюць мадэлі, і спрашчаючы інтэграцыю з інструментамі, якія ўжо рэалізаваны ў іх сістэмах.

Дыскусія аб рэальнай адкрытасці і непазбежных выкліках

Нягледзячы на ​​энтузіязм, які выклікае «Містраль-3» у часткі тэхналагічнай супольнасці, няма недахопу ў крытычных галасах, якія ставяць пад сумнеў... наколькі гэтыя мадэлі сапраўды можна лічыць "адкрыты зыходны код"Кампанія абрала падыход адкрытая вагаЁн вызваляе вагі для выкарыстання і адаптацыі, але не абавязкова ўсе падрабязнасці аб навучальных дадзеных і ўнутраных працэсах, неабходных для ўзнаўлення мадэлі з нуля.

Investigadores como Андрэас Лізенфельд, сузаснавальнік Еўрапейскага індэкса штучнага інтэлекту з адкрытым зыходным кодам, Яны адзначаюць, што галоўнай перашкодай для штучнага інтэлекту ў Еўропе з'яўляецца не толькі доступ да мадэляўале да маштабныя навучальныя дадзеныяЗ гэтага пункту гледжання, «Містраль-3» спрыяе пашырыць асартымент прыдатных мадэляўАднак гэта не вырашае цалкам асноўную праблему еўрапейскай экасістэмы, якая працягвае з цяжкасцю ствараць і абменьвацца высакаякаснымі масіўнымі наборамі даных.

Сама кампанія «Містраль» прызнае, што яе мадэлі адкрытай планіроўкі «трохі адстаюць» ад больш прасунутых закрытых рашэнняў, але Ён настойвае на тым, што разрыў хутка скарачаецца. і што ключавы момант — гэта суадносіны выдаткаў і выгодКалі крыху менш магутную мадэль можна разгарнуць з нізкімі выдаткамі, наладзіць пад канкрэтную задачу і працаваць блізка да карыстальніка, Для многіх кампаній гэта можа быць больш цікавым, чым топ-мадэль да якіх можна атрымаць доступ толькі праз аддалены API.

Тым не менш, праблемы застаюцца: ад жорсткая міжнародная канкурэнцыя Гэта распаўсюджваецца на неабходнасць гарантаваць бяспеку, адсочванне і выкананне заканадаўчых патрабаванняў у такіх сферах, як ахова здароўя, фінансы і ўрад. Баланс паміж адкрытасцю, кантролем і адказнасцю будзе і надалей кіраваць «Містралем» і іншымі еўрапейскімі гульцамі ў бліжэйшыя гады.

Запуск Містраль 3 Гэта падмацоўвае ідэю таго, што перадавы штучны інтэлект не павінен абмяжоўвацца гіганцкімі замкнёнымі мадэлямі.і прапануе Еўропе — і любой арганізацыі, якая шануе тэхналагічны суверэнітэт, — палітру адкрытых інструментаў, якія спалучаюць шматмадальную памежную мадэль з шэрагам лёгкіх мадэляў, здольных працаваць на мяжы, афлайн і з узроўнем налады, які цяжка параўнаць з чыста запатэнтаванымі платформамі.

Як выкарыстоўваць свой ПК у якасці лакальнага цэнтра штучнага інтэлекту
Падобны артыкул:
Як выкарыстоўваць ПК у якасці лакальнага цэнтра штучнага інтэлекту: практычны і параўнальны дапаможнік