- Генерацыя 1 хвіліны аўдыё менш чым за 1 секунду з дапамогай аднаго графічнага працэсара
- Натуральныя і выразныя галасы, нават у сітуацыях з некалькімі дынамікамі
- Даступна на Copilot Daily, у падкастах і з пробнымі версіямі ў Copilot Labs
- Праграмы для апавядання гісторый, медытацыі, абслугоўвання кліентаў і іншага

Microsoft прадставіла MAI-Voice-1, сістэма сінтэзу маўлення, якая сканцэнтравана на хуткасці і якасці гуку. Распрацаваны для інтэграцыі ў паўсядзённыя прадукты і ўражанні, гэты галасавы рухавік мае выразна акрэсленыя амбіцыі: sonar natural, рэагуюць у рэкордна кароткія тэрміны і спрашчаюць разгортванне без значных вылічальных магутнасцей.
Мэта складаецца ў тым, каб зрабіць голас гнуткім інтэрфейсам для памочнікаў і кантэнту. У тэстах і публічных дэманстрацыях мадэль вылучаецца сваёй эфектыўнасцю: здольны стварыць агучку працягласцю ў цэлую хвіліну менш чым за секунду, захоўваючы рэалістычны і кантраляваны тэмбр для розных стыляў чытання.
MAI-Voice-1: Натуральны голас і захапляльнае выкананне

Найбольш уражлівымі тэхнічнымі дадзенымі з'яўляюцца іх эфектыўнасць вываду. Сістэма генеруе 60 секунд аўдыё амаль імгненна з выкарыстаннем аднаго графічнага працэсара, што робіць яго вельмі канкурэнтаздольным варыянтам для тых, хто патрабуе неадкладнага рэагавання.
Якасць — гэта таксама галоўная рыса: тэмбр, інтанацыя і паўзы гучаць выразны і праўдападобны, з падтрымкай адна- або шматгаласовага гучання. Гэты баланс паміж дакладнасцю і хуткасцю з'яўляецца ключом да сінтэтычнага голасу, які не адцягвае ўвагу, а хутчэй суправаджае змест.
Дзе праходзіць тэставанне і якія інструменты прапануе
MAI-Voice-1 цяпер інтэграваны ў Copilot Daily і Podcasts, дзе ён прасоўвае галасавыя рэзюмэ і кантэнт, які генеруецца на хаду. Таксама даступна ў Copilot Labs, асяроддзе, дзе Microsoft дэманструе новыя функцыі, каб кожны мог з імі эксперыментаваць.
У гэтай тэставай прасторы кампанія прапануе вопыт апавядання гісторый і экспрэсіўнага маўлення, накіраваны на вывучэнне патэнцыялу мадэлі. Дэманстрацыі дазваляюць праверыць як рэагуе штучны інтэлект больш эмацыйныя або больш апісальныя стылі чытання, і як ён захоўвае выразнасць нават на высокіх хуткасцях.
Ідэі і сцэнарыі выкарыстання
Дыяпазон прымянення шырокі. Для апавяданні, аўдыягіды або медытацыі, выразнасць мадэлі дапамагае перадаць намер, не гучачы пры гэтым рабатызавана, што ўсё часцей цэніцца ў іммерсіўным кантэнце.
У бізнес-сферы стварэнне агучкі можа паскорыць унутранае навучанне, абслугоўванне кліентаў або мультымедыйныя матэрыялы для маркетынгу. Хуткасць MAI-Voice-1 скарачае час вытворчасці і спрашчае ітэрацыі, пакуль вы не знойдзеце патрэбны тон.
Яшчэ адна перспектыўная лінія — гэта тыя, што патрабуюць вельмі нізкіх затрымак для больш натуральнага гучання ўжывуюЗ хуткім і падатлівым рухавіком, Прасцей інтэграваць голас у інтэрактыўныя патокі, не абапіраючыся на вялікія інфраструктуры.
Чаму гэта важна для прадукту і выдаткаў
Эфектыўнасць вылічэнняў дазваляе маштабаванне без павелічэння выдаткаў: магчымасць працаваць з адным графічным працэсарам Гэта зніжае бар'еры для ўваходу і адкрывае дзверы для больш даступных пілотных праектаў і разгортванняў як для каманд распрацоўшчыкаў прадуктаў, так і для незалежных стваральнікаў.
Адначасова Microsoft падкрэслівае важнасць адказнага дызайну сваіх галасавых сістэм: выразнасць сканцэнтравана на разуменні і карыснасці, не прыпісваючы яму пачуццяў ці намераў да мадэлі. Іншымі словамі, пераканаўчы голас, які не прымушае паверыць, што на другім канцы провада ёсць чалавек.
Дзякуючы гэтай прапанове, MAI-Voice-1 імкнецца стаць ключавым элементам для вусны вопыт наступнага пакалення: Хуткі, гнуткі і з пераканаўчым гукам, прызначаны для бясшвоўнай інтэграцыі ў прадукты, дзе час рэагавання і якасць маюць вырашальнае значэнне.
Я энтузіяст тэхналогій, які ператварыў свае інтарэсы "гікаў" у прафесію. Я правёў больш за 10 гадоў свайго жыцця, выкарыстоўваючы перадавыя тэхналогіі і важдаючыся з рознымі праграмамі з чыстай цікаўнасці. Цяпер я спецыялізаваўся на камп'ютарных тэхналогіях і відэагульнях. Гэта таму, што больш за 5 гадоў я працаваў для розных вэб-сайтаў, прысвечаных тэхналогіям і відэагульням, ствараючы артыкулы, якія імкнуцца даць вам неабходную інфармацыю на мове, зразумелай кожнаму.
Калі ў вас ёсць якія-небудзь пытанні, я ведаю ўсё, што звязана з аперацыйнай сістэмай Windows і Android для мабільных тэлефонаў. І я перад вамі абавязаны: я заўсёды гатовы выдаткаваць некалькі хвілін і дапамагчы вам вырашыць любыя пытанні, якія могуць узнікнуць у гэтым свеце Інтэрнэту.