Microsoften MAI-Voice-1-ek segundo bat baino gutxiagoan minutu bateko ahotsa sortzen du: horrela lortu nahi du Copilot-era eta edozein aplikaziotara ahots-off "naturala" ekartzea.

Azken eguneratzea: 01/09/2025

  • Sortu minutu bateko audioa segundo 1 baino gutxiagoan GPU bakarrarekin
  • Ahots natural eta adierazkorrak, hizlari anitz dauden egoeretan ere
  • Eskuragarri Copilot Daily, Podcast eta Copilot Labs-eko proba-probetan
  • Ipuinak kontatzeko, meditaziorako, bezeroarentzako arretarako eta gehiagorako aplikazioak

Microsoft-en AI ahots-eredua

Microsoftek MAI-Voice-1 aurkeztu du, abiaduran eta audioaren kalitatean oinarritzen den ahots-sintesi sistema bat. Eguneroko produktu eta esperientzietan integratzeko diseinatua, ahots-motor hau anbizio argiekin iristen da: naturala dirudi, denbora errekorrean erantzun eta hedapena erraztu konputazio-ahalmen handirik gabe.

Helburua ahotsa laguntzaileentzako eta edukientzako interfaze fluido bihurtzea da. Probetan eta jendaurreko erakustaldietan, eredua bere eraginkortasunagatik nabarmentzen da: segundo bat baino gutxiagoan minutu oso bat ahots-off ekoizteko gai da, irakurketa estilo desberdinetarako tinbre errealista eta kontrolatua mantenduz.

MAI-Voice-1: Ahots naturala eta emanaldi liluragarria

Ahots-sintesi teknologia

Datu tekniko deigarriena bere inferentzia-errendimendua da. Sistemak sortzen du 60 segundoko audioa ia berehala GPU bakarra erabiliz, erantzun berehalakoa behar duten esperientzietarako aukera oso lehiakorra bihurtuz.

Eduki esklusiboa - Egin klik hemen  Anthropic-ek Claude 3.7 Sonetoa aurkezten du: AI hibridoa arrazoibide aurreratuarekin

Kalitatea ere protagonista da: tinbrea, intonazioa eta etenaldiak soinua dute adierazgarria eta sinesgarria, ahots bakarreko edo anitzeko eszenatokietarako laguntzarekin. Fideltasunaren eta abiaduraren arteko oreka hori funtsezkoa da arreta galarazten ez duen ahots sintetiko bat lortzeko, edukia laguntzen duena baizik.

Non probatzen den eta zer tresna eskaintzen dituen

MAI-Voice-1 orain Copilot Daily eta Podcasts-en integratuta dago, non ahozko laburpenak eta berehala sortutako edukia sustatzen dituen. Copilot Labs-en ere eskuragarri dago, Microsoft-ek ezaugarri berriak erakusten dituen ingurunea, edonork esperimentatu ahal izan dezan.

Proba-espazio honetan, enpresak istorioak kontatzeko eta adierazkortasun handiko hizketa-esperientziak eskaintzen ditu, modeloaren potentziala aztertzeko helburuarekin. Erakustaldiek probatzeko aukera ematen dizute. nola erantzuten dion IA-k Irakurketa estilo emozionalagoak edo deskribatzaileagoak, eta nola mantentzen duen argitasuna abiadura handietan ere.

Erabilera ideiak eta eszenatokiak

Aplikazio sorta zabala da. Hau da ipuin kontalaritza, audio gidak edo meditazioak, modeloaren adierazkortasunak asmoa transmititzen laguntzen du robotiko itxurarik gabe, murgiltze-edukietan gero eta baloratzen den baldintza bat.

Eduki esklusiboa - Egin klik hemen  Nola erabili Microsoft Designer zure sormen-proiektuak hobetzeko

Negozioen arloan, ahots-offaren sorkuntza bizkortu daiteke barne prestakuntza, bezeroarentzako arreta edo marketinerako multimedia piezak. MAI-Voice-1-en abiadurak ekoizpen denborak murrizten ditu eta tonu egokia aurkitu arte iterazioak errazten ditu.

Beste lerro itxaropentsu bat da Zuzenean naturalago entzuteko latentzia oso baxuak behar dituzteMotor azkar eta moldagarri batekin, Errazagoa da ahotsa fluxu interaktiboetan integratzea azpiegitura handien menpe egon gabe.

Zergatik den garrantzitsua produktuarentzat eta kostuentzat

Konputazio-eraginkortasuna eskalatzea ahalbidetzen du kostuak handitu gabe: GPU bakarrarekin funtzionatu ahal izatea Sarrerako oztopoak murrizten ditu eta ateak irekitzen ditu pilotu eta hedapen eskuragarriagoetarako, bai produktu-taldeentzat, bai sortzaile independenteentzat.

Aldi berean, Microsoftek bere ahots-sistemetan diseinu arduratsuaren garrantzia azpimarratzen du: adierazkortasuna ulermenean eta erabilgarritasunean oinarritzen da, sentimenduak edo asmoak egotzi gabe modeloari. Beste era batera esanda, beste aldean norbait dagoenik sinetsarazten ez duen ahots sinesgarria.

Eduki esklusiboa - Egin klik hemen  Nola erabiliko da ahotsa ezagutzeko teknologia etorkizuneko ordenagailu pertsonaletan?

Proposamen honekin, MAI-Voice-1-ek funtsezko pieza bihurtu nahi du hurrengo belaunaldiko ahozko esperientziak: Azkarra, malgua eta audio erakargarriarekin, erantzun-denborak eta kalitateak aldea eragiten duten produktuetan ezin hobeto integratzeko diseinatua.