- Gin 1 mionaid de chlaistinn ann an nas lugha na 1 diog le aon GPU
- Guthan nàdarrach is faireachail, fiù 's ann an suidheachaidhean le iomadh neach-labhairt
- Ri fhaighinn air Copilot Daily, Podcasts, agus deuchainnean ann an Copilot Labs
- Aplacaidean airson sgeulachdan, meòrachadh, seirbheis teachdaiche, agus barrachd
Tha Microsoft air MAI-Voice-1 a thoirt a-steach, siostam co-chur cainnte a tha ag amas air astar agus càileachd claisneachd. Air a dhealbhadh gus a bhith air a thoirt a-steach do thoraidhean agus eòlasan làitheil, tha amasan soilleir aig an einnsean gutha seo: sonar natural, freagairt ann an ùine clàraidh agus cleachdadh a dhèanamh nas fhasa gun chumhachd coimpiutaireachd mòr.
’S e an t-amas guth a dhèanamh na eadar-aghaidh shìmplidh do luchd-cuideachaidh agus susbaint. Ann an deuchainnean agus taisbeanaidhean poblach, tha am modail a’ seasamh a-mach airson a èifeachdas: comasach air mionaid slàn de ghuth-thairis a thoirt gu buil ann an nas lugha na diog, a’ cumail suas tòna reusanta agus fo smachd airson diofar stoidhlichean leughaidh.
MAI-Guth-1: Guth nàdarrach agus coileanadh iongantach

Is e an dàta teicnigeach as iongantaiche a choileanadh co-dhùnaidh. Bidh an siostam a’ gineadh 60 diogan de chlaistinn ann an ùine cha mhòr sa bhad le bhith a’ cleachdadh aon GPU, ga dhèanamh na roghainn farpaiseach airson eòlasan a dh’ fheumas freagairt sa bhad.
Tha càileachd cuideachd na phrìomh charactar: fuaim an timbre, an tòna agus na stadan abairteach agus creidsinneach, le taic airson suidheachaidhean aon-ghuthach no ioma-ghuthach. Tha an cothromachadh seo eadar dìlseachd agus astar deatamach do ghuth synthetigeach nach cuir dragh air daoine, ach an àite sin a’ dol leis an t-susbaint.
Càite an tèid a dhearbhadh agus dè na h-innealan a tha e a’ tabhann
Tha MAI-Voice-1 a-nis air a thoirt a-steach do Copilot Daily agus Podcasts, far a bheil e a’ brosnachadh geàrr-chunntasan labhairteach agus susbaint a chaidh a chruthachadh sa bhad. Tha e ri fhaighinn ann an Copilot Labs cuideachd., an àrainneachd far a bheil Microsoft a’ taisbeanadh fheartan ùra gus an urrainn do dhuine sam bith deuchainnean a dhèanamh leotha.
Anns an àite deuchainn seo, tha a’ chompanaidh a’ tabhann eòlasan innse sgeulachdan agus cainnte faireachail a tha ag amas air comas a’ mhodail a sgrùdadh. Leigidh taisbeanaidhean leat deuchainn a dhèanamh mar a bhios AI a’ freagairt ri stoidhlichean leughaidh nas tòcail no nas tuairisgeulach, agus mar a chumas e soilleireachd eadhon aig astaran àrda.
Beachdan cleachdaidh agus suidheachaidhean
Tha raon farsaing de thagraidhean ann. sgeulachdan, stiùiridhean claisneachd no meòrachadh, bidh comas-labhairt a’ mhodail a’ cuideachadh le bhith a’ cur an cèill rùn gun a bhith a’ fuaimeachadh robotach, riatanas a tha a’ sìor fhàs luachmhor ann an susbaint bogaidh.
Anns an raon gnìomhachais, faodaidh gineadh gutha luathachadh trèanadh a-staigh, seirbheis luchd-cleachdaidh no pìosan ioma-mheadhain airson margaidheachd. Bidh astar MAI-Voice-1 a’ lughdachadh amannan cinneasachaidh agus ga dhèanamh nas fhasa ath-aithris gus an lorg thu an tòna ceart.
Loidhne gealltanach eile is iad sin an fheadhainn a tha feumaidh latencies glè ìosal gus fuaim nas nàdarra beòLe einnsean luath is sùbailte, Tha e nas fhasa guth a thoirt a-steach do shruthan eadar-ghnìomhach gun a bhith an urra ri bun-structaran mòra.
Carson a tha e cudromach airson toradh agus cosgaisean
Èifeachdas coimpiutaireachd a’ ceadachadh sgèileadh gun chosgaisean a mheudachadh: a bhith comasach air obrachadh le aon GPU Bidh e a’ lughdachadh bhacaidhean a thaobh inntrigidh agus a’ fosgladh an dorais gu pròiseactan pìleat is cleachdadh nas ruigsinniche, an dà chuid do sgiobaidhean toraidh agus do luchd-cruthachaidh neo-eisimeileach.
Aig an aon àm, tha Microsoft a’ cur cuideam air cho cudromach sa tha dealbhadh cunntachail anns na siostaman gutha aige: tha fòcas air tuigse agus feumailteachd ann an abairteachd, gun faireachdainnean no rùintean a chur ris don mhodail. Ann am faclan eile, guth cinnteach nach toir air neach a chreidsinn gu bheil neach air a’ cheann eile.
Leis a’ mholadh seo, tha MAI-Voice-1 ag amas air a bhith na phàirt chudromach de eòlasan labhairteach an ath ghinealaich: Luath, sùbailte, agus le claisneachd tarraingeach, air a dhealbhadh gus amalachadh gu rèidh ann am bathar far a bheil ùine freagairt agus càileachd a’ dèanamh an diofar.
Tha mi dèidheil air teicneòlas a tha air na h-ùidhean “geek” aige a thionndadh gu dreuchd. Tha mi air còrr air 10 bliadhna de mo bheatha a chuir seachad a’ cleachdadh teicneòlas ùr-nodha agus a’ tinkering le gach seòrsa prògram a-mach à fìor fheòrachas. A-nis tha mi air speisealachadh ann an teicneòlas coimpiutair agus geamannan bhidio. Tha seo air sgàth gu bheil mi airson còrr is 5 bliadhna air a bhith a’ sgrìobhadh airson diofar làraich-lìn air teicneòlas agus geamannan bhidio, a’ cruthachadh artaigilean a bhios a’ feuchainn ris an fhiosrachadh a tha a dhìth ort a thoirt dhut ann an cànan a tha furasta a thuigsinn don h-uile duine.
Ma tha ceist sam bith agad, tha an t-eòlas agam a’ dol bho gach nì co-cheangailte ri siostam-obrachaidh Windows a bharrachd air Android airson fònaichean-làimhe. Agus tha mo dhealas dhut, tha mi an-còmhnaidh deònach beagan mhionaidean a chaitheamh agus do chuideachadh le bhith a’ fuasgladh cheistean sam bith a dh’ fhaodadh a bhith agad san t-saoghal eadar-lìn seo.