മൈക്രോസോഫ്റ്റിന്റെ MAI-Voice-1 ഒരു സെക്കൻഡിനുള്ളിൽ ഒരു മിനിറ്റ് ശബ്‌ദം സൃഷ്ടിക്കുന്നു: കോപൈലറ്റിലേക്കും ഏതൊരു ആപ്പിലേക്കും "സ്വാഭാവിക" വോയ്‌സ്‌ഓവർ കൊണ്ടുവരാൻ ഇത് ലക്ഷ്യമിടുന്നത് ഇങ്ങനെയാണ്.

അവസാന അപ്ഡേറ്റ്: 01/09/2025

  • ഒരൊറ്റ GPU ഉപയോഗിച്ച് 1 സെക്കൻഡിനുള്ളിൽ 1 മിനിറ്റ് ഓഡിയോ സൃഷ്ടിക്കുക
  • ഒന്നിലധികം സ്പീക്കറുകൾ ഉള്ള സാഹചര്യങ്ങളിൽ പോലും സ്വാഭാവികവും ആവിഷ്‌കൃതവുമായ ശബ്ദങ്ങൾ
  • കോപൈലറ്റ് ഡെയ്‌ലി, പോഡ്‌കാസ്റ്റുകൾ, കോപൈലറ്റ് ലാബുകളിലെ ട്രയലുകൾ എന്നിവയിൽ ലഭ്യമാണ്.
  • കഥപറച്ചിൽ, ധ്യാനം, ഉപഭോക്തൃ സേവനം എന്നിവയ്ക്കും മറ്റും വേണ്ടിയുള്ള ആപ്പുകൾ.

മൈക്രോസോഫ്റ്റ് AI വോയ്‌സ് മോഡൽ

മൈക്രോസോഫ്റ്റ് MAI-വോയ്‌സ്-1 അവതരിപ്പിച്ചു, വേഗതയിലും ഓഡിയോ ഗുണനിലവാരത്തിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന ഒരു സ്പീച്ച് സിന്തസിസ് സിസ്റ്റം. ദൈനംദിന ഉൽപ്പന്നങ്ങളിലേക്കും അനുഭവങ്ങളിലേക്കും സംയോജിപ്പിക്കാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന ഈ വോയ്‌സ് എഞ്ചിൻ വ്യക്തമായ അഭിലാഷങ്ങളോടെയാണ് എത്തുന്നത്: സ്വാഭാവിക ശബ്ദം, റെക്കോർഡ് സമയത്ത് പ്രതികരിക്കുകയും കാര്യമായ കമ്പ്യൂട്ടിംഗ് പവർ ഇല്ലാതെ വിന്യാസം സുഗമമാക്കുകയും ചെയ്യുക..

സഹായികൾക്കും ഉള്ളടക്കത്തിനും വേണ്ടി ശബ്ദത്തെ ഒരു ദ്രാവക ഇന്റർഫേസാക്കി മാറ്റുക എന്നതാണ് ലക്ഷ്യം. പരീക്ഷണങ്ങളിലും പൊതു പ്രദർശനങ്ങളിലും, മോഡൽ അതിന്റെ കാര്യക്ഷമതയാൽ വേറിട്ടുനിൽക്കുന്നു: ഒരു സെക്കൻഡിനുള്ളിൽ ഒരു മിനിറ്റ് മുഴുവൻ വോയ്‌സ്‌ഓവർ നിർമ്മിക്കാൻ കഴിവുള്ളതാണ്, വ്യത്യസ്ത വായനാ ശൈലികൾക്കായി യാഥാർത്ഥ്യബോധമുള്ളതും നിയന്ത്രിതവുമായ ശബ്ദം നിലനിർത്തുന്നു.

MAI-വോയ്‌സ്-1: സ്വാഭാവിക ശബ്ദവും അതിശയിപ്പിക്കുന്ന പ്രകടനവും.

സ്പീച്ച് സിന്തസിസ് സാങ്കേതികവിദ്യ

ഏറ്റവും ശ്രദ്ധേയമായ സാങ്കേതിക ഡാറ്റ അതിന്റെ അനുമാന പ്രകടനമാണ്. സിസ്റ്റം സൃഷ്ടിക്കുന്നത് ഒരൊറ്റ GPU ഉപയോഗിച്ച് ഏതാണ്ട് തൽക്ഷണം 60 സെക്കൻഡ് ഓഡിയോ, ഉടനടി പ്രതികരണം ആവശ്യമുള്ള അനുഭവങ്ങൾക്ക് ഇത് വളരെ മത്സരാധിഷ്ഠിതമായ ഒരു ഓപ്ഷനാക്കി മാറ്റുന്നു.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  ചെയ്യാൻ ക്ലിക്ക് ചെയ്യുന്നതിനെക്കുറിച്ചുള്ള എല്ലാം: നിങ്ങളുടെ സ്‌ക്രീനിനായി വിൻഡോസ് 11-ൻ്റെ നവീകരണം

ഗുണനിലവാരവും ഒരു പ്രധാന കഥാപാത്രമാണ്: ടിംബ്രെ, സ്വരസൂചകം, ശബ്ദം താൽക്കാലികമായി നിർത്തുന്നു പ്രകടിപ്പിക്കുന്നതും വിശ്വസനീയവും, സിംഗിൾ- അല്ലെങ്കിൽ മൾട്ടി-വോയ്‌സ് സാഹചര്യങ്ങൾക്കുള്ള പിന്തുണയോടെ. വിശ്വസ്തതയും വേഗതയും തമ്മിലുള്ള ഈ സന്തുലിതാവസ്ഥ ശ്രദ്ധ തിരിക്കാത്ത, മറിച്ച് ഉള്ളടക്കത്തിനൊപ്പം വരുന്ന ഒരു സിന്തറ്റിക് ശബ്ദത്തിന് പ്രധാനമാണ്.

എവിടെയാണ് ഇത് പരീക്ഷിക്കുന്നത്, ഏതൊക്കെ ഉപകരണങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു

MAI-വോയ്‌സ്-1 ഇപ്പോൾ കോപൈലറ്റ് ഡെയ്‌ലിയിലും പോഡ്‌കാസ്റ്റുകളിലും സംയോജിപ്പിച്ചിരിക്കുന്നു., അവിടെ അത് സംഭാഷണ സംഗ്രഹങ്ങളും ഉടനടി സൃഷ്ടിക്കുന്ന ഉള്ളടക്കവും പ്രോത്സാഹിപ്പിക്കുന്നു. ഇത് കോപൈലറ്റ് ലാബുകളിലും ലഭ്യമാണ്., ആർക്കും പരീക്ഷിക്കാൻ കഴിയുന്ന തരത്തിൽ മൈക്രോസോഫ്റ്റ് പുതിയ സവിശേഷതകൾ പ്രദർശിപ്പിക്കുന്ന ഒരു അന്തരീക്ഷം.

ഈ പരീക്ഷണ സ്ഥലത്ത്, മോഡലിന്റെ സാധ്യതകൾ പര്യവേക്ഷണം ചെയ്യുന്നതിനായി കഥപറച്ചിലും ആവിഷ്‌കാരാത്മകമായ സംഭാഷണ അനുഭവങ്ങളും കമ്പനി വാഗ്ദാനം ചെയ്യുന്നു. പ്രകടനങ്ങൾ നിങ്ങളെ പരീക്ഷിക്കാൻ അനുവദിക്കുന്നു AI എങ്ങനെ പ്രതികരിക്കുന്നു കൂടുതൽ വൈകാരികമോ വിവരണാത്മകമോ ആയ വായനാ ശൈലികൾ, ഉയർന്ന വേഗതയിൽ പോലും അത് എങ്ങനെ വ്യക്തത നിലനിർത്തുന്നു എന്നും.

ഉപയോഗ ആശയങ്ങളും സാഹചര്യങ്ങളും

ആപ്ലിക്കേഷനുകളുടെ ശ്രേണി വിശാലമാണ്. കഥപറച്ചിൽ, ഓഡിയോ ഗൈഡുകൾ അല്ലെങ്കിൽ ധ്യാനങ്ങൾ, മോഡലിന്റെ ആവിഷ്കാരശേഷി റോബോട്ടിക് ആയി തോന്നാതെ ഉദ്ദേശ്യം അറിയിക്കാൻ സഹായിക്കുന്നു, ആഴത്തിലുള്ള ഉള്ളടക്കത്തിൽ ഈ ആവശ്യകതയ്ക്ക് കൂടുതൽ പ്രാധാന്യം നൽകുന്നു.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  ആൽഫ്രഡ് നോബലിന്റെ കണ്ടുപിടുത്തങ്ങൾ എന്തായിരുന്നു?

ബിസിനസ് മേഖലയിൽ, വോയ്‌സ്‌ഓവർ ജനറേഷൻ വേഗത്തിലാക്കാൻ കഴിയും ആന്തരിക പരിശീലനം, ഉപഭോക്തൃ സേവനം അല്ലെങ്കിൽ മാർക്കറ്റിംഗിനായി മൾട്ടിമീഡിയ പീസുകൾ. MAI-Voice-1 ന്റെ വേഗത ഉൽ‌പാദന സമയം കുറയ്ക്കുകയും ശരിയായ ടോൺ കണ്ടെത്തുന്നതുവരെ ആവർത്തിക്കുന്നത് എളുപ്പമാക്കുകയും ചെയ്യുന്നു.

മറ്റൊരു വാഗ്ദാനമായ വരികൾ കൂടുതൽ സ്വാഭാവികമായി കേൾക്കാൻ വളരെ കുറഞ്ഞ ലേറ്റൻസികൾ ആവശ്യമാണ്.വേഗതയേറിയതും വഴക്കമുള്ളതുമായ എഞ്ചിൻ ഉപയോഗിച്ച്, വലിയ അടിസ്ഥാന സൗകര്യങ്ങളെ ആശ്രയിക്കാതെ തന്നെ ശബ്ദത്തെ സംവേദനാത്മക പ്രവാഹങ്ങളിലേക്ക് സംയോജിപ്പിക്കുന്നത് എളുപ്പമാണ്..

ഉൽപ്പന്നത്തിനും ചെലവുകൾക്കും ഇത് എന്തുകൊണ്ട് പ്രധാനമാണ്

കമ്പ്യൂട്ടിംഗ് കാര്യക്ഷമത ചെലവ് വർദ്ധിപ്പിക്കാതെ സ്കെയിലിംഗ് അനുവദിക്കുന്നു: ഒരൊറ്റ GPU ഉപയോഗിച്ച് പ്രവർത്തിക്കാൻ കഴിയും ഇത് പ്രവേശനത്തിനുള്ള തടസ്സങ്ങൾ കുറയ്ക്കുകയും ഉൽപ്പന്ന ടീമുകൾക്കും സ്വതന്ത്ര സ്രഷ്ടാക്കൾക്കും കൂടുതൽ ആക്‌സസ് ചെയ്യാവുന്ന പൈലറ്റുകളിലേക്കും വിന്യാസങ്ങളിലേക്കും വാതിൽ തുറക്കുകയും ചെയ്യുന്നു.

അതേസമയം, മൈക്രോസോഫ്റ്റ് അതിന്റെ ശബ്ദ സംവിധാനങ്ങളിൽ ഉത്തരവാദിത്തമുള്ള രൂപകൽപ്പനയുടെ പ്രാധാന്യം ഊന്നിപ്പറയുന്നു: ആവിഷ്കാരക്ഷമത മനസ്സിലാക്കലിലും ഉപയോഗക്ഷമതയിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു, അതിന് വികാരങ്ങളോ ഉദ്ദേശ്യങ്ങളോ ആരോപിക്കാതെ മോഡലിനോട്. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, മറുവശത്ത് ഒരാൾ ഉണ്ടെന്ന് വിശ്വസിക്കാൻ പ്രേരിപ്പിക്കാത്ത ബോധ്യപ്പെടുത്തുന്ന ശബ്ദം.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  മൈക്രോസോഫ്റ്റ് കോപൈലറ്റ് വിഷൻ അവതരിപ്പിക്കുന്നു: AI-അസിസ്റ്റഡ് വെബ് ബ്രൗസിംഗിൻ്റെ പുതിയ യുഗം

ഈ നിർദ്ദേശത്തിലൂടെ, MAI-Voice-1 ഒരു പ്രധാന ഭാഗമായി മാറാൻ ലക്ഷ്യമിടുന്നു അടുത്ത തലമുറയിലെ സംസാര അനുഭവങ്ങൾ: വേഗതയേറിയതും, വഴക്കമുള്ളതും, ആകർഷകമായ ഓഡിയോയുംപ്രതികരണ സമയവും ഗുണനിലവാരവും വ്യത്യാസം വരുത്തുന്ന ഉൽപ്പന്നങ്ങളിലേക്ക് സുഗമമായി സംയോജിപ്പിക്കാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു.