NVIDIA Fugatto: ശബ്ദത്തിൻ്റെ ഭാവി രൂപാന്തരപ്പെടുത്തുന്നതിനുള്ള നൂതന AI

അവസാന പരിഷ്കാരം: 25/11/2024

nvidia fugatto-1

എൻവിഡിയയ്ക്ക് നന്ദി, ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസിൻ്റെ ലോകം വീണ്ടും ശ്രദ്ധേയമായ കുതിച്ചുചാട്ടം നടത്തുന്നു, ഫുഗാട്ടോ അവതരിപ്പിച്ചത്, ശബ്ദങ്ങൾ സൃഷ്ടിക്കുകയും രൂപാന്തരപ്പെടുത്തുകയും ചെയ്യുന്ന രീതിയിൽ വിപ്ലവം സൃഷ്ടിക്കുമെന്ന് വാഗ്ദാനം ചെയ്യുന്ന ഒരു അവൻ്റ്-ഗാർഡ് മോഡൽ. ഈ ഉപകരണം ഓഫർ ചെയ്യാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു സംഗീതം, വീഡിയോ ഗെയിമുകൾ, പരസ്യം ചെയ്യൽ തുടങ്ങിയ മേഖലകളിലെ വിപുലമായ പരിഹാരങ്ങൾ. ആദ്യം മുതൽ ഓഡിയോ മാറ്റാനും സൃഷ്ടിക്കാനുമുള്ള അതുല്യമായ കഴിവുകളോടെ, ഒരു യഥാർത്ഥ സാങ്കേതിക രത്നമായി മാറാനാണ് ഫുഗാട്ടോ ലക്ഷ്യമിടുന്നത്.

ഫുഗാട്ടോ എന്ന പേരിൻ്റെ ഉത്ഭവം ശാസ്ത്രീയ സംഗീത പദങ്ങളിൽ നിന്നാണ്, ഒരു ഫ്യൂഗിൻ്റെ സങ്കീർണ്ണതയും സൂക്ഷ്മതയും ഉണർത്തുന്നു, എന്നാൽ ആധുനിക ശബ്ദ പരിതസ്ഥിതിയിൽ പ്രയോഗിക്കുന്നു. നിങ്ങൾ എപ്പോഴെങ്കിലും സങ്കൽപ്പിച്ചിട്ടുണ്ടെങ്കിൽ ഒരു ലളിതമായ വിവരണത്തിൽ നിന്ന് ഒരു ഗാനം സൃഷ്ടിക്കുക അല്ലെങ്കിൽ നിലവിലുള്ള ശബ്ദത്തെ പൂർണ്ണമായും പുതിയതാക്കി മാറ്റുക, ഈ AI അത് സാധ്യമാക്കാൻ പ്രാപ്തമാണ്.

പുതുമയും കൃത്യതയും സമന്വയിപ്പിക്കുന്ന ഒരു യന്ത്രം

NVIDIA Fugatto ടെക്‌സ്‌റ്റിൽ നിന്ന് ഓഡിയോ സൃഷ്‌ടിക്കാനുള്ള കഴിവിന് വേറിട്ടുനിൽക്കുന്നു. ജാസ് താളങ്ങളുള്ള ഒരു മെലാഞ്ചോളിക് പിയാനോ മെലഡി മുതൽ പക്ഷികളുടെ ചിലമ്പുള്ള പ്രഭാതമായി പരിണമിക്കുന്ന കൊടുങ്കാറ്റ് വരെ - സാധ്യതകൾ പ്രായോഗികമായി പരിധിയില്ലാത്തതാണ്. ComposableART എന്ന് വിളിക്കുന്ന അതിൻ്റെ അനുമാന സാങ്കേതികത നിങ്ങളെ അനുവദിക്കുന്നു മുമ്പ് പഠിച്ച കമാൻഡുകൾ ലയിപ്പിക്കുക യഥാർത്ഥ പരിശീലന ഡാറ്റയിൽ പരിമിതപ്പെടുത്താത്ത അദ്വിതീയവും ഇഷ്‌ടാനുസൃതവുമായ ശബ്‌ദങ്ങൾ സൃഷ്‌ടിക്കാൻ.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  ക്ലോഡ് 4: ആന്ത്രോപിക്കിന്റെ പുതിയ AI മോഡലുകളെക്കുറിച്ചും അവയുടെ ഉയർന്നുവരുന്ന പെരുമാറ്റത്തിന്റെ വെല്ലുവിളികളെക്കുറിച്ചുമുള്ള എല്ലാ വിശദാംശങ്ങളും

നിലവിലുള്ള ഓഡിയോയുടെ പരിഷ്‌ക്കരണമാണ് ഇതിൻ്റെ മറ്റൊരു വിപ്ലവകരമായ സവിശേഷത. എന്താണിതിനർത്ഥം? ഒരു വോയ്‌സ് ഫയൽ ലോഡുചെയ്‌ത് അതിൻ്റെ ഉച്ചാരണമോ വൈകാരിക സ്വരമോ മാറ്റാൻ കഴിയുന്നത് സങ്കൽപ്പിക്കുക, അല്ലെങ്കിൽ ഒരു ഗിറ്റാർ മെലഡി എടുത്ത് അതിനെ ഒരു സെല്ലോ പീസ് ആക്കി മാറ്റുക. ഒരു പ്രകടനത്തിൽ, അത് പോലും സാധ്യമായിരുന്നു ഒരു പിയാനോ ലൈൻ മാറ്റുക, അങ്ങനെ അത് ഒരു മനുഷ്യ ശബ്ദം പാടുന്നത് പോലെ തോന്നും. മൂവി ഇഫക്‌റ്റുകൾ സൃഷ്‌ടിക്കുന്നത് മുതൽ വിപുലമായ വിദ്യാഭ്യാസ ടൂളുകൾ വരെ ആപ്ലിക്കേഷനുകളുടെ പരിധിയിലാണ്.

നിർമ്മാണത്തിൽ ഫുഗാട്ടോ ഉപയോഗിക്കുന്നു

ക്രിയേറ്റീവ് വ്യവസായത്തിൽ ഫുഗാട്ടോയുടെ സാധ്യതകൾ

സംഗീതം, സിനിമ അല്ലെങ്കിൽ വീഡിയോ ഗെയിമുകൾ പോലെയുള്ള സർഗ്ഗാത്മക മേഖലകളിൽ വിപ്ലവം സൃഷ്ടിക്കുന്നതിനാണ് ഫുഗാട്ടോ ലക്ഷ്യമിടുന്നത്. എൻവിഡിയയിലെ അപ്ലൈഡ് ഡീപ് ലേണിംഗ് റിസർച്ചിൻ്റെ വൈസ് പ്രസിഡൻ്റ് ബ്രയാൻ കാറ്റൻസാരോ അത് എടുത്തുകാണിച്ചു "ജനറേറ്റീവ് AI സംഗീതവും ശബ്ദ രൂപകൽപ്പനയും സമൂലമായി മാറ്റാൻ ഉദ്ദേശിച്ചുള്ളതാണ്". സ്രഷ്‌ടാക്കൾക്ക് മാത്രമല്ല കഴിയുക പതിവ് ജോലികൾ ഓട്ടോമേറ്റ് ചെയ്യുക, മാത്രമല്ല പൂർണ്ണമായും പുതിയതും അഡാപ്റ്റീവ് ശബ്ദങ്ങളും പരീക്ഷിക്കുക.

ഉദാഹരണത്തിന്, ഗെയിം ഡെവലപ്പർമാർക്ക് സൃഷ്ടിക്കാൻ Fugatto ഉപയോഗിക്കാം തത്സമയം മാറ്റങ്ങളോട് പ്രതികരിക്കുന്ന ചലനാത്മക ഇഫക്റ്റുകൾ ഗെയിമിനുള്ളിൽ. അതുപോലെ, സംഗീതജ്ഞർക്കും നിർമ്മാതാക്കൾക്കും കഴിയും വേഗത്തിൽ പ്രോട്ടോടൈപ്പ് പാട്ടുകൾ, വിലകൂടിയ ഉപകരണങ്ങളോ നീണ്ട സെഷനുകളോ ആവശ്യമില്ലാതെ ക്രമീകരണങ്ങളും വേരിയൻ്റുകളും ചേർക്കുന്നു.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  എഫ് ലൈറ്റ്: ലൈസൻസുള്ള ചിത്രങ്ങളെ മാത്രം അടിസ്ഥാനമാക്കിയുള്ള ഫ്രീപിക്കിന്റെ പുതിയ ജനറേറ്റീവ് AI മോഡൽ.

പരിശീലനത്തിനും ധാർമ്മിക വെല്ലുവിളികൾക്കും പിന്നിൽ എന്താണ്?

NVIDIA അനുസരിച്ച്, ഈ മോഡൽ ആയിരുന്നു 32 H100 ആക്‌സിലറേറ്ററുകളുള്ള DGX സെർവറുകൾ ഉപയോഗിച്ച് ഓപ്പൺ സോഴ്‌സ് ഡാറ്റയിൽ പരിശീലനം നേടി മൊത്തം 2.500 ബില്യൺ പാരാമീറ്ററുകൾ പ്രോസസ്സ് ചെയ്യുന്നു. എന്നിരുന്നാലും, എല്ലാം നല്ല വാർത്തയല്ല. കമ്പനി സൂചിപ്പിച്ചിട്ടുണ്ട് ഫുഗാട്ടോയുടെ പൊതു നടപ്പാക്കൽ ഇപ്പോഴും ചർച്ചയിലാണ്, ധാർമ്മിക ആശങ്കകൾ ഒരു പ്രധാന തടസ്സമായതിനാൽ.

വ്യാജ ഉള്ളടക്കം സൃഷ്‌ടിക്കുക, തെറ്റായ വിവരങ്ങൾക്കായി ശബ്ദങ്ങൾ കൈകാര്യം ചെയ്യുക, അല്ലെങ്കിൽ പകർപ്പവകാശ ലംഘനം എന്നിവ പോലുള്ള ജനറേറ്റീവ് സാങ്കേതികവിദ്യയുടെ ദുരുപയോഗം ഉണ്ടാകാൻ സാധ്യതയുള്ള ഭയം, NVIDIA-യെ ജാഗ്രതാപരമായ നിലപാടിലേക്ക് നയിച്ചു. Fugatto ഓപ്പൺ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുന്നുണ്ടെങ്കിലും, അതിന് ഉള്ളടക്കം സൃഷ്ടിക്കാൻ കഴിയുമോ എന്ന് വ്യക്തമല്ല ബൗദ്ധിക സ്വത്തവകാശം ലംഘിക്കുകയോ നിലവിലുള്ള കലാകാരന്മാരുടെ ശബ്ദമോ സംഗീതമോ അപകടകരമായ രീതിയിൽ പുനർനിർമ്മിക്കുകയോ ചെയ്യുക.

ഫുഗാട്ടോയുടെ ഭാവിയിലേക്ക് ഒരു നോട്ടം

ജനറേറ്റീവ് AI യുടെ ലോകത്ത് ഈ മോഡൽ ഒരു ഒറ്റപ്പെട്ട കേസല്ല. വ്യത്യസ്ത സമീപനങ്ങളുണ്ടെങ്കിലും ഗൂഗിൾ അല്ലെങ്കിൽ മെറ്റാ പോലുള്ള കമ്പനികളും സമാനമായ സാങ്കേതികവിദ്യകൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്. ഉദാഹരണത്തിന്, ഗൂഗിൾ മ്യൂസിക് എൽഎം അവതരിപ്പിച്ചു, ടെക്‌സ്‌റ്റിൽ നിന്ന് സംഗീതം സൃഷ്‌ടിക്കാൻ കഴിവുള്ള ഒരു സംവിധാനമാണ്, എന്നാൽ കോപ്പിയടിയുമായി ബന്ധപ്പെട്ട നിയമപരമായ പ്രശ്‌നങ്ങൾ കാരണം ഇത് പരസ്യമാക്കേണ്ടതില്ലെന്ന് തീരുമാനിച്ചു.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  എന്താണ് TOPS

വെല്ലുവിളികൾക്കിടയിലും, ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസിൻ്റെ പ്രവണത ഇതിലേക്കാണ് വിരൽ ചൂണ്ടുന്നതെന്ന് ഫുഗാട്ടോ തെളിയിക്കുന്നു മൾട്ടിഫങ്ഷണൽ ടൂളുകൾ. നിർദ്ദിഷ്ട ജോലികൾക്കായി മുമ്പ് നിരവധി മോഡലുകൾ ആവശ്യമായിരുന്നെങ്കിൽ, ഇപ്പോൾ ഒരൊറ്റ സിസ്റ്റത്തിന് കഴിയും ഒന്നിലധികം പ്രവർത്തനങ്ങൾ നടത്തുക, സംഗീതം സമന്വയിപ്പിക്കുന്നത് മുതൽ അഭൂതപൂർവമായ ഇഷ്‌ടാനുസൃതമാക്കൽ ഉപയോഗിച്ച് ഓഡിയോ രൂപാന്തരപ്പെടുത്തുന്നത് വരെ.

അതിൻ്റെ വിപണി സമാരംഭത്തിന് ഇപ്പോഴും പ്രത്യേക തീയതി ഇല്ലെങ്കിലും, AI സാങ്കേതികവിദ്യകൾക്ക് എന്ത് നേടാനാകും എന്നതിൻ്റെ ഒരു മാനദണ്ഡമായി Fugatto ഉയർന്നുവരുന്നു. ഗെയിമുകൾ മുതൽ സംഗീതം വരെയുള്ള ക്രിയേറ്റീവ് വ്യവസായങ്ങൾക്ക് ഈ മോഡലിൽ ഒരു സഖ്യകക്ഷി ഉണ്ടായിരിക്കും, അത് സാങ്കേതിക ശ്രമങ്ങൾ കുറയ്ക്കുക മാത്രമല്ല, കലാപരമായ സാധ്യതകളുടെ അഭൂതപൂർവമായ വിശാലതയിലേക്കുള്ള വാതിലുകൾ തുറക്കുകയും ചെയ്യും.