NVIDIA Fugatto: AI ya ubunifu ya kubadilisha mustakabali wa sauti

Sasisho la mwisho: 25/11/2024

nvidia fugatto-1

Ulimwengu wa akili bandia unapiga hatua ya kuvutia tena kutokana na NVIDIA, ambayo Fugatto imewasilisha, mfano wa avant-garde ambao unaahidi kuleta mapinduzi ya jinsi sauti zinavyozalishwa na kubadilishwa. Chombo hiki kimeundwa kutoa masuluhisho ya hali ya juu katika nyanja kama vile muziki, michezo ya video na utangazaji. Kwa uwezo wa kipekee wa kubadilisha na kuunda sauti kutoka mwanzo, Fugatto inalenga kuwa kito cha kweli cha kiteknolojia.

Jina Fugatto linatokana na maneno ya muziki wa kitambo, ikitoa utata na faini ya fugue, lakini inatumika kwa mazingira ya kisasa ya sauti. Ikiwa umewahi kufikiria tengeneza wimbo kutoka kwa maelezo rahisi au ubadilishe sauti iliyopo kuwa kitu kipya kabisa, AI hii ina uwezo wa kuifanya.

Mashine inayochanganya uvumbuzi na usahihi

NVIDIA Fugatto inajitokeza kwa uwezo wake wa kutoa sauti kutoka kwa maandishi. Kutoka kwa wimbo wa piano wa melancholic na midundo ya jazba hadi dhoruba inayobadilika hadi alfajiri na ndege wanaolia - uwezekano hauna kikomo. Mbinu yake ya uelekezaji, inayoitwa ComposableART, hukuruhusu unganisha amri zilizojifunza hapo awali ili kuunda sauti za kipekee, maalum ambazo hazizuiliwi kwa data asili ya mafunzo.

Maudhui ya kipekee - Bofya Hapa  SearchGPT ni nini na jinsi injini mpya ya utaftaji inayotegemea AI inavyofanya kazi

Kipengele kingine cha mapinduzi ni urekebishaji wa sauti iliyopo. Hii ina maana gani? Hebu fikiria kupakia faili ya sauti na kuweza kubadilisha lafudhi yake au sauti ya hisia, au kuchukua wimbo wa gitaa na kuibadilisha kuwa kipande cha cello. Katika maandamano, iliwezekana hata badilisha laini ya piano ili isikike kama sauti ya mwanadamu inayoimba. Maombi huanzia kuunda athari za filamu hadi zana za juu za elimu.

Kutumia Fugatto katika uzalishaji

Uwezo wa Fugatto katika tasnia ya ubunifu

Fugatto inalenga kuleta mapinduzi katika sekta za ubunifu kama vile muziki, sinema au michezo ya video. Bryan Catanzaro, makamu wa rais wa kutumia utafiti wa kina wa kujifunza huko NVIDIA, alisisitiza hilo "AI ya Uzalishaji imekusudiwa kubadilisha sana muziki na muundo wa sauti". Waumbaji hawataweza tu otomatiki kazi za kawaida, lakini pia jaribu sauti mpya kabisa na zinazoweza kubadilika.

Kwa mfano, watengenezaji wa mchezo wanaweza kutumia Fugatto kutengeneza athari zinazobadilika ambazo hujibu mabadiliko katika wakati halisi ndani ya mchezo. Vivyo hivyo, wanamuziki na watayarishaji wanaweza nyimbo za mfano haraka, kuongeza mipangilio na lahaja bila hitaji la vifaa vya gharama kubwa au vipindi virefu.

Maudhui ya kipekee - Bofya Hapa  NotebookLM imeimarishwa kwa Utafiti wa Kina na sauti kwenye Hifadhi

Ni nini nyuma ya mafunzo na changamoto za maadili?

Kulingana na NVIDIA, mtindo huu umekuwa wamefunzwa kwenye data ya chanzo huria, kwa kutumia seva za DGX zilizo na vichapuzi 32 H100 na kuchakata jumla ya vigezo bilioni 2.500. Hata hivyo, si habari njema zote. Kampuni hiyo imebainisha hilo utekelezaji wa umma wa Fugatto bado unajadiliwa, kwani masuala ya kimaadili ni kikwazo kikubwa.

Hofu ya uwezekano wa matumizi mabaya ya teknolojia zalishaji, kama vile kuunda maudhui ya uwongo, kudanganya sauti kwa ajili ya taarifa zisizo sahihi, au ukiukaji wa hakimiliki, kumesababisha NVIDIA kuchukua msimamo wa tahadhari. Ingawa Fugatto hutumia hifadhidata wazi, haijulikani ikiwa inaweza kutoa maudhui ambayo kukiuka haki miliki au kutoa tena sauti au muziki wa wasanii waliopo kwa hatari.

Kuangalia mustakabali wa Fugatto

Mfano huu sio kesi pekee katika ulimwengu wa AI ya kuzalisha. Makampuni kama Google au Meta pia yametengeneza teknolojia sawa, ingawa kwa mbinu tofauti. Kwa mfano, Google ilianzisha MusicLM, mfumo wenye uwezo wa kutengeneza muziki kutoka kwa maandishi, lakini iliamua kutouweka hadharani kutokana na matatizo ya kisheria yanayohusiana na wizi.

Maudhui ya kipekee - Bofya Hapa  Palantir AI: AI ya biashara ambayo inasimama kwa Microsoft

Licha ya changamoto, Fugatto anaonyesha kwamba mwelekeo wa akili bandia unaelekea zana za multifunctional. Ingawa mifano kadhaa ilihitajika hapo awali kwa kazi maalum, sasa mfumo mmoja unaweza kufanya shughuli nyingi, kutoka kwa kusanisi muziki hadi kubadilisha sauti kwa kiwango kisicho na kifani cha ubinafsishaji.

Ingawa bado hakuna tarehe mahususi ya kuzinduliwa kwa soko lake, Fugatto inaibuka kama kigezo cha kile ambacho teknolojia endelezi ya AI inaweza kufikia. Sekta ya ubunifu, kutoka kwa michezo hadi muziki, itakuwa na mshirika katika mtindo huu ambayo sio tu itapunguza juhudi za kiufundi, lakini pia itafungua milango kwa upana usio na kifani wa uwezekano wa kisanii.