NVIDIA Fugatto: novatorisks AI, lai pārveidotu skaņas nākotni

Pēdējā atjaunošana: 25/11/2024

nvidia fugatto-1

Pateicoties NVIDIA, mākslīgā intelekta pasaule atkal veic iespaidīgu lēcienu, ko Fugatto ir prezentējis, avangarda modeli, kas sola revolucionizēt veidu, kā tiek ģenerētas un pārveidotas skaņas. Šis rīks ir paredzēts, lai piedāvātu uzlaboti risinājumi tādās jomās kā mūzika, videospēles un reklāma. Ar unikālām iespējām mainīt un radīt audio no nulles, Fugatto mērķis ir kļūt par īstu tehnoloģiju dārgakmeni.

Nosaukums Fugatto cēlies no klasiskās mūzikas terminiem, izsaucot fūgas sarežģītību un smalkumu, bet attiecināta uz mūsdienu skaņu vidi. Ja jūs kādreiz esat iedomājies izveidot dziesmu no vienkārša apraksta vai pārveidot esošu skaņu par kaut ko pilnīgi jaunu, šis AI spēj to īstenot.

Mašīna, kas apvieno inovācijas un precizitāti

NVIDIA Fugatto izceļas ar spēju ģenerēt audio no teksta. No melanholiskas klavieru melodijas ar džeza ritmiem līdz vētrai, kas pāraug rītausmā ar putnu čivināšanu – iespējas ir praktiski neierobežotas. Tā secinājumu tehnika, ko sauc par ComposableART, ļauj jums apvienot iepriekš apgūtās komandas lai izveidotu unikālas, pielāgotas skaņas, kas nav ierobežotas ar oriģinālajiem treniņu datiem.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā Alexa var izmantot, lai saņemtu atbildes uz vispārīgiem jautājumiem vai meklētu internetā?

Vēl viena no tās revolucionārajām funkcijām ir esošā audio modifikācija. Ko tas nozīmē? Iedomājieties, ka ielādējat balss failu un varat mainīt tā akcentu vai emocionālo toni, vai paņemiet ģitāras melodiju un pārveidojiet to čella skaņdarbā. Demonstrācijā tas pat bija iespējams mainīt klavieru līniju tā, lai tā skanētu kā cilvēka balss dziedāšana. Lietojumprogrammas ir dažādas, sākot no filmu efektu izveides līdz uzlabotiem izglītības rīkiem.

Fugatto izmantošana ražošanā

Fugatto potenciāls radošajā industrijā

Fugatto mērķis ir revolucionizēt radošās nozares, piemēram, mūziku, kino vai videospēles. Bryan Catanzaro, NVIDIA lietišķās dziļās mācīšanās pētījumu viceprezidents, uzsvēra to "Ģeneratīvais AI ir paredzēts radikāli mainīt mūziku un skaņas dizainu". Radītāji varēs ne tikai automatizēt rutīnas uzdevumus, bet arī eksperimentējiet ar pilnīgi jaunām un adaptīvām skaņām.

Piemēram, spēļu izstrādātāji varētu izmantot Fugatto ģenerēšanai dinamiski efekti, kas reaģē uz izmaiņām reāllaikā spēles ietvaros. Tāpat varētu mūziķi un producenti prototipu dziesmas ātri, pievienojot izkārtojumus un variantus bez nepieciešamības pēc dārga aprīkojuma vai garām sesijām.

Ekskluzīvs saturs — noklikšķiniet šeit  Waze nodrošina ar mākslīgo intelektu darbināmu balss ziņošanu: Lūk, kā tas darbojas un kad to saņemsiet

Kas slēpjas aiz apmācības un ētikas izaicinājumiem?

Saskaņā ar NVIDIA, šis modelis ir bijis apmācīti par atvērtā pirmkoda datiem, izmantojot DGX serverus ar 32 H100 paātrinātājiem un kopumā apstrādājot 2.500 miljardus parametru. Tomēr ne visas ir labas ziņas. Uzņēmums to norādījis Fugatto publiska īstenošana joprojām tiek apspriesta, jo ētiskas bažas ir būtisks šķērslis.

Bailes no iespējamiem ģeneratīvo tehnoloģiju ļaunprātīgas izmantošanas gadījumiem, piemēram, viltota satura radīšana, manipulēšana ar balsīm, lai iegūtu dezinformāciju vai autortiesību pārkāpumi, ir likušas NVIDIA ieņemt piesardzīgu nostāju. Lai gan Fugatto izmanto atvērtas datu kopas, nav skaidrs, vai tas varētu radīt tādu saturu pārkāpj intelektuālā īpašuma tiesības vai bīstami reproducē esošo mākslinieku balsi vai mūziku.

Ieskats Fugatto nākotnē

Šis modelis nav atsevišķs gadījums ģeneratīvā AI pasaulē. Arī tādi uzņēmumi kā Google vai Meta ir izstrādājuši līdzīgas tehnoloģijas, lai gan ar atšķirīgām pieejām. Piemēram, Google ieviesa MusicLM — sistēmu, kas spēj ģenerēt mūziku no teksta, taču nolēma to nepublicēt juridisku problēmu dēļ saistībā ar plaģiātu.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā iegūt Snapchat AI robotu

Neskatoties uz izaicinājumiem, Fugatto parāda, ka mākslīgā intelekta tendence norāda uz daudzfunkcionāli instrumenti. Ja iepriekš konkrētiem uzdevumiem bija nepieciešami vairāki modeļi, tagad to var veikt viena sistēma veikt vairākas darbības, no mūzikas sintezēšanas līdz audio pārveidošanai ar nepieredzētu pielāgošanas pakāpi.

Lai gan joprojām nav noteikts konkrēts datums tā ieviešanai tirgū, Fugatto kļūst par etalonu tam, ko var sasniegt ģeneratīvās AI tehnoloģijas. Radošajām industrijām, sākot no spēlēm un beidzot ar mūziku, šajā modelī būs sabiedrotais, kas ne tikai samazinās tehniskos centienus, bet arī pavērs durvis vēl nepieredzētām mākslinieciskajām iespējām.