NVIDIA dėka dirbtinio intelekto pasaulis vėl daro įspūdingą šuolį, kurį pristatė Fugatto – avangardinį modelį, kuris žada pakeisti garsų generavimo ir transformavimo būdus. Šis įrankis skirtas pasiūlyti pažangūs sprendimai tokiose srityse kaip muzika, vaizdo žaidimai ir reklama. Su unikaliomis galimybėmis keisti ir kurti garsą nuo nulio, Fugatto siekia tapti tikru technologiniu perlu.
Pavadinimas Fugatto kilęs iš klasikinės muzikos terminų, primenantis fugos sudėtingumą ir subtilumą, tačiau pritaikytas šiuolaikinei garso aplinkai. Jei kada nors įsivaizdavote sukurkite dainą iš paprasto aprašymo arba pakeiskite esamą garsą į kažką visiškai naujo, šis AI gali tai padaryti.
Mašina, kurioje dera naujovės ir tikslumas
NVIDIA Fugatto išsiskiria savo gebėjimu generuoti garsą iš teksto. Nuo melancholiškos fortepijoninės melodijos su džiazo ritmais iki audros, kuri perauga į aušrą su paukščių čiulbėjimu – galimybės praktiškai neribotos. Jo išvadų technika, vadinama ComposableART, leidžia jums sujungti anksčiau išmoktas komandas sukurti unikalius, pasirinktinius garsus, kurie neapsiriboja originaliais treniruočių duomenimis.
Kitas revoliucinis jo bruožas yra esamo garso modifikavimas. Ką tai reiškia? Įsivaizduokite, kad įkeliate balso failą ir galite pakeisti jo akcentą ar emocinį toną, arba paimkite gitaros melodiją ir paverskite ją violončelės kūriniu. Demonstracijoje tai netgi buvo įmanoma pakeisti fortepijono eilutę taip, kad ji skambėtų kaip dainuojantis žmogaus balsas. Taikomos įvairios – nuo filmų efektų kūrimo iki pažangių mokymo priemonių.

Fugatto potencialas kūrybinėje industrijoje
„Fugatto“ tikslas – pakeisti kūrybinius sektorius, tokius kaip muzika, kinas ar vaizdo žaidimai. Bryanas Catanzaro, NVIDIA taikomųjų giluminio mokymosi tyrimų viceprezidentas, pabrėžė tai „Generatyvusis AI skirtas radikaliai pakeisti muziką ir garso dizainą“. Kūrėjai ne tik galės automatizar tareas rutinarias, bet ir eksperimentuokite su visiškai naujais ir prisitaikančiais garsais.
Pavyzdžiui, žaidimų kūrėjai gali naudoti „Fugatto“ generavimui dinaminiai efektai, reaguojantys į pokyčius realiuoju laiku žaidimo viduje. Taip pat galėtų muzikantai ir prodiuseriai greitas dainų prototipas, pridedant susitarimus ir variantus nereikalaujant brangios įrangos ar ilgų seansų.
Kas slypi už mokymų ir etinių iššūkių?
Pasak NVIDIA, šis modelis buvo mokomi atvirojo kodo duomenų, naudojant DGX serverius su 32 H100 greitintuvais ir iš viso apdoroja 2.500 milijardo parametrų. Tačiau tai dar ne visos geros naujienos. Bendrovė tai nurodė viešas Fugatto įgyvendinimas vis dar svarstomas, nes etiniai klausimai yra didelė kliūtis.
Baimė dėl galimo piktnaudžiavimo generacinėmis technologijomis, pavyzdžiui, suklastoto turinio kūrimo, manipuliavimo balsais siekiant dezinformacijos ar autorių teisių pažeidimo, paskatino NVIDIA laikytis atsargios pozicijos. Nors „Fugatto“ naudoja atvirus duomenų rinkinius, neaišku, ar jis galėtų sukurti tokį turinį pažeisti intelektinės nuosavybės teises arba pavojingai atkurti esamų atlikėjų balsą ar muziką.
Žvilgsnis į Fugatto ateitį
Šis modelis nėra pavienis atvejis generatyvaus AI pasaulyje. Tokios įmonės kaip Google ar Meta taip pat sukūrė panašias technologijas, nors ir skirtingai. Pavyzdžiui, Google pristatė MusicLM – sistemą, galinčią generuoti muziką iš teksto, tačiau nusprendė jos neviešinti dėl teisinių problemų, susijusių su plagiatu.
Nepaisant iššūkių, Fugatto demonstruoja, kad dirbtinio intelekto tendencija rodo daugiafunkciniai įrankiai. Nors anksčiau tam tikroms užduotims atlikti reikėjo kelių modelių, dabar gali viena sistema atlikti kelias operacijas, nuo muzikos sintezės iki garso transformavimo su precedento neturinčiu pritaikymo laipsniu.
Nors vis dar nėra konkrečios datos, kada jis pasirodys rinkoje, „Fugatto“ tampa etalonu tam, ką gali pasiekti generacinės AI technologijos. Kūrybinės industrijos – nuo žaidimų iki muzikos – šiame modelyje turės sąjungininką, kuris ne tik sumažins technines pastangas, bet ir atvers beprecedenčio platumo menines galimybes.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.