NVIDIA Fugatto: novatoriškas dirbtinis intelektas, skirtas pakeisti garso ateitį

Paskutinis atnaujinimas: 2024-25-11

nvidia fugatto-1

NVIDIA dėka dirbtinio intelekto pasaulis vėl daro įspūdingą šuolį, kurį pristatė Fugatto – avangardinį modelį, kuris žada pakeisti garsų generavimo ir transformavimo būdus. Šis įrankis skirtas pasiūlyti pažangūs sprendimai tokiose srityse kaip muzika, vaizdo žaidimai ir reklama. Su unikaliomis galimybėmis keisti ir kurti garsą nuo nulio, Fugatto siekia tapti tikru technologiniu perlu.

Pavadinimas Fugatto kilęs iš klasikinės muzikos terminų, primenantis fugos sudėtingumą ir subtilumą, tačiau pritaikytas šiuolaikinei garso aplinkai. Jei kada nors įsivaizdavote sukurkite dainą iš paprasto aprašymo arba pakeiskite esamą garsą į kažką visiškai naujo, šis AI gali tai padaryti.

Mašina, kurioje dera naujovės ir tikslumas

NVIDIA Fugatto išsiskiria savo gebėjimu generuoti garsą iš teksto. Nuo melancholiškos fortepijoninės melodijos su džiazo ritmais iki audros, kuri perauga į aušrą su paukščių čiulbėjimu – galimybės praktiškai neribotos. Jo išvadų technika, vadinama ComposableART, leidžia jums sujungti anksčiau išmoktas komandas sukurti unikalius, pasirinktinius garsus, kurie neapsiriboja originaliais treniruočių duomenimis.

Išskirtinis turinys – spustelėkite čia  „Mistral AI“ pokalbių robotas: naujas Europos pokalbių robotas, siekiantis konkuruoti su „ChatGPT“.

Kitas revoliucinis jo bruožas yra esamo garso modifikavimas. Ką tai reiškia? Įsivaizduokite, kad įkeliate balso failą ir galite pakeisti jo akcentą ar emocinį toną, arba paimkite gitaros melodiją ir paverskite ją violončelės kūriniu. Demonstracijoje tai netgi buvo įmanoma pakeisti fortepijono eilutę taip, kad ji skambėtų kaip dainuojantis žmogaus balsas. Taikomos įvairios – nuo ​​filmų efektų kūrimo iki pažangių mokymo priemonių.

Fugatto naudojimas gamyboje

Fugatto potencialas kūrybinėje industrijoje

„Fugatto“ tikslas – pakeisti kūrybinius sektorius, tokius kaip muzika, kinas ar vaizdo žaidimai. Bryanas Catanzaro, NVIDIA taikomųjų giluminio mokymosi tyrimų viceprezidentas, pabrėžė tai „Generatyvusis AI skirtas radikaliai pakeisti muziką ir garso dizainą“. Kūrėjai ne tik galės automatizar tareas rutinarias, bet ir eksperimentuokite su visiškai naujais ir prisitaikančiais garsais.

Pavyzdžiui, žaidimų kūrėjai gali naudoti „Fugatto“ generavimui dinaminiai efektai, reaguojantys į pokyčius realiuoju laiku žaidimo viduje. Taip pat galėtų muzikantai ir prodiuseriai greitas dainų prototipas, pridedant susitarimus ir variantus nereikalaujant brangios įrangos ar ilgų seansų.

Išskirtinis turinys – spustelėkite čia  Dirbtinio intelekto stetoskopas, kuris per 15 sekundžių nustato tris širdies ligas

Kas slypi už mokymų ir etinių iššūkių?

Pasak NVIDIA, šis modelis buvo mokomi atvirojo kodo duomenų, naudojant DGX serverius su 32 H100 greitintuvais ir iš viso apdoroja 2.500 milijardo parametrų. Tačiau tai dar ne visos geros naujienos. Bendrovė tai nurodė viešas Fugatto įgyvendinimas vis dar svarstomas, nes etiniai klausimai yra didelė kliūtis.

Baimė dėl galimo piktnaudžiavimo generacinėmis technologijomis, pavyzdžiui, suklastoto turinio kūrimo, manipuliavimo balsais siekiant dezinformacijos ar autorių teisių pažeidimo, paskatino NVIDIA laikytis atsargios pozicijos. Nors „Fugatto“ naudoja atvirus duomenų rinkinius, neaišku, ar jis galėtų sukurti tokį turinį pažeisti intelektinės nuosavybės teises arba pavojingai atkurti esamų atlikėjų balsą ar muziką.

Žvilgsnis į Fugatto ateitį

Šis modelis nėra pavienis atvejis generatyvaus AI pasaulyje. Tokios įmonės kaip Google ar Meta taip pat sukūrė panašias technologijas, nors ir skirtingai. Pavyzdžiui, Google pristatė MusicLM – sistemą, galinčią generuoti muziką iš teksto, tačiau nusprendė jos neviešinti dėl teisinių problemų, susijusių su plagiatu.

Išskirtinis turinys – spustelėkite čia  Įmonės žinios „ChatGPT“: kas tai yra ir kaip tai veikia

Nepaisant iššūkių, Fugatto demonstruoja, kad dirbtinio intelekto tendencija rodo daugiafunkciniai įrankiai. Nors anksčiau tam tikroms užduotims atlikti reikėjo kelių modelių, dabar gali viena sistema atlikti kelias operacijas, nuo muzikos sintezės iki garso transformavimo su precedento neturinčiu pritaikymo laipsniu.

Nors vis dar nėra konkrečios datos, kada jis pasirodys rinkoje, „Fugatto“ tampa etalonu tam, ką gali pasiekti generacinės AI technologijos. Kūrybinės industrijos – nuo ​​žaidimų iki muzikos – šiame modelyje turės sąjungininką, kuris ne tik sumažins technines pastangas, bet ir atvers beprecedenčio platumo menines galimybes.