NVIDIA Fugatto. Նորարարական AI՝ ձայնի ապագան փոխելու համար

Վերջին թարմացումը. 25/11/2024

nvidia fugatto-1

Արհեստական ​​ինտելեկտի աշխարհը կրկին տպավորիչ թռիչք է կատարում NVIDIA-ի շնորհիվ, որը ներկայացրել է Fugatto-ն՝ ավանգարդ մոդել, որը խոստանում է հեղափոխել հնչյունների ստեղծման և վերափոխման ձևը: Այս գործիքը նախատեսված է առաջարկելու համար առաջադեմ լուծումներ այնպիսի ոլորտներում, ինչպիսիք են երաժշտությունը, տեսախաղերը և գովազդը. Զրոյից աուդիո փոփոխելու և ստեղծելու եզակի հնարավորություններով Fugatto-ն նպատակ ունի դառնալ իսկական տեխնոլոգիական գոհար:

Fugatto անվանումը ծագել է դասական երաժշտական ​​տերմիններից, որը արթնացնում է ֆուգայի բարդությունն ու նրբությունը, բայց կիրառվում է ժամանակակից ձայնային միջավայրում: Եթե ​​երբևէ պատկերացրել եք ստեղծել երգ պարզ նկարագրությունից կամ գոյություն ունեցող ձայնը վերածել բոլորովին նոր բանի, այս AI-ն ի վիճակի է դա իրականացնել:

Մեքենա, որը համատեղում է նորարարությունն ու ճշգրտությունը

NVIDIA Fugatto-ն առանձնանում է տեքստից աուդիո ստեղծելու ունակությամբ. Դաշնամուրի մելամաղձոտ մեղեդուց ջազային ռիթմերով մինչև փոթորիկ, որը վերածվում է թռչունների ծլվլոցով արշալույսի, հնարավորությունները գործնականում անսահման են: Նրա եզրակացության տեխնիկան, որը կոչվում է ComposableART, թույլ է տալիս ձեզ միաձուլել նախկինում սովորած հրամանները ստեղծել յուրահատուկ, հատուկ հնչյուններ, որոնք չեն սահմանափակվում նախնական ուսուցման տվյալներով:

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Իտալիան արգելում է DeepSeek-ը՝ հաշվի առնելով գաղտնիության և տվյալների պաշտպանության մասին օրենսդրությունը

Նրա մեկ այլ հեղափոխական առանձնահատկություններից է գոյություն ունեցող աուդիոյի փոփոխությունը. Ի՞նչ է սա նշանակում։ Պատկերացրեք, թե ինչպես եք բեռնում ձայնային ֆայլը և կարող եք փոխել դրա առոգանությունը կամ զգացմունքային տոնը, կամ վերցնել կիթառի մեղեդին և այն վերածել թավջութակի կտորի: Ցույցի ժամանակ դա նույնիսկ հնարավոր էր փոխեք դաշնամուրի տողը այնպես, որ այն հնչի որպես երգող մարդու ձայն. Ծրագրերը տատանվում են ֆիլմերի էֆեկտներ ստեղծելուց մինչև առաջադեմ կրթական գործիքներ:

Fugatto-ի օգտագործումը արտադրության մեջ

Fugatto-ի ներուժը ստեղծագործական ոլորտում

Fugatto-ն ուղղված է հեղափոխության այնպիսի ստեղծագործական ոլորտներին, ինչպիսիք են երաժշտությունը, կինոն կամ տեսախաղերը: NVIDIA-ի կիրառական խորը ուսուցման հետազոտության փոխնախագահ Բրայան Կատանզարոն ընդգծել է դա «Գեներատիվ AI-ն վիճակված է արմատապես փոխել երաժշտությունն ու ձայնային դիզայնը». Ստեղծողները ոչ միայն կկարողանան ավտոմատացնել առօրյա առաջադրանքները, այլ նաև փորձարկել բոլորովին նոր և հարմարվողական հնչյուններ:

Օրինակ, խաղերի մշակողները կարող են օգտագործել Fugatto-ն ստեղծելու համար դինամիկ էֆեկտներ, որոնք արձագանքում են փոփոխություններին իրական ժամանակում խաղի շրջանակներում։ Նմանապես, երաժիշտներն ու պրոդյուսերները կարող էին երգերի նախատիպը արագ, ավելացնելով պայմանավորվածություններ և տարբերակներ՝ առանց թանկարժեք սարքավորումների կամ երկար սեանսների անհրաժեշտության։

Բացառիկ բովանդակություն - Սեղմեք այստեղ  NBA-ն և AWS-ը համագործակցություն են կնքում՝ արհեստական ​​բանականությունը դաշտ բերելու համար։

Ի՞նչ է թաքնված վերապատրաստման և էթիկական մարտահրավերների հետևում:

Ըստ NVIDIA-ի, այս մոդելը եղել է վերապատրաստվել է բաց կոդով տվյալների վրա՝ օգտագործելով DGX սերվերներ 32 H100 արագացուցիչներով և մշակելով ընդհանուր առմամբ 2.500 միլիարդ պարամետր: Այնուամենայնիվ, ամեն ինչ լավ նորություն չէ։ Ընկերությունը նշել է, որ Fugatto-ի հանրային իրականացումը դեռ քննարկման փուլում է, քանի որ էթիկական մտահոգությունները էական խոչընդոտ են:

Գեներատիվ տեխնոլոգիաների հնարավոր չարաշահումների վախը, ինչպիսիք են կեղծ բովանդակության ստեղծումը, ապատեղեկատվության համար ձայների շահարկումը կամ հեղինակային իրավունքի խախտումը, ստիպել են NVIDIA-ին զգույշ դիրքորոշում ցուցաբերել: Չնայած Fugatto-ն օգտագործում է բաց տվյալների հավաքածուներ, պարզ չէ, թե արդյոք այն կարող է առաջացնել այդպիսի բովանդակություն խախտել մտավոր սեփականության իրավունքները կամ վտանգավոր կերպով վերարտադրել առկա արտիստների ձայնը կամ երաժշտությունը.

Հայացք դեպի Fugatto-ի ապագան

Այս մոդելը եզակի դեպք չէ գեներատիվ AI-ի աշխարհում: Google-ի կամ Meta-ի նման ընկերությունները նույնպես մշակել են նմանատիպ տեխնոլոգիաներ, թեև տարբեր մոտեցումներով։ Օրինակ, Google-ը ներկայացրեց MusicLM համակարգը, որն ունակ է տեքստից երաժշտություն ստեղծել, սակայն որոշեց չհրապարակել այն՝ գրագողության հետ կապված իրավական խնդիրների պատճառով:

Բացառիկ բովանդակություն - Սեղմեք այստեղ  OpenAI-ի և Microsoft-ի միջև լարվածություն է աճում. վեճեր, մեղադրանքներ և արհեստական ​​բանականության ապագան

Չնայած մարտահրավերներին, Fugatto-ն ցույց է տալիս, որ արհեստական ​​ինտելեկտի միտումը ուղղված է դեպի բազմաֆունկցիոնալ գործիքներ. Թեև նախկինում մի քանի մոդելներ էին անհրաժեշտ հատուկ առաջադրանքների համար, այժմ մեկ համակարգ կարող է կատարել բազմաթիվ գործողություններ, երաժշտության սինթեզումից մինչև աուդիո փոխակերպում՝ անհատականացման աննախադեպ աստիճանով:

Չնայած դեռևս չկա դրա շուկայական մեկնարկի կոնկրետ ամսաթիվ, Fugatto-ն ի հայտ է գալիս որպես հենանիշ, թե ինչի կարող են հասնել գեներատիվ AI տեխնոլոգիաները: Ստեղծագործական արդյունաբերությունները՝ խաղերից մինչև երաժշտություն, կունենան դաշնակից այս մոդելում, որը ոչ միայն կնվազեցնի տեխնիկական ջանքերը, այլև դռները կբացի գեղարվեստական ​​հնարավորությունների աննախադեպ լայնության համար: