OpenAI pripravuje hudobnú umelú inteligenciu, ktorá pracuje s textom a zvukom.

Posledná aktualizácia: 01.02.2024

  • OpenAI vyvíja nástroj na generovanie hudby z textu alebo zvuku.
  • Spolupracuje so študentmi na Juilliard School na anotácii skóre a vytváraní tréningových údajov.
  • Použitie by siahalo od inštrumentálneho sprievodu až po hudbu pre videá a reklamu.
  • Bude konkurovať spoločnostiam Suno a Udio v kontexte právnych neistôt a možných distribučných modelov.
Hudobná umelá inteligencia od OpenAI

OpenAI pokroky v nástroji, ktorý umožní skladať hudbu z textových pokynov a zvukových ukážok, podľa viacerých špecializovaných publikácií. Myšlienka je taká, že Každý používateľ si môže vyžiadať melódiu, konkrétny štýl alebo konkrétny sprievod a získať výsledok pripravený na použitie..

Zdroje citované denníkom The Information a ďalšími médiami uvádzajú, že systém by mohol Pridajte hudbu k existujúcim videám alebo vytvorte inštrumentálne stopy pre už nahrané vokály, ako napríklad gitarová linka, basa alebo rytmické základy. Neexistuje žiadny harmonogram vydaní Zatiaľ nie je rozhodnuté, či bude dostupný ako samostatný produkt alebo bude integrovaný do... služby ako ChatGPT alebo videoaplikáciu Sora.

Čo vieme o projekte

Umelá inteligencia OpenAI pre hudbu

Nástroj vo vývoji by akceptoval textové pokyny a zvukové vstupy pre generovať z fragmentov do kompletných častí podľa pokynovV praktických scenároch je určený ako asistent, ktorý uľahčuje sprievod, aranžmány a hudobné nastavenia bez potreby ďalšieho školenia.

Exkluzívny obsah – kliknite sem  Windows sa reštartuje v slučke bez modrej obrazovky: kompletný sprievodca príčinami a riešeniami

Podľa dostupných informácií OpenAI skúma Viacero režimov použitia: tvorba od základov, podpora vokálnych stôp a soundtracku pre videoTento prístup by rozšíril dosah audiovizuálnych tvorcov, podcasterov a značiek, ktoré rýchlo hľadajú hudbu na mieru.

Možné využitia a integrácia

Generovanie hudby pomocou umelej inteligencie

Medzi uvažovanými aplikáciami zdroje spomínajú generovanie špecifických sprievodov (napr. gitár) a skladanie hudby pre klipyV komerčnej sfére sa zvažujú reklamné kampane s prispôsobeným zvukom a pracovnými postupmi prepojenými s existujúcimi kreatívnymi nástrojmi.

Ďalšou možnosťou je integrácia s platformami OpenAI: Prepojenie s ChatGPT by zjednodušilo interakciu v prirodzenom jazyku, zatiaľ čo prepojenie so Sorou by uľahčilo strih hudby prispôsobenej video scénam generovaným umelou inteligenciou. Toto je však zatiaľ len hypotéza bez oficiálneho potvrdenia.

Spolupráca s Juilliardom a tréningové dáta

OpenAI Juilliard

Jedným z najvýraznejších aspektov je spolupráca so študentmi z Juilliard School, ktorý by anotoval partitúry s cieľom poskytnúť vysokokvalitné údaje. Táto anotácia zahŕňa štruktúru, harmóniu a výrazové nuansy s cieľom naučiť model hudobnej forme aj zámeru.

Exkluzívny obsah – kliknite sem  Stranger Things bude mať svoje finále v kinách so súčasným uvedením.

Práca s anotovaným skóre môže poskytnúť štruktúrovanejší základ ako len použitie zvukových stôp, čo pomáha systému učiť sa postupy, dynamiku a orchestráciu. Okrem toho sa tento prístup zameriava na znížiť právne riziká pri získavaní údajov a zlepšovaní konzistencie generovaných kompozícií.

Konkurenti a právny rámec

Suno AI

Tento krok by postavil OpenAI do priamej konkurencie s... startupy ako Suno a Udio, ako aj ďalší aktéri s generatívnymi hudobnými modelmi (napr. úsilie spoločností Google alebo ElevenLabs). Sektor je medzitým pod drobnohľadom kvôli nedávnym súdnym sporom, ktoré Spochybňujú používanie chráneného materiálu na trénovanie modelov.

V tejto súvislosti sa objavili správy od šéfa OpenAI o pohodlie toho držitelia práv sa podieľajú na príjmochZostáva sa pozrieť, ako sa kompenzačný mechanizmus zhmotní, čo je kľúčová otázka pre európsky a globálny hudobný priemysel.

Pozadie a technické výzvy

OpenAI už v roku 2020 testovala generovanie hudby pomocou Jukeboxu., experiment, ktorý sa nepremenil na komerčný produkt. V posledných rokoch sa spoločnosť zamerala na Zvukové modely pre prevod textu na reč a reči na text, a teraz sa k hudbe vracia s väčšími ambíciami.

Exkluzívny obsah – kliknite sem  Mapy Google sa dočkali aktualizácie s umelou inteligenciou Gemini a kľúčovými zmenami v navigácii.

Technické výzvy zahŕňajú udržiavanie rozsiahla koherencia v kompozíciách, kvalita údajov a výpočtové nákladyTransparentnosť, pokiaľ ide o školenia a ľudský dohľad počas tvorivej fázy, bude tiež kľúčová pre dosiahnutie užitočných skladieb, ktoré akceptujú hudobníci a producenti.

Ak bude projekt úspešný, mohol by uľahčiť prístup európskym a španielskym tvorcom. Soundtracky a aranžmány na požiadanie za nižšiu cenu, hoci diskusie o duševnom vlastníctve, licencovaní a sledovateľnosti budú pretrvávať. Reakcia odvetvia bude závisieť od jasných dohôd a skutočnej kvality ukážok po ich zverejnení.

čo je odpad z umelej inteligencie
Súvisiaci článok:
Odpad z umelej inteligencie: Čo to je, prečo je to dôležité a ako to zastaviť