- Az OpenAI egy olyan eszközt fejleszt, amely szövegből vagy hanganyagból zenét generál.
- Együttműködik a Juilliard School diákjaival az eredmények jegyzetelésében és a betanítási adatok létrehozásában.
- A felhasználási módok a hangszeres kísérettől a videókhoz és reklámokhoz való zenéig terjednének.
- Jogi bizonytalanságok és lehetséges forgalmazási modellek közepette fog versenyezni a Sunóval és az Udióval.
Nyílt mesterséges intelligencia olyan eszköz fejlesztése, amely lehetővé teszi szöveges promptokból és hangmintákból zenét komponál, számos szakkiadvány szerint. Az elképzelés az, hogy Bármely felhasználó kérhet dallamot, adott stílust vagy kíséretet, és egy használatra kész eredményt kap..
A The Information és más médiaorgánumok által idézett források szerint a rendszer képes lehet Zene hozzáadása meglévő videókhoz, vagy instrumentális számok létrehozása a már felvett énekhez, például egy gitárszólam, basszus vagy ritmikus alapok. Nincs megjelenési ütemterv Még nem dőlt el, hogy önálló termékként jelenik meg, vagy integrálva lesz a rendszerbe. olyan szolgáltatások, mint a ChatGPT vagy a Sora videóalkalmazás.
Amit a projektről tudunk

A fejlesztés alatt álló eszköz szöveges utasításokat és hangbemeneteket fogadna el a következőhöz: töredékekből teljes darabokká generál az utasításoknak megfelelőenGyakorlati esetekben asszisztensként szolgál, amely megkönnyíti a kíséreteket, a hangszerelést és a zenei beállításokat anélkül, hogy ehhez speciális képzésre lenne szükség.
A rendelkezésre álló információk szerint az OpenAI a következőket vizsgálja: Többféle felhasználási mód: alkotás a semmiből, vokálsávok és videós filmzene támogatásaEz a megközelítés kiterjesztené az audiovizuális alkotók, podcasterek és márkák elérését, akik gyorsan keresnek személyre szabott zenét.
Lehetséges felhasználások és integráció

A források a szóba jöhető alkalmazások között említik a következőket: specifikus kíséretek (pl. gitárok) generálása és zeneszerzés klipekhezA kereskedelmi színtéren fontolóra veszik a személyre szabott hangzással és a meglévő kreatív eszközökhöz kapcsolódó munkafolyamatokkal rendelkező reklámkampányok lehetőségét.
Egy másik lehetőség az OpenAI platformokkal való integráció: A ChatGPT-hez való csatlakozás leegyszerűsítené a természetes nyelvi interakciót, míg a Sorával való kapcsolat lehetővé tenné a mesterséges intelligencia által generált videójelenetekhez igazított zene szerkesztését. Ez azonban egyelőre csak egy hivatalos megerősítés nélküli hipotézis.
Együttműködés a Juilliarddal és a betanítási adatokkal

Az egyik legszembetűnőbb szempont az együttműködés a Juilliard School diákjaival, aki a kottákat annotálná, hogy kiváló minőségű adatokat szolgáltasson. Ez a annotáció tartalmazza a szerkezetet, a harmóniát és a kifejező árnyalatokat, azzal a szándékkal, hogy a modellt mind a zenei formára, mind a szándékra megtanítsa.
A jegyzetekkel ellátott kottákkal való munka strukturáltabb alap, mint pusztán hangsávok használata, segítve a rendszert a progressziók, a dinamika és az ütemezés elsajátításában. Továbbá, ez a megközelítés célja, hogy csökkenteni a jogi kockázatokat az adatok megszerzésében és a létrehozott készítmények konzisztenciájának javításában.
Versenyzők és jogi keretrendszer

A lépés közvetlen versenytárssá tenné az OpenAI-t olyan startupok, mint a Suno és az Udio, valamint más, generatív zenei modellekkel rendelkező szereplők (pl. a Google vagy az ElevenLabs erőfeszítései). Az ágazatot eközben a közelmúltbeli perek miatt vizsgálják, amelyek Megkérdőjelezik a védett anyagok használatát modellek betanításához.
Ebben az összefüggésben az OpenAI vezetőjétől üzenetek jelentek meg a következőkről: annak a kényelme a jogtulajdonosok részesedése a bevételekbőlMég várat magára, hogyan valósulna meg egy kompenzációs mechanizmus, ami kulcsfontosságú kérdés az európai és a globális zeneipar számára.
Háttér és technikai kihívások
Az OpenAI már 2020-ban tesztelte a zenegenerálást a Jukebox segítségével., egy kísérlet, amely nem valósult meg kereskedelmi termékké. Az elmúlt években a vállalat a következőkre összpontosított: Hangmodellek szövegfelolvasóhoz és beszédfelolvasóhoz, és most nagyobb ambícióval tér vissza a zenéhez.
A technikai kihívások magukban foglalják a nagyléptékű koherencia a kompozíciókban, az adatminőség és számítási költségA kreatív fázisban a képzéssel és az emberi felügyelettel kapcsolatos átláthatóság szintén kulcsfontosságú lesz ahhoz, hogy hasznos darabok szülessenek, amelyeket a zenészek és a producerek elfogadnak.
Ha a projekt sikeres, az megkönnyítheti a hozzáférést az európai és spanyol alkotók számára. Filmzenék és hangszerelés igény szerint, alacsonyabb áron, bár a szellemi tulajdonjoggal, a licenceléssel és a nyomon követhetőséggel kapcsolatos viták továbbra is fennállnak. Az iparág válasza a világos megállapodásoktól és a demók tényleges minőségétől függ majd, amikor megjelennek.
Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.
Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.