Az OpenAI egy olyan zenei mesterséges intelligenciát készít elő, amely szöveggel és hanggal is működik.

Utolsó frissítés: 2023.10.03.

  • Az OpenAI egy olyan eszközt fejleszt, amely szövegből vagy hanganyagból zenét generál.
  • Együttműködik a Juilliard School diákjaival az eredmények jegyzetelésében és a betanítási adatok létrehozásában.
  • A felhasználási módok a hangszeres kísérettől a videókhoz és reklámokhoz való zenéig terjednének.
  • Jogi bizonytalanságok és lehetséges forgalmazási modellek közepette fog versenyezni a Sunóval és az Udióval.
Az OpenAI zenei mesterséges intelligenciája

Nyílt mesterséges intelligencia olyan eszköz fejlesztése, amely lehetővé teszi szöveges promptokból és hangmintákból zenét komponál, számos szakkiadvány szerint. Az elképzelés az, hogy Bármely felhasználó kérhet dallamot, adott stílust vagy kíséretet, és egy használatra kész eredményt kap..

A The Information és más médiaorgánumok által idézett források szerint a rendszer képes lehet Zene hozzáadása meglévő videókhoz, vagy instrumentális számok létrehozása a már felvett énekhez, például egy gitárszólam, basszus vagy ritmikus alapok. Nincs megjelenési ütemterv Még nem dőlt el, hogy önálló termékként jelenik meg, vagy integrálva lesz a rendszerbe. olyan szolgáltatások, mint a ChatGPT vagy a Sora videóalkalmazás.

Amit a projektről tudunk

Az OpenAI zenéhez készült mesterséges intelligenciája

A fejlesztés alatt álló eszköz szöveges utasításokat és hangbemeneteket fogadna el a következőhöz: töredékekből teljes darabokká generál az utasításoknak megfelelőenGyakorlati esetekben asszisztensként szolgál, amely megkönnyíti a kíséreteket, a hangszerelést és a zenei beállításokat anélkül, hogy ehhez speciális képzésre lenne szükség.

Exkluzív tartalom – Kattintson ide  A Microsoft MAI-Voice-1 technológiája egy percnyi hangot állít elő kevesebb mint egy másodperc alatt: így kívánja a cég „természetes” hangalámondást biztosítani a Copilotban és bármely alkalmazásban.

A rendelkezésre álló információk szerint az OpenAI a következőket vizsgálja: Többféle felhasználási mód: alkotás a semmiből, vokálsávok és videós filmzene támogatásaEz a megközelítés kiterjesztené az audiovizuális alkotók, podcasterek és márkák elérését, akik gyorsan keresnek személyre szabott zenét.

Lehetséges felhasználások és integráció

AI zenegenerálás

A források a szóba jöhető alkalmazások között említik a következőket: specifikus kíséretek (pl. gitárok) generálása és zeneszerzés klipekhezA kereskedelmi színtéren fontolóra veszik a személyre szabott hangzással és a meglévő kreatív eszközökhöz kapcsolódó munkafolyamatokkal rendelkező reklámkampányok lehetőségét.

Egy másik lehetőség az OpenAI platformokkal való integráció: A ChatGPT-hez való csatlakozás leegyszerűsítené a természetes nyelvi interakciót, míg a Sorával való kapcsolat lehetővé tenné a mesterséges intelligencia által generált videójelenetekhez igazított zene szerkesztését. Ez azonban egyelőre csak egy hivatalos megerősítés nélküli hipotézis.

Együttműködés a Juilliarddal és a betanítási adatokkal

OpenAI Juilliard

Az egyik legszembetűnőbb szempont az együttműködés a Juilliard School diákjaival, aki a kottákat annotálná, hogy kiváló minőségű adatokat szolgáltasson. Ez a annotáció tartalmazza a szerkezetet, a harmóniát és a kifejező árnyalatokat, azzal a szándékkal, hogy a modellt mind a zenei formára, mind a szándékra megtanítsa.

Exkluzív tartalom – Kattintson ide  A YouTube Shorts tartalmazza a Veo 2-t, a Google új mesterséges intelligenciáját, amellyel videókat készíthet

A jegyzetekkel ellátott kottákkal való munka strukturáltabb alap, mint pusztán hangsávok használata, segítve a rendszert a progressziók, a dinamika és az ütemezés elsajátításában. Továbbá, ez a megközelítés célja, hogy csökkenteni a jogi kockázatokat az adatok megszerzésében és a létrehozott készítmények konzisztenciájának javításában.

Versenyzők és jogi keretrendszer

Suno AI

A lépés közvetlen versenytárssá tenné az OpenAI-t olyan startupok, mint a Suno és az Udio, valamint más, generatív zenei modellekkel rendelkező szereplők (pl. a Google vagy az ElevenLabs erőfeszítései). Az ágazatot eközben a közelmúltbeli perek miatt vizsgálják, amelyek Megkérdőjelezik a védett anyagok használatát modellek betanításához.

Ebben az összefüggésben az OpenAI vezetőjétől üzenetek jelentek meg a következőkről: annak a kényelme a jogtulajdonosok részesedése a bevételekbőlMég várat magára, hogyan valósulna meg egy kompenzációs mechanizmus, ami kulcsfontosságú kérdés az európai és a globális zeneipar számára.

Háttér és technikai kihívások

Az OpenAI már 2020-ban tesztelte a zenegenerálást a Jukebox segítségével., egy kísérlet, amely nem valósult meg kereskedelmi termékké. Az elmúlt években a vállalat a következőkre összpontosított: Hangmodellek szövegfelolvasóhoz és beszédfelolvasóhoz, és most nagyobb ambícióval tér vissza a zenéhez.

Exkluzív tartalom – Kattintson ide  A Steam megnyílik, amikor bekapcsolja a számítógépet: Útmutató az automatikus indítás megakadályozásához

A technikai kihívások magukban foglalják a nagyléptékű koherencia a kompozíciókban, az adatminőség és számítási költségA kreatív fázisban a képzéssel és az emberi felügyelettel kapcsolatos átláthatóság szintén kulcsfontosságú lesz ahhoz, hogy hasznos darabok szülessenek, amelyeket a zenészek és a producerek elfogadnak.

Ha a projekt sikeres, az megkönnyítheti a hozzáférést az európai és spanyol alkotók számára. Filmzenék és hangszerelés igény szerint, alacsonyabb áron, bár a szellemi tulajdonjoggal, a licenceléssel és a nyomon követhetőséggel kapcsolatos viták továbbra is fennállnak. Az iparág válasza a világos megállapodásoktól és a demók tényleges minőségétől függ majd, amikor megjelennek.

ami mesterséges intelligencia szemét
Kapcsolódó cikk:
MI-szemét: Mi az, miért fontos, és hogyan lehet megállítani