- OpenAI dezvoltă un instrument pentru generarea de muzică din text sau audio.
- Colaborează cu studenții de la Școala Juilliard pentru a adnota scorurile și a crea date de antrenament.
- Utilizările ar varia de la acompaniament instrumental la muzică pentru videoclipuri și publicitate.
- Va concura cu Suno și Udio într-un context de incertitudini juridice și posibile modele de distribuție.
OpenAI progrese într-un instrument care va permite compune muzică din sugestii textuale și mostre audio, conform mai multor publicații de specialitate. Ideea este că Orice utilizator poate solicita o melodie, un stil specific sau un acompaniament specific și poate obține un rezultat gata de utilizare..
Surse citate de The Information și alte publicații media spun că sistemul ar putea Adăugați muzică la videoclipuri existente sau creați piese instrumentale pentru voci deja înregistrate, cum ar fi o linie de chitară, bas sau baze ritmice. Nu există un program de lansare Nu s-a decis încă dacă va sosi ca produs independent sau integrat în servicii precum ChatGPT sau aplicația video Sora.
Ce știm despre proiect

Instrumentul în curs de dezvoltare ar accepta solicitări text și intrări audio pentru generați din fragmente până la piese complete conform instrucțiunilorÎn scenarii practice, este conceput ca un asistent care facilitează acompaniamente, aranjamente și setări muzicale fără a fi nevoie de o pregătire avansată.
Conform informațiilor disponibile, OpenAI explorează Moduri multiple de utilizare: creare de la zero, suport pentru piste vocale și coloană sonoră pentru videoclipuriAceastă abordare ar extinde rapid acoperirea creatorilor audiovizuali, a podcasterilor și a brandurilor care caută muzică personalizată.
Utilizări posibile și integrare

Printre aplicațiile avute în vedere, sursele menționează generarea de acompaniamente specifice (de exemplu, chitare) și compunerea muzicii pentru clipuriÎn domeniul comercial, se iau în considerare campanii publicitare cu sunet personalizat și fluxuri de lucru conectate la instrumentele creative existente.
O altă posibilitate este integrarea cu platformele OpenAI: O conexiune la ChatGPT ar simplifica interacțiunea în limbaj natural, în timp ce o conexiune cu Sora ar facilita editarea muzicii adaptate scenelor video generate de inteligența artificială. Totuși, aceasta este o ipoteză fără confirmare oficială deocamdată.
Colaborarea cu Juilliard și datele de instruire

Unul dintre cele mai frapante aspecte este colaborare cu studenții de la Școala Juilliard, care ar adnota partiturile pentru a oferi date de înaltă calitate. Această adnotare include structura, armonia și nuanțele expresive, cu intenția de a preda modelului atât forma muzicală, cât și intenția.
Lucrul cu partituri adnotate poate oferi o o bază mai structurată decât simpla utilizare a pistelor audio, ajutând sistemul să învețe progresii, dinamică și orchestrare. Mai mult, această abordare își propune să reducerea riscurilor juridice în obținerea datelor și îmbunătățirea consistenței compozițiilor generate.
Concurenți și cadrul juridic

Această mișcare ar pune OpenAI în concurență directă cu startup-uri precum Suno și Udio, precum și alți actori cu modele muzicale generative (de exemplu, eforturile Google sau ElevenLabs). Între timp, sectorul este sub control din cauza unor procese recente care Ei pun la îndoială utilizarea materialelor protejate pentru antrenarea modelelor.
În acest context, au apărut mesaje din partea șefului OpenAI despre comoditatea acestui lucru deținătorii de drepturi își asumă partea din venituriRămâne de văzut cum s-ar materializa un mecanism de compensare, o problemă cheie pentru industria muzicală europeană și mondială.
Context și provocări tehnice
OpenAI a testat deja generarea de muzică în 2020 cu Jukebox., un experiment care nu s-a materializat într-un produs comercial. În ultimii ani, compania s-a concentrat pe Modele audio pentru text-vorbire și vorbire-text, iar acum se întoarce la muzică cu o ambiție mai mare.
Provocările tehnice implică menținerea unei coerență la scară largă în compoziții, calitatea datelor și costul de calculTransparența în ceea ce privește instruirea și supravegherea umană în timpul fazei creative va fi, de asemenea, crucială pentru realizarea unor piese utile, acceptate de muzicieni și producători.
Dacă proiectul are succes, ar putea facilita accesul creatorilor europeni și spanioli. Coloane sonore și aranjamente la cerere la un cost mai mic, deși dezbaterile privind proprietatea intelectuală, licențierea și trasabilitatea vor persista. Răspunsul industriei va depinde de acorduri clare și de calitatea reală a demonstrațiilor la momentul lansării acestora.
Sunt un pasionat de tehnologie care și-a transformat interesele de „tocilar” într-o profesie. Mi-am petrecut mai bine de 10 ani din viața mea folosind tehnologie de ultimă oră și mânuind cu tot felul de programe din pură curiozitate. Acum m-am specializat în tehnologie computerizată și jocuri video. Asta pentru că de mai bine de 5 ani scriu pentru diverse site-uri web despre tehnologie și jocuri video, creând articole care urmăresc să-ți ofere informațiile de care ai nevoie într-un limbaj pe care oricine este pe înțeles.
Dacă aveți întrebări, cunoștințele mele variază de la tot ce ține de sistemul de operare Windows, precum și Android pentru telefoane mobile. Și angajamentul meu este față de tine, sunt mereu dispus să petrec câteva minute și să te ajut să rezolvi orice întrebări pe care le poți avea în această lume a internetului.