- OpenAI sviluppa uno strumento per generare musica da testo o audio.
- Collabora con gli studenti della Juilliard School per annotare i punteggi e creare dati di formazione.
- Gli utilizzi spaziano dall'accompagnamento strumentale alla musica per video e pubblicità.
- Sarà in concorrenza con Suno e Udio in un contesto di incertezze legali e possibili modelli di distribuzione.
OpenAI progressi in uno strumento che consentirà comporre musica da prompt di testo e campioni audio, secondo diverse pubblicazioni specializzate. L'idea è che Ogni utente può richiedere una melodia, uno stile specifico o un accompagnamento specifico e ottenere un risultato pronto all'uso..
Fonti citate da The Information e altri organi di stampa affermano che il sistema potrebbe Aggiungi musica ai video esistenti o crea tracce strumentali per voci già registrate, come una linea di chitarra, un basso o basi ritmiche. Non c'è un programma di rilascio Non è ancora stato deciso se arriverà come prodotto indipendente o integrato in servizi come ChatGPT o l'app video Sora.
Cosa sappiamo del progetto

Lo strumento in fase di sviluppo accetterebbe prompt di testo e input audio per generare da frammenti a pezzi completi secondo le istruzioniIn pratica, è concepito come un assistente che facilita gli accompagnamenti, gli arrangiamenti e le impostazioni musicali senza la necessità di una formazione avanzata.
Secondo le informazioni disponibili, OpenAI sta esplorando Molteplici modalità di utilizzo: creazione da zero, supporto per tracce vocali e colonna sonora per videoQuesto approccio amplierebbe rapidamente la portata dei creatori audiovisivi, dei podcaster e dei marchi alla ricerca di musica personalizzata.
Possibili usi e integrazione

Tra le applicazioni contemplate, le fonti menzionano la generare accompagnamenti specifici (ad esempio chitarre) e comporre musica per clipIn ambito commerciale, si stanno prendendo in considerazione campagne pubblicitarie con audio personalizzato e flussi di lavoro collegati agli strumenti creativi esistenti.
Un'altra possibilità è l'integrazione con le piattaforme OpenAI: Una connessione a ChatGPT semplificherebbe l'interazione in linguaggio naturale, mentre una connessione con Sora faciliterebbe l'editing di musica su misura per scene video generate dall'intelligenza artificiale. Tuttavia, questa è un'ipotesi senza conferme ufficiali per ora.
Collaborazione con Juilliard e dati di formazione

Uno degli aspetti più sorprendenti è l collaborazione con gli studenti della Juilliard School, che annoterebbe gli spartiti per fornire dati di alta qualità. Questa annotazione include struttura, armonia e sfumature espressive, con l'intento di insegnare al modello sia la forma musicale che l'intento.
Lavorare con spartiti annotati può fornire un base più strutturata rispetto al semplice utilizzo di tracce audio, aiutando il sistema ad apprendere progressioni, dinamiche e orchestrazione. Inoltre, questo approccio mira a ridurre i rischi legali nell'ottenimento dei dati e nel miglioramento della coerenza delle composizioni generate.
Concorrenti e quadro giuridico

La mossa metterebbe OpenAI in diretta competizione con startup come Suno e Udio, così come altri attori con modelli musicali generativi (ad esempio, gli sforzi di Google o ElevenLabs). Il settore, nel frattempo, è sotto esame a causa di recenti cause legali che Mettono in discussione l'uso di materiale protetto per addestrare i modelli.
In questo contesto sono emersi messaggi dal responsabile di OpenAI circa la comodità di ciò i titolari dei diritti condividono i ricaviResta da vedere come si concretizzerà un meccanismo di compensazione, una questione chiave per l'industria musicale europea e mondiale.
Contesto e sfide tecniche
OpenAI ha già testato la generazione di musica nel 2020 con Jukebox., un esperimento che non si è concretizzato in un prodotto commerciale. Negli ultimi anni, l'azienda si è concentrata su Modelli audio per la conversione da testo a voce e da parlato a testoe ora torna alla musica con maggiore ambizione.
Le sfide tecniche riguardano il mantenimento di un coerenza su larga scala nelle composizioni, qualità dei dati e costo computazionaleAnche la trasparenza in materia di formazione e supervisione umana durante la fase creativa sarà fondamentale per realizzare brani utili e accettati da musicisti e produttori.
Se il progetto avrà successo, potrebbe facilitare l'accesso ai creatori europei e spagnoli. Colonne sonore e arrangiamenti su richiesta a costi inferiori, sebbene persisteranno i dibattiti su proprietà intellettuale, licenze e tracciabilità. La risposta del settore dipenderà da accordi chiari e dalla qualità effettiva delle demo al momento del rilascio.
Sono un appassionato di tecnologia che ha trasformato i suoi interessi "geek" in una professione. Ho trascorso più di 10 anni della mia vita utilizzando tecnologie all'avanguardia e armeggiando con tutti i tipi di programmi per pura curiosità. Ora mi sono specializzato in informatica e videogiochi. Questo perché da più di 5 anni scrivo per vari siti web di tecnologia e videogiochi, creando articoli che cercano di darti le informazioni di cui hai bisogno in un linguaggio comprensibile a tutti.
In caso di domande, le mie conoscenze spaziano da tutto ciò che riguarda il sistema operativo Windows e Android per telefoni cellulari. E il mio impegno è nei tuoi confronti, sono sempre disposto a dedicare qualche minuto e aiutarti a risolvere qualsiasi domanda tu possa avere in questo mondo di Internet.