- OpenAI utvikler et verktøy for å generere musikk fra tekst eller lyd.
- Samarbeider med studenter ved Juilliard School for å kommentere poengsummer og lage treningsdata.
- Bruksområder vil variere fra instrumental akkompagnement til musikk for videoer og reklame.
- Den vil konkurrere med Suno og Udio i en sammenheng med juridisk usikkerhet og mulige distribusjonsmodeller.
Åpen kunstig intelligens fremskritt i et verktøy som vil tillate komponere musikk fra tekstprompter og lydeksempler, ifølge flere fagpublikasjoner. Tanken er at Enhver bruker kan be om en melodi, en spesifikk stil eller et spesifikt akkompagnement og få et bruksklart resultat..
Kilder sitert av The Information og andre medier sier at systemet kunne Legg til musikk i eksisterende videoer eller lag instrumentale spor for allerede innspilt vokal, for eksempel en gitarlinje, bass eller rytmiske baser. Det er ingen utgivelsesplan Det er ennå ikke avgjort om det vil komme som et selvstendig produkt eller være integrert i tjenester som ChatGPT eller videoappen Sora.
Det vi vet om prosjektet

Verktøyet under utvikling vil godta tekstmeldinger og lydinnganger for generere fra fragmenter til komplette deler i henhold til instruksjoneneI praktiske scenarier er den ment som en assistent som tilrettelegger akkompagnement, arrangementer og musikalske omgivelser uten behov for avansert opplæring.
I følge tilgjengelig informasjon utforsker OpenAI Flere bruksmoduser: oppretting fra bunnen av, støtte for vokalspor og lydspor for videoDenne tilnærmingen ville utvide rekkevidden til audiovisuelle skapere, podkastere og merkevarer som raskt ser etter tilpasset musikk.
Mulige bruksområder og integrasjon

Blant de aktuelle søknadene nevner kildene generere spesifikke akkompagnementer (f.eks. gitarer) og komponere musikk til klippPå den kommersielle arenaen vurderes reklamekampanjer med tilpasset lyd og arbeidsflyter knyttet til eksisterende kreative verktøy.
En annen mulighet er integrasjon med OpenAI-plattformer: En tilkobling til ChatGPT ville forenkle samhandling med naturlig språk, mens en forbindelse med Sora ville legge til rette for redigering av musikk skreddersydd til AI-genererte videoscener. Dette er imidlertid en hypotese uten offisiell bekreftelse foreløpig.
Samarbeid med Juilliard og treningsdata

En av de mest slående aspektene er samarbeid med studenter fra Juilliard School, som ville annotere partiturer for å gi data av høy kvalitet. Denne annoteringen inkluderer struktur, harmoni og uttrykksfulle nyanser, med den hensikt å lære modellen både musikalsk form og intensjon.
Å jobbe med kommenterte partiturer kan gi en mer strukturert grunnlag enn å bare bruke lydspor, noe som hjelper systemet med å lære progresjoner, dynamikk og orkestrering. Videre tar denne tilnærmingen sikte på å redusere juridiske risikoer i å innhente data og forbedre konsistensen til de genererte komposisjonene.
Konkurrenter og juridisk rammeverk

Tiltaket ville sette OpenAI i direkte konkurranse med oppstartsbedrifter som Suno og Udio, så vel som andre aktører med generative musikalske modeller (f.eks. innsats fra Google eller ElevenLabs). Sektoren er i mellomtiden under lupen på grunn av nylige søksmål som De stiller spørsmål ved bruken av beskyttet materiale for å trene modeller.
I denne sammenhengen har det dukket opp meldinger fra lederen av OpenAI om bekvemmeligheten av det rettighetsinnehaverne deler av inntekteneDet gjenstår å se hvordan en kompensasjonsmekanisme vil materialisere seg, et sentralt spørsmål for den europeiske og globale musikkbransjen.
Bakgrunn og tekniske utfordringer
OpenAI testet allerede musikkgenerering i 2020 med Jukebox., et eksperiment som ikke ble til et kommersielt produkt. De siste årene har selskapet fokusert på Lydmodeller for tekst-til-tale og tale-til-tekst, og nå vender han tilbake til musikken med større ambisjoner.
De tekniske utfordringene innebærer å opprettholde en storskala koherens i komposisjoner, datakvalitet og beregningskostnadÅpenhet rundt opplæring og menneskelig tilsyn i den kreative fasen vil også være avgjørende for å oppnå nyttige stykker som blir akseptert av musikere og produsenter.
Hvis prosjektet blir vellykket, kan det legge til rette for tilgang for europeiske og spanske skapere. Lydspor og arrangementer på forespørsel til en lavere kostnad, selv om debatter om immaterielle rettigheter, lisensiering og sporbarhet vil vedvare. Bransjens respons vil avhenge av klare avtaler og den faktiske kvaliteten på demoene når de slippes.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.