- OpenAI opracowuje narzędzie do generowania muzyki z tekstu lub dźwięku.
- Współpracuje ze studentami Juilliard School w zakresie adnotacji wyników i tworzenia danych szkoleniowych.
- Zakres zastosowań obejmuje akompaniament instrumentalny, muzykę do filmów i reklam.
- Będzie konkurować z Suno i Udio w kontekście niepewności prawnej i możliwych modeli dystrybucji.
OpenAI postęp w narzędziu, które umożliwi komponować muzykę na podstawie podpowiedzi tekstowych i próbek audio, według kilku specjalistycznych publikacji. Chodzi o to, że Każdy użytkownik może zamówić melodię, konkretny styl lub konkretny akompaniament i otrzymać gotowy do użycia rezultat..
Źródła cytowane przez The Information i inne media podają, że system mógłby Dodawaj muzykę do istniejących filmów lub twórz ścieżki instrumentalne do już nagranych partii wokalnychtakie jak linia gitary, bas czy rytmiczne basy. Nie ma harmonogramu wydań Nie podjęto jeszcze decyzji, czy będzie to produkt niezależny, czy też zintegrowany z usługi takie jak ChatGPT lub aplikacji wideo Sora.
Co wiemy o projekcie

Narzędzie w fazie rozwoju będzie akceptować komunikaty tekstowe i dane audio. generować z fragmentów kompletne utwory zgodnie z instrukcjamiW praktyce jest to narzędzie wspomagające akompaniament, aranżacje i oprawę muzyczną bez potrzeby specjalistycznego szkolenia.
Według dostępnych informacji OpenAI bada Wiele trybów użytkowania: tworzenie od podstaw, obsługa ścieżek wokalnych i ścieżek dźwiękowych do wideoTakie podejście pozwoliłoby na zwiększenie zasięgu twórców treści audiowizualnych, podcastów i marek, które szybko poszukują muzyki dostosowanej do ich potrzeb.
Możliwe zastosowania i integracja

Wśród rozważanych zastosowań źródła wymieniają: generowanie konkretnych akompaniamentów (np. gitar) i komponowanie muzyki do klipówW sferze komercyjnej rozważa się kampanie reklamowe z dostosowanym dźwiękiem i procesami pracy połączonymi z istniejącymi narzędziami kreatywnymi.
Inną możliwością jest integracja z platformami OpenAI: Połączenie z ChatGPT uprościłoby interakcję w języku naturalnymPołączenie z Sorą ułatwiłoby edycję muzyki dopasowanej do scen wideo generowanych przez sztuczną inteligencję. Jest to jednak hipoteza, która na razie nie została oficjalnie potwierdzona.
Współpraca z Juilliard i dane szkoleniowe

Jednym z najbardziej uderzających aspektów jest współpraca ze studentami Juilliard School, który będzie adnotował partytury, aby zapewnić wysokiej jakości dane. Adnotacja ta obejmuje strukturę, harmonię i niuanse ekspresyjne, mając na celu nauczenie modelu zarówno formy muzycznej, jak i intencji.
Praca z adnotowanymi wynikami może zapewnić bardziej ustrukturyzowana baza niż po prostu korzystanie ze ścieżek audio, pomagając systemowi uczyć się progresji, dynamiki i orkiestracji. Ponadto podejście to ma na celu zmniejszyć ryzyko prawne w pozyskiwaniu danych i poprawianiu spójności generowanych kompozycji.
Konkurencja i ramy prawne

Ten ruch postawiłby OpenAI w bezpośredniej konkurencji z startupy takie jak Suno i Udio, a także innych aktorów z generatywnymi modelami muzycznymi (np. inicjatywy Google czy ElevenLabs). Tymczasem sektor ten jest pod lupą z powodu niedawnych pozwów, które Podważają zasadność stosowania materiałów chronionych do szkolenia modeli.
W tym kontekście pojawiły się wiadomości od szefa OpenAI dotyczące wygoda tego udział właścicieli praw w przychodachNadal nie wiadomo, w jaki sposób będzie wyglądał mechanizm rekompensaty, co jest kluczową kwestią dla europejskiego i światowego przemysłu muzycznego.
Tło i wyzwania techniczne
OpenAI testowało już generowanie muzyki w 2020 r. za pomocą Jukeboxa., eksperyment, który nie przerodził się w produkt komercyjny. W ostatnich latach firma skupiła się na Modele audio dla zamiany tekstu na mowę i mowy na teksti teraz powraca do muzyki z większymi ambicjami.
Wyzwania techniczne obejmują utrzymanie spójność na dużą skalę w kompozycjach, jakość danych i koszt obliczeniowyPrzejrzystość w zakresie szkoleń i nadzoru ludzkiego w fazie twórczej będzie również kluczowa dla uzyskania wartościowych utworów, akceptowanych przez muzyków i producentów.
Jeśli projekt okaże się sukcesem, może ułatwić dostęp do twórców europejskich i hiszpańskich. Ścieżki dźwiękowe i aranżacje na żądanie w niższej cenieChoć debaty na temat własności intelektualnej, licencjonowania i identyfikowalności będą się utrzymywać, reakcja branży będzie zależeć od jasnych umów i rzeczywistej jakości wersji demonstracyjnych w momencie ich udostępnienia.
Jestem entuzjastą technologii, który swoje „geekowskie” zainteresowania przekształcił w zawód. Spędziłem ponad 10 lat mojego życia, korzystając z najnowocześniejszych technologii i majsterkując przy wszelkiego rodzaju programach z czystej ciekawości. Teraz specjalizuję się w technologii komputerowej i grach wideo. Dzieje się tak dlatego, że od ponad 5 lat piszę dla różnych serwisów poświęconych technologii i grom wideo, tworząc artykuły, których celem jest dostarczenie potrzebnych informacji w języku zrozumiałym dla każdego.
Jeśli masz jakieś pytania, moja wiedza obejmuje wszystko, co jest związane z systemem operacyjnym Windows, a także Androidem dla telefonów komórkowych. Moje zaangażowanie jest wobec Ciebie. Zawsze jestem gotowy poświęcić kilka minut i pomóc Ci rozwiązać wszelkie pytania, jakie możesz mieć w tym internetowym świecie.