OpenAI готовит музыкальный ИИ, работающий с текстом и аудио.

Последнее обновление: 17.12.2023

  • OpenAI разрабатывает инструмент для генерации музыки из текста или аудио.
  • Сотрудничает со студентами Джульярдской школы для аннотирования оценок и создания обучающих данных.
  • Области применения могут быть самыми разными: от инструментального сопровождения до музыки для видеороликов и рекламы.
  • Он будет конкурировать с Suno и Udio в контексте юридической неопределенности и возможных моделей распространения.
Музыкальный ИИ от OpenAI

OpenAI достижения в инструменте, который позволит сочинять музыку по текстовым подсказкам и аудиофрагментам, по данным ряда специализированных изданий. Идея заключается в том, что Любой пользователь может заказать мелодию, определенный стиль или определенное сопровождение и получить готовый к использованию результат..

Источники, цитируемые The Information и другими СМИ, говорят, что система может Добавляйте музыку к существующим видео или создавайте инструментальные треки для уже записанного вокала., например, гитарная линия, бас или ритмическая основа. Графика релизов нет. Пока не решено, будет ли он представлен как самостоятельный продукт или интегрирован в сервисы типа ChatGPT или видеоприложение Sora.

Что мы знаем о проекте

Искусственный интеллект OpenAI для музыки

Инструмент, находящийся в разработке, будет принимать текстовые подсказки и аудиовходы для сгенерировать из фрагментов целые части согласно инструкциямНа практике он предназначен в качестве помощника, облегчающего аккомпанемент, аранжировку и музыкальную настройку без необходимости специальной подготовки.

Эксклюзивный контент – нажмите здесь  OpenAI выпускает расширенный голосовой режим ChatGPT бесплатно для всех

Согласно имеющейся информации, OpenAI изучает Несколько режимов использования: создание с нуля, поддержка вокальных дорожек и звуковой дорожки для видеоТакой подход расширит охват создателей аудиовизуального контента, подкастеров и брендов, которые быстро ищут персонализированную музыку.

Возможные варианты использования и интеграции

Генерация музыки с помощью ИИ

Среди рассматриваемых применений источники упоминают создание специального аккомпанемента (например, гитар) и сочинение музыки для клиповВ коммерческой сфере рассматриваются рекламные кампании с персонализированным звуком и рабочими процессами, связанными с существующими креативными инструментами.

Другая возможность — интеграция с платформами OpenAI: Подключение к ChatGPT упростит взаимодействие на естественном языке., а соединение с Sora облегчило бы монтаж музыки, адаптированной к видеосценам, сгенерированным ИИ. Однако это пока гипотеза, не имеющая официального подтверждения.

Сотрудничество с Джульярдской школой и учебными данными

OpenAI Juilliard

Одним из самых поразительных аспектов является сотрудничество со студентами Джульярдской школы, который будет аннотировать партитуры, предоставляя высококачественные данные. Эти аннотации включают в себя структуру, гармонию и выразительные нюансы, с целью обучения модели как музыкальной форме, так и замыслу.

Эксклюзивный контент – нажмите здесь  Как очистить папку WinSxS, не нарушая работу обновлений Windows

Работа с аннотированными партитурами может обеспечить более структурированная база, чем просто использование аудиодорожек, помогая системе изучать прогрессии, динамику и оркестровку. Более того, этот подход направлен на снизить юридические риски в получении данных и улучшении согласованности создаваемых композиций.

Конкуренты и правовая база

Suno AI

Этот шаг поставит OpenAI в прямую конкуренцию с стартапы, такие как Suno и Udio, а также другие участники, использующие генеративные музыкальные модели (например, усилия Google или ElevenLabs). Тем временем, этот сектор находится под пристальным вниманием из-за недавних судебных исков, Они ставят под сомнение использование защищенного материала для обучения моделей..

В этом контексте появились сообщения от руководителя OpenAI о удобство этого правообладатели получают долю в доходахПока еще неизвестно, как будет реализован механизм компенсации, что является ключевым вопросом для европейской и мировой музыкальной индустрии.

Предыстория и технические проблемы

OpenAI уже протестировала генерацию музыки в 2020 году с помощью Jukebox., эксперимент, который не воплотился в коммерческий продукт. В последние годы компания сосредоточилась на Аудиомодели для преобразования текста в речь и речи в текст, и теперь он возвращается к музыке с большими амбициями.

Эксклюзивный контент – нажмите здесь  Новейшие функции Windows 11: искусственный интеллект и новые способы управления ПК

Технические проблемы включают поддержание масштабная связность в композициях, качество данных и вычислительные затратыПрозрачность в отношении обучения и человеческого контроля на творческом этапе также будет иметь решающее значение для создания полезных произведений, которые будут приняты музыкантами и продюсерами.

Если проект окажется успешным, он может облегчить доступ к европейским и испанским деятелям искусства. Саундтреки и аранжировки по запросу по более низкой цене, хотя споры по вопросам интеллектуальной собственности, лицензирования и прослеживаемости продолжатся. Реакция отрасли будет зависеть от чётких соглашений и фактического качества демоверсий на момент их выпуска.

что является мусором ИИ
Статья по теме:
Мусор ИИ: что это такое, почему это важно и как с этим бороться