Діпфейк-музика. Як штучні голоси загрожують музичній індустрії

Діпфейк-музика. Як штучні голоси загрожують музичній індустрії

«It’s Christmas time! It’s hot tub time!» — звучать рядки з якоїсь пісні. Голос схожий на голос Френка Сінатри, знаменитого американського співака — з легким свінгом, музика теж нагадує сінатрівську — стримані розчерки духових та струнних. Композиція могла б зійти за втрачену запис Сінатри. Хоча голос іноді підводить — його ніби записано на дні басейну.

Але мова йде не про реальну пісню, а про переконливу підробку, створену компанією OpenAI, що займається штучним інтелектом. Проект Jukebox використовує штучний інтелект для створення музики з текстами у найрізноманітніших жанрах. Крім діпфейка Сінатри компанія створила діпфейки Кеті Перрі, Елвіса Преслі, 2Pac, Селін Діон та інших виконавців. Навчивши алгоритм за допомогою 1,2 млн пісень, взятих з інтернету, разом з відповідними текстами та метаданими, вона може видавати необроблену звукову доріжку тривалістю в кілька хвилин в залежності від того, що їй «згодовують».

Хоч як би не дивувала ця технологія, в деяких семплах є щось страшне. Особливо в тих, що копіюють голоси вже покійних артистів. Це приклад феномена «зловісної долини», явища, коли щось, що занадто нагадує реальну людину, викликає страх та огиду. Зазвичай цей феномен застосовують до людиноподібних роботів.

Діпфейк-вокал може мати найрізноманітніші наслідки для музичної індустрії, оскільки все більше компаній використовують алгоритми в музиці. Проект Google Magenta, заявлений як «дослідження машинного навчання в якості інструменту у творчому процесі», розробив кілька API з відкритим вихідним кодом, які дозволяють створювати композиції з використанням абсолютно нових, згенерованих машиною звуків або спільної творчості людини та штучного інтелекту. Численні стартапи, такі як Amper Music, створюють музику на основі штучного інтелекту з глобальним авторським правом для мультимедійного контенту. Навіть Spotify балується цим — дослідницьку групу компанії зі штучного інтелекту очолює Франсуа Паше, екс-керівник лабораторії комп’ютерних наук Sony Music.

Неважко здогадатися, як такі діпфейки приведуть до масових проблем етики та інтелектуальної власності. Якщо ви не хочете платити ринкову ціну за використання музики відомого виконавця у фільмі, телешоу або рекламі, ви можете створити свою власну імітацію. А потокові сервіси зможуть доповнювати жанрові плейлисти схожими за звучанням артистами, що їх згенерував штучний інтелект. Їм не потрібно платити гонорари, що тільки збільшити прибуток стрімінгів.

Юридичні відділи музичної індустрії уважно стежать за розвитком подій. Раніше цього року американська концертна компанія Roc Nation подала запит на видалення анонімного користувача YouTube за використання штучного інтелекту для імітації голосу та ритму Джей-Зі у репі на слова Шекспіра та Біллі Джоела. «Цей контент незаконно використовує штучний інтелект для імітації голосу нашого клієнта», – йдеться у запиті. І хоча в підсумку відео були відновлені, справа, перша у своєму роді, не закрита. У Roc Nation відмовилися коментувати юридичні наслідки музичного діпфейка.

Музичні діпфейки ставлять ще більш глибокі питання. Наприклад, що робить конкретного виконавця особливим? Чому ми реагуємо на певні стилі або жанри музики? Якщо людський аспект творчості винесуть за дужки — чи втратимо ми щось важливе?

За матеріалами The Guardian

Content Protection by DMCA.com