«It’s Christmas time! It’s hot tub time!» — звучат строчки из какой-то песни. Голос похож на голос Фрэнка Синатры, знаменитого американского певца — с легким свингом, музыка тоже напоминает синатровскую — сдержанные росчерки духовых и струнных. Композиция могла бы сойти за потерянную запись Синатры. Хотя голос иногда подводит — он будто записан на дне бассейна.
Но речь идет не о реальной песне, а об убедительной подделке, созданной компанией OpenAI, занимающейся искусственным интеллектом. Проект Jukebox использует искусственный интеллект для создания музыки с текстами в самых разных жанрах. Кроме дипфейка Синатры компания создала дипфейки Кэти Перри, Элвиса Пресли, 2Pac, Селин Дион и других исполнителей. Обучив алгоритм с помощью 1,2 млн песен, взятых из интернета, вместе с соответствующими текстами и метаданными, она может выдавать необработанную звуковую дорожку длительностью в несколько минут в зависимости от того, что ей «скармливают».
Как бы не удивляла эта технология, в некоторых сэмплах есть что-то пугающее. Особенно в тех, которые копируют голоса уже покойных артистов. Это пример феномена «зловещей долины», явления, когда что-то, слишком напоминающее реального человека, вызывает страх и отвращение. Обычно этот феномен применяют к человекоподобным роботам.
Дипфейк-вокал может иметь самые разные последствия для музыкальной индустрии, поскольку все больше компаний используют алгоритмы в музыке. Проект Google Magenta, заявленный как «исследование машинного обучения в качестве инструмента в творческом процессе», разработал несколько API с открытым исходным кодом, которые позволяют создавать композиции с использованием совершенно новых, генерируемых машиной звуков или совместного творчества человека и ИИ. Многочисленные стартапы, такие как Amper Music, создают музыку на основе ИИ с глобальным авторским правом для мультимедийного контента. Даже Spotify балуется этим — исследовательскую группу компании по искусственному интеллекту возглавляет Франсуа Паше, экс-руководитель лаборатории компьютерных наук Sony Music.
Нетрудно догадаться, как такие дипфейки приведут к массовым проблемам этики и интеллектуальной собственности. Если вы не хотите платить рыночную цену за использование музыки известного исполнителя в фильме, телешоу или рекламе, вы можете создать свою собственную имитацию. А потоковые сервисы смогут дополнять жанровые плейлисты похожими по звучанию артистами, сгенерированными искусственным интеллектом. Им не нужно платить гонорары, что только увеличить прибыль стримингов.
Юридические отделы музыкальной индустрии внимательно следят за развитием событий. Ранее в этом году американская концертная компания Roc Nation подала запрос на удаление анонимного пользователя YouTube за использование искусственного интеллекта для имитации голоса и ритма Джей-Зи в рэпе на слова Шекспира и Билли Джоэла. «Этот контент незаконно использует ИИ для имитации голоса нашего клиента», — говорится в заявке. И хотя в итоге видео были восстановлены, дело, первое в своем роде, не закрыто. В Roc Nation отказались комментировать юридические последствия музыкального дипфейка.
Музыкальные дипфейки ставят еще более глубокие вопросы. Например, что делает конкретного исполнителя особенным? Почему мы реагируем на определенные стили или жанры музыки? Если человеческий аспект творчества вынесут за скобки — потеряем ли мы нечто важное?
По материалам The Guardian