Команда дослідників Google представила нову нейромережу VLOGGER. Вона дає змогу генерувати анімацію людини, яка розмовляє, за однією статичною фотографією. Мета ШІ-алгоритму – створити реалістичне відео змінної довжини із зображенням мовлення людини.
Технологія здатна синхронізувати рух губ, додати моргання очей і жестикуляцію. Ще VLOGGER здатний відредагувати вираз обличчя на вже готовому відео: наприклад, закрити очі або рот.
Нарешті, технологію можна використовувати для перекладу мови з синхронізацією руху губ із вимовою іншою мовою. Схожу функцію пропонує, наприклад, сервіс HeyGen.
“Технологію можна використовувати не тільки для спрощення творчих процесів, а й для абсолютно нових можливостей, таких як онлайн-комунікації, освіта або персоналізовані віртуальні помічники”, – дослідники Google.