Исследовательский центр Microsoft в Азии представил новый экспериментальный инструмент искусственного интеллекта под названием VASA-1. Он способен превратить статичное изображение человека или даже его рисунок, вместе с аудиофайлом, в реалистичное видео, где лицо разговаривает или поет в режиме реального времени.
ИИ может генерировать выражения лица и движения головы, а также точно синхронизировать движения губ с речью или песней. На странице проекта исследователи разместили множество примеров, качество которых настолько велико, что может ввести в заблуждение относительно их подлинности.
Тем не менее, при внимательном рассмотрении движения губ и головы в примерах могут показаться несколько механическими и несинхронизированными.
Существует риск злоупотребления технологией для быстрого создания фальсифицированных видео реальных людей. Сами исследователи осознают эту проблему и решили не выпускать онлайн-демонстрации, API, продукты, дополнительные детали реализации или любые связанные предложения до тех пор, пока не убедятся, что технология будет использоваться ответственно и в соответствии с соответствующими нормами.