Искусственный интеллект заставил Распутина петь Бейонсе
Британские специалисты создали генеративно-состязательную нейросеть, которая анимирует двухмерные изображения и синхронизирует их с аудиоклипами. Сделано это не ради шутки — наложение звуковой дорожки на мимику часто осуществляется в современной киноиндустрии на этапе постпроизводства.
Для большего правдоподобия, вдобавок к синхронизации движений губ, ученые из ИИ-центра Samsung в Кембридже и Имперского Колледжа Лондона добавили сокращения мимических мышц и моргание глаз, сообщает VentureBeat.
Исследователи надеются, что созданную ими модель можно будет применять для автоматического создания говорящих голов в анимированных фильмах, заполнения пробелов, когда видео прерывается из-за плохой связи или для дублированного перевода на другие языки. И для манипулятивных дипфейков, конечно.
В примерах, выложенных на YouTube, Григорий Распутин распевает хит Бейонсе «Halo», покойные рэперы 2Pac и Biggie исполняют свои произведения, а Альберт Эйнштейн цитирует сам себя. Больше примеров и статью, описывающую работу модели, можно найти по ссылке.
Об опасности фальшивых видео говорят на самом высоком уровне. Прошлой осенью Палата представителей Конгресса США направила официальный запрос директору Национальной разведки с просьбой предоставить подробный отчет о технологии. Конгрессмены уверены, что дипфейки представляют угрозу нацбезопасности.
Напомним, ранее сообщалось, что нейросеть научилась делать реалистичные фото по простым рисункам.