June 26, 13:20

Интересная штука: нейросеть получает на вход аудио речи и подбирает к ней жестикуляцию. Полноценные дипфейки всё ближе.

Обучали на видео с ведущими, лекторами и другими публичными спикерами, датасет можно скачать (144 часа видео с размеченной жестикуляцией).