Поскольку технологии искусственного интеллекта быстро развиваются и раздвигают границы, новый проект Microsoft, VASA-1, может превращать фотографии в видео и добавлять к ним реалистичные звуки. Да, вы не ослышались.
Эта захватывающая технология использует портретную фотографию и аудиофайл для создания видео говорящего лица с реалистичной синхронизацией губ, выражений лица и движений головы.
Обещанная мощь VASA-1 вызывает некоторые опасения, из-за которых Microsoft не решается выпустить его. Вот что мы знаем…
Возможности и влияние VASA-1
Самая яркая особенность ВАСА-1 заключается в его способности создавать реалистичную лицевую анимацию. В отличие от предыдущих моделей искусственного интеллекта, VASA-1 выглядит более естественно за счет минимизации ошибок вокруг рта. Это может привести к тому, что более реалистичные дипфейковые видео будут более широко распространяться в Интернете.
Благодаря новой технологии Microsoft возможны высококачественные и реалистичные результаты. Демонстрационные видеоролики компании представляют собой впечатляющие примеры, которые стирают грань между реальностью и контентом, созданным искусственным интеллектом.
Будет интересно посмотреть, что Sora от OpenAI и VASA-1 от Microsoft готовят нам в ближайшие годы…
Примечание. Все портретные изображения на этой странице являются виртуальными, несуществующими личностями, созданными StyleGAN2 или DALL·E-3 (за исключением Моны Лизы). Мы изучаем создание визуальных эмоциональных навыков для виртуальных интерактивных персонажей, которые НЕ имитируют реальных людей. Это всего лишь исследовательская демонстрация, и выпуск каких-либо продуктов или API не планируется.
Области использования VASA-1
Возможности использования VASA-1 обширны и могут раздвинуть границы творчества. Например, его можно использовать для улучшения игровых впечатлений. Повышение реалистичности игровых персонажей за счет синхронизированных движений губ и выразительной мимики может изменить игровой мир. Даже сейчас персонажи в играх невероятно оптимизированы. Однако с помощью этой технологии они, вероятно, улучшатся еще больше.
С другой стороны, также можно создавать персонализированные виртуальные аватары. Пользователи могут изменить ситуацию в социальных сетях, создавая реалистичные аватары, отражающие их собственную внешность. В киноиндустрии также ожидаются удивительные изменения. VASA-1 может расширить границы кинопроизводства, создавая реалистичные крупные планы, выражения лица и естественные диалоги.
Как работают технологии и будущее
Microsoft заявляет, что VASA-1 предлагает новую основу для создания реалистичных говорящих лиц и анимации виртуальных персонажей. Технология направлена на достижение впечатляющих результатов, используя только портретную фотографию и аудиофайл. Однако широкое использование этой технологии вызывает некоторые опасения. В частности, возможность злоупотребления такими технологиями, как дипфейк, заставляет Microsoft проявлять осторожность.
Одна из проблем, с которыми сталкивается Microsoft, — это баланс между инновациями и ответственностью. Осознавая потенциальную пользу, которую приносят технологии, компания ответственно подходит к разработке и старается информировать пользователей о потенциальных опасностях. Таким образом, он стремится сдерживать распространение такой мощной технологии, как VASA-1, обеспечивая общую безопасность общества.
Предоставленное изображение предоставлено: Майкрософт
Source: Microsoft VASA-1 оживляет фотографии: все, что вам нужно знать