Поскольку технологии искусственного интеллекта быстро развиваются и раздвигают границы, новый проект Microsoft, VASA-1, может превращать фотографии в видео и добавлять к ним реалистичные звуки. Да, вы не ослышались.

Эта захватывающая технология использует портретную фотографию и аудиофайл для создания видео говорящего лица с реалистичной синхронизацией губ, выражений лица и движений головы.

Обещанная мощь VASA-1 вызывает некоторые опасения, из-за которых Microsoft не решается выпустить его. Вот что мы знаем…

Возможности и влияние VASA-1

Самая яркая особенность ВАСА-1 заключается в его способности создавать реалистичную лицевую анимацию. В отличие от предыдущих моделей искусственного интеллекта, VASA-1 выглядит более естественно за счет минимизации ошибок вокруг рта. Это может привести к тому, что более реалистичные дипфейковые видео будут более широко распространяться в Интернете.

  Дата выхода ремейка Final Fantasy 7 Rebirth, трейлер и многое другое

Благодаря новой технологии Microsoft возможны высококачественные и реалистичные результаты. Демонстрационные видеоролики компании представляют собой впечатляющие примеры, которые стирают грань между реальностью и контентом, созданным искусственным интеллектом.

Будет интересно посмотреть, что Sora от OpenAI и VASA-1 от Microsoft готовят нам в ближайшие годы…

Компания объяснила в своем блоге следующее:

Примечание. Все портретные изображения на этой странице являются виртуальными, несуществующими личностями, созданными StyleGAN2 или DALL·E-3 (за исключением Моны Лизы). Мы изучаем создание визуальных эмоциональных навыков для виртуальных интерактивных персонажей, которые НЕ имитируют реальных людей. Это всего лишь исследовательская демонстрация, и выпуск каких-либо продуктов или API не планируется.

Области использования VASA-1

Возможности использования VASA-1 обширны и могут раздвинуть границы творчества. Например, его можно использовать для улучшения игровых впечатлений. Повышение реалистичности игровых персонажей за счет синхронизированных движений губ и выразительной мимики может изменить игровой мир. Даже сейчас персонажи в играх невероятно оптимизированы. Однако с помощью этой технологии они, вероятно, улучшатся еще больше.

  Лучший покемон для Cinderace: руководство по событиям Tera Raid

С другой стороны, также можно создавать персонализированные виртуальные аватары. Пользователи могут изменить ситуацию в социальных сетях, создавая реалистичные аватары, отражающие их собственную внешность. В киноиндустрии также ожидаются удивительные изменения. VASA-1 может расширить границы кинопроизводства, создавая реалистичные крупные планы, выражения лица и естественные диалоги.

Как работают технологии и будущее

Microsoft заявляет, что VASA-1 предлагает новую основу для создания реалистичных говорящих лиц и анимации виртуальных персонажей. Технология направлена ​​на достижение впечатляющих результатов, используя только портретную фотографию и аудиофайл. Однако широкое использование этой технологии вызывает некоторые опасения. В частности, возможность злоупотребления такими технологиями, как дипфейк, заставляет Microsoft проявлять осторожность.

Одна из проблем, с которыми сталкивается Microsoft, — это баланс между инновациями и ответственностью. Осознавая потенциальную пользу, которую приносят технологии, компания ответственно подходит к разработке и старается информировать пользователей о потенциальных опасностях. Таким образом, он стремится сдерживать распространение такой мощной технологии, как VASA-1, обеспечивая общую безопасность общества.

  Объяснение тренда количества заметок в Instagram

Предоставленное изображение предоставлено: Майкрософт

Source: Microsoft VASA-1 оживляет фотографии: все, что вам нужно знать