Alibaba AI представила революционную технологию под названием EMO (сокращение от «Emote Portrait Alive»), которая позволяет превращать статичные портреты в реалистичные анимированные видеоролики.
Будьте готовы, потому что ИИ меняет наше представление о видео! Такие компании, как OpenAI и Alibaba, поражают нас новыми инструментами. Помните Сору из OpenAI? Он мог создавать видеоперсонажей в полный рост только из текста. Теперь у Alibaba есть нечто под названием EMO («Живой портрет эмоций»), которое может взять любой старый портрет и оживить его.
Это очень важно, особенно если вы любите снимать видео или увлекаетесь искусственным интеллектом. Давайте разберемся, как работает ЭМО и какие сумасшедшие вещи с его помощью можно сделать.

Что такое Alibaba AI EMO (живой портрет эмоции)?
EMO — это передовая система искусственного интеллекта, разработанная Alibaba, которая может создавать реалистичные видео разговоров и пения из одного неподвижного изображения. Он использует генерацию видео «говорящей головой» на основе звука для создания невероятно реалистичной анимации.
Давайте разберем, как работает ЭМО:
- Ввод одного изображения: Магия ЭМО начинается с одной портретной фотографии. Это может быть историческая личность, вымышленный персонаж или даже ваша собственная фотография.
- Аудио ввод: Для анимации портрета EMO требуется аудиовход: речь или пение.
- магия искусственного интеллекта: Сложные алгоритмы искусственного интеллекта EMO анализируют как изображение, так и звук, генерируя точные выражения лица, форму рта и движения головы, которые идеально синхронизируются с предоставленным звуком.
Alibaba AI EMO выделяется своей способностью создавать невероятно реалистичную анимацию. Видео, которые он генерирует, часто неотличимы от реальных кадров, стирая границы между контентом, созданным на основе искусственного интеллекта, и реальностью. Этот уровень реализма является важным шагом вперед в технологии анимации, управляемой искусственным интеллектом.
Помимо реалистичных движений, EMO с легкостью справляется как с пением, так и с устной речью. Независимо от того, предоставите ли вы запись речи или песню, EMO оживит портрет соответствующими выражениями, соответствующими звуку. Такая универсальность делает его мощным инструментом для различных применений.
EMO также предлагает гибкость, позволяя определять продолжительность анимированного видео в зависимости от длины вашего аудиовхода. Это означает, что вы можете создавать короткие клипы или более длинные и глубокие анимации по мере необходимости.
Подождите, у Alibaba есть команда по исследованию искусственного интеллекта?
Alibaba реализует важный исследовательский проект в области искусственного интеллекта.
В 2017 году они создали Академия ДАМО (Discovery, Adventure, Momentum, Outlook), глобальная исследовательская инициатива, посвященная изучению передовых технологий, таких как искусственный интеллект, машинное обучение и анализ данных. Alibaba активно применяет ИИ на своей обширной платформе электронной коммерции и в различных других областях.
Например, ИИ играет роль в оптимизации маршрутов доставки и управлении складами в рамках интеллектуальных логистических систем. Он также обеспечивает работу чат-ботов и службы поддержки клиентов посредством обработки естественного языка и создает персонализированные рекомендации по продуктам для клиентов. Alibaba демонстрирует свою приверженность исследованиям в области искусственного интеллекта, инвестируя в эти усилия миллиарды долларов.
Чума дипфейков
EMO от Alibaba AI представляет серьезную угрозу для и без того тревожного мира дипфейков. Он потенциально может значительно упростить создание вводящего в заблуждение контента. С помощью EMO человек без обширных технических знаний может создавать реалистичные видеоролики, в которых люди говорят то, чего они никогда не делали. Передовая технология анимации в EMO грозит сделать эти дипфейки еще более убедительными, стирая грань между реальным и вымышленным. Эта способность манипулировать внешностью человека с помощью всего лишь аудиовхода открывает дверь для потенциально разрушительных искажений.
EMO подчеркивает тревожные возможности манипуляций с помощью искусственного интеллекта. Подобные технологии могут быть опасными в чужих руках и подчеркивают острую необходимость более строгих правил и мер безопасности. Потенциальный вред варьируется от простого убийства персонажей до крупномасштабных кампаний по дезинформации, которые могут полностью дестабилизировать доверие к СМИ. Крайне важно подходить к EMO и подобным технологиям с особой осторожностью, чтобы попытаться предотвратить эти негативные последствия.
См. Полная исследовательская работа здесь.
Автор избранного изображения: Марк Дэйнс/Unsplash.
