DeepMind от Google имеет объявлено Genie 2, революционная модель, способная создавать игровые трехмерные миры исключительно на основе текстовых подсказок. Эта технология основана на более ранней версии Genie 1, которая создавала 2D-среды. Достижения Genie 2 позиционируют его как инновационный инструмент для создания разнообразного интерактивного опыта в реальном времени.

DeepMind от Google представляет Genie 2 для 3D-игровых миров

Genie 2 предназначен для создания захватывающих виртуальных миров путем моделирования анимации, физики и взаимодействий. Используя изображения, которые можно создать из простых текстовых подсказок, модель обеспечивает творческую гибкость. Например, пользователь может ввести запрос «киберпанк-вестерн», и Genie 2 создаст соответствующую среду. Этот инновационный подход использует генеративный искусственный интеллект для расширения границ того, что можно создать в виртуальных пространствах.

Модель работает по двухэтапному процессу. Сначала требуется эталонное изображение, которое также можно создать из текста. Получив визуальные данные, Genie 2 экстраполирует их и создает полноценный интерактивный мир. Демонстрации продемонстрировали плавное взаимодействие игроков с использованием традиционных элементов управления, таких как раскладка WASD, что обеспечивает интуитивно понятную навигацию.

Несмотря на эти достижения, Genie 2 сталкивается с заметными проблемами. В частности, согласованность модели снижается примерно через 20 секунд, при этом самые длительные симуляции продолжаются до минуты. Это несоответствие может быть связано с его способностью создавать «контрфактические сведения», то есть ИИ учитывает различные потенциальные действия, предпринимаемые игроками, что усложняет поддержание связного повествования.

  Илон Маск написал в Твиттере Doge, и Dogecoin взлетел на 45 процентов

Genie 2 блистает своей способностью учитывать различные перспективы, такие как вид от первого лица или изометрический вид. Он также включает в себя такие элементы, как реалистичные эффекты воды и взаимодействие с окружающей средой, примером которых является демонстрация взаимодействия персонажа с воздушным шаром, демонстрирующая физику, гравитацию и другие динамики. Однако подробности, касающиеся разрешения рендеринга и количества полигонов, остаются нераскрытыми Google.

Возможности Genie 2 выходят за рамки игры, управляемой пользователем. Модель также может эффективно имитировать персонажей ИИ, которые взаимодействуют в сгенерированной среде. Google проиллюстрировал это, показав способность ИИ выполнять команды на основе текстовых подсказок в сгенерированном мире. Такие функции намекают на потенциал неигровых персонажей, управляемых искусственным интеллектом, которые смогут демонстрировать реалистичное поведение в будущих игровых приложениях.

В отношении данных обучения для Genie 2 возникают соображения безопасности и этики. Было высказано предположение, что структура обучения модели может включать видео игрового процесса, полученные с таких платформ, как YouTube, что вызывает опасения по поводу интеллектуальной собственности по поводу сходства с материалами, защищенными авторским правом. Эти проблемы могут привести к расследованию юридических последствий использования существующего контента генеративным ИИ.

  Cyberpunk 2077 снова откладывается

Хотя текущие реализации Genie 2 могут не обеспечивать полностью целостный игровой процесс из-за их временности, DeepMind рассматривает эту модель как ресурс для исследований и разработок, а не полноценные игровые продукты. Основное внимание уделяется прототипированию интерактивного опыта и оценке агентов ИИ в смоделированных средах.

Специфика публичного выпуска Genie 2, коммерческих приложений и необходимых технологических ресурсов остается неясной, поскольку Google медленно ориентируется в этих водах.


Рекомендуемые изображения и видео: Гугл ДипМайнд

Сообщение DeepMind от Google представляет Genie 2 для игровых 3D-миров впервые появилось на TechBriefly.

Source: DeepMind от Google представляет Genie 2 для 3D-игровых миров