Генеральный директор Google DeepMind Demis Hassabis выявил планы по интеграции своих моделей ИИ Gemini с VEO-видео-моделями ИИ, чтобы улучшить понимание Гемини о физическом мире, как показано в недавнем интервью подкаста.

Согласно Hassabis, Gemini был разработан, чтобы быть мультимодальным с самого начала, с целью создания «универсального цифрового помощника», способной помогать пользователям в реальных сценариях. «Мы всегда строили Близнецы, нашу модель фундамента, с самого начала, – объяснил Хассабис, – и причина, по которой мы это сделали [is because] У нас есть видение этой идеи универсального цифрового помощника, помощника, который […] На самом деле помогает вам в реальном мире ».

Индустрия искусственного интеллекта является свидетелем сдвига в сторону «Omni» моделей, которые могут обрабатывать и генерировать несколько форм медиа, таких как аудио, изображения и текст. Последние модели Gemini от Google могут создавать аудио, изображения и текст, в то время как CHATGPT OpenAI может создавать изображения, включая Art Studio Ghibli в стиле. Amazon также объявил о планах запустить модель «Any-To-Any» в конце этого года, дополнительно иллюстрируя эту тенденцию.

Эти модели Omni требуют огромного количества обучающих данных, включая изображения, видео, аудио и текст. Hassabis указал, что видеоданные VEO в основном поставляются с YouTube, платформы, принадлежащей Google. «По сути, просмотрев видео на YouTube – много видео на YouTube – [Veo 2] Можно понять, вы знаете, физику мира », – заявил Хасабис. Google ранее сообщил TechCrunch, что его модели« могут быть »обучены« некоторым »контенту YouTube в соответствии с его соглашением с создателями YouTube.

  Астронавты сохранят свою «подарку» в скафандрах Prada

Стоит отметить, что Google расширила свои условия обслуживания в прошлом году, частично, чтобы получить доступ к большему количеству данных, включая контент YouTube, для обучения моделей ИИ. Этот шаг рассматривается как стратегические усилия по поддержке его возможностей ИИ путем использования своего обширного хранилища онлайн -данных.

Post Google, чтобы комбинировать модели Gemini и Veo AI, впервые появились на TechBriefly.

Source: Google, чтобы объединить модели Gemini и Veo AI