У Google есть запущен Gemini 2 — сложная модель искусственного интеллекта, которая расширяет возможности пользователей взаимодействовать с технологиями. Это объявление, сделанное во время пресс-конференции, подчеркивает возможности Gemini 2 в выполнении задач, разговорных способностях и мультимодальном понимании, что представляет собой значительный прогресс в технологии искусственного интеллекта.

Google запускает Gemini 2: новую эру для помощников с искусственным интеллектом

Демис Хассабис, генеральный директор Google DeepMind, отметил, что Gemini 2 функционирует как виртуальный помощник, способный «планировать и выполнять задачи на компьютерах пользователей и в Интернете». Цель модели — помочь пользователям беспрепятственно управлять различными видами деятельности, потенциально открывая путь к общему искусственному интеллекту (AGI), имитируя когнитивные функции, подобные человеческим. Генеральный директор Google Сундар Пичаи подчеркнул приверженность компании разработке «агентских моделей», которые смогут более эффективно понимать мир и действовать в нем, указав на значительные инвестиции, сделанные за последний год.

Gemini 2 включает улучшенные «мультимодальные» функции, которые позволяют ИИ более эффективно анализировать аудио и видео во время сложных разговоров. Демонстрируя эти возможности, Gemini 2 может по-новому взглянуть на работу персональных компьютеров, потенциально экономя время за счет автоматизированных задач, таких как бронирование рейсов и управление документами. Однако остаются проблемы, связанные со способностью технологии обрабатывать открытые команды без ошибок, что может привести к дорогостоящим ошибкам.

Специализированные агенты искусственного интеллекта для кодирования и обработки данных также входят в набор инструментов Gemini 2, позволяя пользователям решать сложные задачи программирования, которые выходят за рамки возможностей более ранних моделей. В отличие от преобладающих инструментов искусственного интеллекта, которые ориентированы на базовое завершение кода, эти агенты могут выполнять комплексные задачи, такие как проверка кода в репозиториях и облегчение анализа данных.

  Лучшие альтернативы приложения удаленного рабочего стола, которые вы можете использовать в 2025 году
Google Gemini 2.0 уже здесь: мультимодальный и мощный
Google Gemini 2.0 уже здесь: мультимодальный и мощный

Project Mariner: новый подход к веб-навигации

Чтобы продемонстрировать возможности Gemini 2, Google представил Project Mariner, экспериментальное расширение Chrome, которое помогает пользователям перемещаться по Интернету. В ходе недавней демонстрации ИИ-агенту было поручено спланировать прием пищи, поскольку он самостоятельно переходил на веб-сайт супермаркета, входил в систему и добавлял товары в корзину для покупок, даже предлагая замену, когда определенные товары были недоступны. Хассабис описал Mariner как исследовательский прототип, который переосмысливает взаимодействие пользователя с ИИ, ориентируясь на повседневные задачи.

Первоначально Gemini был запущен в декабре 2023 года в рамках стратегии Google по конкуренции с ChatGPT OpenAI, который получил признание за свою полезность в работе с искусственным интеллектом. С выпуском Gemini 2 Google теперь позиционирует свою модель так же функционально, как предложения OpenAI, стремясь улучшить качество поиска за счет функций, основанных на искусственном интеллекте.

Google также представила последнюю версию Project Astra, экспериментальной инициативы, которая позволяет Gemini 2 интерпретировать окружение пользователя с помощью камеры смартфона. Во время тестирования Gemini 2 продемонстрировал свое умение распознавать винные бутылки, предоставляя географическую информацию, цены и вкусовые характеристики, полученные из Интернета. Хассабис выразил желание, чтобы Astra превратилась в совершенную систему рекомендаций, способную связывать интересы в различных областях для улучшения пользовательского опыта.

  Следующая телевизионная коробка Apple может быть одновременно дешевле и более мощными

Акцент на памяти в Gemini 2 позволяет ИИ сохранять информацию о предпочтениях пользователей, а Google гарантирует пользователям, что они могут управлять своими данными, включая возможность удаления. Во время тестов с Astra ИИ продемонстрировал впечатляющую адаптивность, сохраняя контекст разговора и реагируя на прерывания.

Безопасность и надежность агентов ИИ

По мере расширения функциональности Gemini 2 Google подчеркивает важность обеспечения безопасности и надежности. Хотя агенты обещают, потенциальные риски связаны с тем, как пользователи могут взаимодействовать с системами и данными, которые они предоставляют. Project Mariner включает подсказки, требующие подтверждения пользователя перед выполнением конфиденциальных действий, тем самым защищая от несанкционированных транзакций.

Google активно решает проблемы безопасности, сотрудничая с внутренними и внешними экспертами для оценки рисков, связанных с использованием ИИ. Это включает в себя изучение мер по предотвращению неправильного использования платформы с помощью вредоносных подсказок или инструкций, тем самым защищая пользователей от потенциальных угроз, таких как мошенничество или фишинговые атаки.

  Дата выхода Android 15 сегодня, и Google только что подтвердил это

Выпуск Gemini 2 от Google знаменует собой поворотный момент в развитии искусственного интеллекта, поскольку компания продолжает отслеживать впечатления и отзывы пользователей. Путь к AGI постепенно разворачивается с каждым этапом разработки, подчеркивая текущие исследования, которые могут повлиять на будущие версии технологии. Поскольку расследования взаимодействия и ответов пользователей продолжаются, следующие шаги для Gemini 2 и связанных с ним проектов, похоже, находятся под пристальным вниманием.


Авторы изображений: Google

Сообщение Google Gemini 2.0 находится здесь: Мультимодальные и мощные впервые появились на TechBriefly.

Source: Google Gemini 2.0 уже здесь: мультимодальный и мощный