Гонка за превосходство в области искусственного интеллекта (ИИ) между Gemini и ChatGPT разгорается, при этом технологические гиганты соперничают за разработку самых мощных и универсальных моделей ИИ.
После впечатляющего представления OpenAI GPT-4o компания Google вступила в гонку искусственного интеллекта, продемонстрировав собственный прототип чрезвычайно популярного чат-бота Gemini.
Видео от аккаунт Google X продемонстрировал телефон Pixel под управлением Gemini, анализирующий живые кадры, предположительно снятые во время подготовки к предстоящая конференция разработчиков Google I/O.
Демо демонстрирует разговорные способности Близнецов
В демонстрируемом видео с помощью голосовых подсказок пользователь запрашивает у ИИ информацию о действиях на экране. Ответ Близнецов, произнесенный естественным голосом, демонстрирует понимание визуального контекста. Он правильно определяет строительство сцены как подготовку к большому событию. Когда на экране появляется запрос о появлении надписи, Gemini распознает это как вывеску Google I/O и предлагает краткое описание события.
Подобно недавней демонстрации ChatGPT от OpenAI, видео Gemini от Google примечательно естественным потоком разговора. Взаимодействие с пользователем кажется почти человеческим, а ответы Близнецов отражают ритм дружеского диалога.
Еще один день, пока #GoogleIO! Мы чувствуем . Увидимся завтра, чтобы узнать последние новости об искусственном интеллекте, поиске и многом другом. pic.twitter.com/QiS1G8GBf9
— Гугл (@Google) 13 мая 2024 г.
Этот диалоговый подход существенно отличается от зачастую неестественного взаимодействия, которое наблюдалось в более ранних моделях ИИ. Возможность участвовать в двустороннем обмене, уточняя информацию и адаптируя ответы на основе запросов пользователей, открывает путь к более интуитивно понятному и удобному для пользователя опыту работы с искусственным интеллектом.
И похоже, что инновации снова рождаются в результате конкуренции: Gemini против ChatGPT.
Осведомленность о контексте — это золотая жила здесь
Хотя демо-версия была сосредоточена на беззаботном сценарии, потенциальные возможности применения Gemini выходят далеко за рамки развлекательных целей. Возможность анализировать визуальную информацию в режиме реального времени может изменить правила игры в различных областях.
Представьте себе врача, использующего Gemini во время консультации пациента, где ИИ может мгновенно анализировать медицинские изображения и предоставлять информацию или потенциальные диагнозы. В образовательной сфере студенты могут использовать Gemini для улучшения своего учебного процесса, заставляя ИИ анализировать объекты, эксперименты или исторические артефакты в режиме реального времени, способствуя более глубокому пониманию предмета.
Прототип все еще находится в стадии разработки, и его все возможности еще не полностью раскрыты. Тем не менее, демо дает многообещающий взгляд на будущее взаимодействия ИИ. Объединив обработку естественного языка с анализом видео в реальном времени, Gemini может изменить и улучшить то, как мы взаимодействуем с информацией и миром вокруг нас, точно так же, как GPT-4o от OpenAI.
Так когда же мы узнаем более подробную информацию? Начнется мероприятие Google I/O. сегодня вечером в 10:00 по тихоокеанскому времени / 13:00 по восточному времени так что следите за обновлениями и продолжайте читать нас, чтобы стать свидетелем будущего технологий.
Автор избранного изображения: Солен Фейисса/Unsplash
Source: Google Gemini готовится конкурировать с GPT-4o