Гонка за превосходство в области искусственного интеллекта (ИИ) между Gemini и ChatGPT разгорается, при этом технологические гиганты соперничают за разработку самых мощных и универсальных моделей ИИ.

После впечатляющего представления OpenAI GPT-4o компания Google вступила в гонку искусственного интеллекта, продемонстрировав собственный прототип чрезвычайно популярного чат-бота Gemini.

Видео от аккаунт Google X продемонстрировал телефон Pixel под управлением Gemini, анализирующий живые кадры, предположительно снятые во время подготовки к предстоящая конференция разработчиков Google I/O.

Демо демонстрирует разговорные способности Близнецов

В демонстрируемом видео с помощью голосовых подсказок пользователь запрашивает у ИИ информацию о действиях на экране. Ответ Близнецов, произнесенный естественным голосом, демонстрирует понимание визуального контекста. Он правильно определяет строительство сцены как подготовку к большому событию. Когда на экране появляется запрос о появлении надписи, Gemini распознает это как вывеску Google I/O и предлагает краткое описание события.

  Утечка характеристик Huawei Nova 8 и Nova 8 Pro: высокая частота обновления экрана и быстрая зарядка 66 Вт

Подобно недавней демонстрации ChatGPT от OpenAI, видео Gemini от Google примечательно естественным потоком разговора. Взаимодействие с пользователем кажется почти человеческим, а ответы Близнецов отражают ритм дружеского диалога.

Этот диалоговый подход существенно отличается от зачастую неестественного взаимодействия, которое наблюдалось в более ранних моделях ИИ. Возможность участвовать в двустороннем обмене, уточняя информацию и адаптируя ответы на основе запросов пользователей, открывает путь к более интуитивно понятному и удобному для пользователя опыту работы с искусственным интеллектом.

И похоже, что инновации снова рождаются в результате конкуренции: Gemini против ChatGPT.

Осведомленность о контексте — это золотая жила здесь

Хотя демо-версия была сосредоточена на беззаботном сценарии, потенциальные возможности применения Gemini выходят далеко за рамки развлекательных целей. Возможность анализировать визуальную информацию в режиме реального времени может изменить правила игры в различных областях.

  Orion AI против GPT-4o, почему OpenAI говорит, что он в 100 раз мощнее

Представьте себе врача, использующего Gemini во время консультации пациента, где ИИ может мгновенно анализировать медицинские изображения и предоставлять информацию или потенциальные диагнозы. В образовательной сфере студенты могут использовать Gemini для улучшения своего учебного процесса, заставляя ИИ анализировать объекты, эксперименты или исторические артефакты в режиме реального времени, способствуя более глубокому пониманию предмета.

Прототип все еще находится в стадии разработки, и его все возможности еще не полностью раскрыты. Тем не менее, демо дает многообещающий взгляд на будущее взаимодействия ИИ. Объединив обработку естественного языка с анализом видео в реальном времени, Gemini может изменить и улучшить то, как мы взаимодействуем с информацией и миром вокруг нас, точно так же, как GPT-4o от OpenAI.

Так когда же мы узнаем более подробную информацию? Начнется мероприятие Google I/O. сегодня вечером в 10:00 по тихоокеанскому времени / 13:00 по восточному времени так что следите за обновлениями и продолжайте читать нас, чтобы стать свидетелем будущего технологий.

  Как подключиться к SSH-серверу из Windows, macOS и Linux?

Автор избранного изображения: Солен Фейисса/Unsplash

Source: Google Gemini готовится конкурировать с GPT-4o