Google улучшает Gemini Live с визуальными накладками, которые выделяют объекты в подаче вашей камеры, и новая аудио -модель для более выразительных разговоров. Особенность визуального наложения помогает вам идентифицировать элементы или получить советы, разместив прямоугольник с белым границей вокруг объектов в виде камеры. Новая нативная аудио -модель предназначена для более отзывчивых и выразительных разговоров.

В прошлом году Google Event, Google представила Gemini Live, функцию, предназначенную для более естественных, свободных от руки разговоров с его AI Chatbot. С момента своего дебюта Google представила многочисленные обновления в Live Gemini, в частности, возможность поделиться кормом и экраном вашей камеры.

Google объявил о значительном улучшении возможностей для совместного использования камер Gemini Live и новой аудио-модели, чтобы сделать взаимодействия еще более естественными.

Во время своей презентации в новой серии Google Pixel 10 Google подробно рассказал о нескольких улучшениях, приходящих в Gemini Live на Android. Во -первых, когда вы делитесь подачей камеры, Gemini Live сможет отображать визуальные наложения для выделения определенных объектов. Эти блики появляются как прямоугольник с бело-графиком вокруг объекта, в то время как остальная часть вида слегка вырублена, чтобы выделить его.

  Как разобрать стену в Dwarf Fortress?

Эта функция «визуального руководства» предназначена для того, чтобы помочь вам быстро найти и определить элементы в виде камеры. Например, вы можете использовать его, чтобы выделить правильную кнопку на машине, указать конкретную птицу в стаде или определить правильный инструмент для проекта. Вы также можете использовать его для совета, например, попросить Близнецов порекомендовать нужную пару обуви для случая.

Функция также может обрабатывать более сложные сценарии. На брифинге менеджер по продуктам Google поделился личным примером из недавней международной поездки. Он изо всех сил пытался выяснить, сможет ли он припарковаться в определенном месте, неспособный разобраться в знаках иностранного языка, дорожных маркировке и местных правилах. Вытащив свой телефон и открыв Близнецы в прямом эфире, он указал камеру на место происшествия и спросил, разрешена ли парковка. Gemini посмотрел на местные правила, перевел знаки, а затем выделил место на улице, где он мог бы бесплатно парковаться в течение следующих двух часов.

  Как удалить историю браузера?

Визуальное руководство в Gemini Live будет доступно из коробки в серии Google Pixel 10 и начнет развернуться на другие устройства Android на следующей неделе. Эта функция будет расширяться до устройств iOS в ближайшие недели. Подписка Google AI Pro или Ultra не потребуется.

Наряду с визуальными накладками Google обновляет Gemini Live с новой нативной аудио -моделью, разработанной для более отзывчивых и выразительных разговоров.

Во -первых, эта новая модель будет более подходящим образом реагировать на то, что вы говорите. Например, если вы болтаете по стрессовой теме, она ответит более спокойным, более «измеренным» голосом.

Google говорит, что вы также сможете контролировать, как с вами говорит новая аудио -модель. Если у вас возникли проблемы с тем, что говорит Близнеца, вы можете попросить его говорить медленнее. Или, если вы спешите, вы можете попросить его ускорить.

  Руководство по лучшему модулю приманки Pokemon GO Rainy в 2022 году

Наконец, вы даже можете заставить его рассказать вам драматическую историю с точки зрения исторической фигуры. «Попросите Близнецов рассказать вам о Римской империи с точки зрения самого Юлия Цезаря и получить богатый, привлекательный повествование с акцентами персонажа», – говорит Google в своем блоге.

Новая функция Visual Ollays от Gemini Live лучше подходит для Android XR -очков, но приятно иметь ее сейчас на мобильном телефоне, так как мы все еще немного от того, чтобы получить в свои руки эти очки.

Эта статья была обновлена ​​в 7:50 вечера по восточному времени, чтобы исправить раздел на естественной аудио -модели, а также добавить демо -активы из блога Google.

Source: Google Gemini Live добавляет визуальные наложения и новую аудио -модель