Помощник Gemini AI Gemini теперь поддерживает загрузки аудиофайлов, позволяя пользователям транскрибировать, суммировать и извлекать информацию ключей из записей. Эта новая функция превращается в 10 минут голосовых записок, встреч, лекций и интервью в документы, доступные для поиска. Возможность загрузки звука доступна как в Интернете, так и через мобильные приложения, доступные через стандартный интерфейс файлов-upload. Согласно вице -президенту Google Gemini, Джошу Вудворду, функция загрузки аудиофайла была наиболее запрошенной пользователями. Эта функциональность отличается от Gemini Live, которая фокусируется на голосовых командах в реальном времени, в то время как новая функция предназначена для обработки данных из загруженных аудиофайлов. Во время тестирования Близнецы точно расшифровали эскизы из комедийных альбомов и телефонных разговоров, с небольшими ошибками, связанными с распознаванием имен. ИИ также эффективно определил ключевые элементы и элементы, подходящие для создания списков дел. Добавление аудио-обработки согласуется с недавними улучшениями Близнецов, включая интеграцию приложений, визуальный интерфейс на основе карт и расширенные варианты персонализации. Эта функция позволяет пользователям конвертировать сохраненные аудио -журналы и записки в контент, доступный для поиска, оптимизируя процесс, который ранее требовал внешнего программного обеспечения для транскрипции. В то время как другие помощники искусственного интеллекта, такие как CHATGPT (с использованием Whisper), Claude’s Andpric’s, а также недоумения также предлагают возможности обработки звука, реализация Gemini предназначена для повседневных случаев использования. Пользователи могут использовать Gemini для упрощения языка, изолировать комментарии, специфичные для динамика, создавать вопросы и создавать учебные пособия из аудиоконтента. Тем не менее, 10-минутный аудиосистемы и ежедневные ограничения использования для пользователей бесплатных уровней могут ограничивать частоту использования. Google еще не выпустил формальные цены на высокодолувую аудио-обработку, так как в настоящее время он подпадает под регулярную квоту Близнецов. Пользователи, планирующие обработать обширный аудиоконтент, должны соответствующим образом управлять их использованием. По сути, новая аудио -функция Gemini предоставляет оптимизированный способ обработки и извлечения ценной информации из аудиофайлов, что делает его полезным инструментом для различных личных и профессиональных приложений.

  Как играть в кооперативную кампанию Halo Infinite: объяснение зимнего обновления

Source: Google Gemini теперь поддерживает загрузки аудиофайлов