OpenAI прокладывает путь к реалистичным разговорам с чат-ботами с ChatGPT Advanced Voice Mode. Компания позволит нам общаться с ИИ как с человеком, а теперь и разговаривать с ним как с человеком. Давайте рассмотрим ChatGPT Advanced Voice Mode, который в настоящее время доступен только ограниченному числу участников Plus.
Эта передовая функция, которая произведет революцию в нашем взаимодействии с ИИ, вызывает дебаты, почти такие же интересные, как и сама технология. Эй, Джарвис, ты там?
Мы начинаем развертывать расширенный голосовой режим для небольшой группы пользователей ChatGPT Plus. Расширенный голосовой режим предлагает более естественные разговоры в реальном времени, позволяет вам в любой момент прерваться, а также чувствует и реагирует на ваши эмоции. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 июля 2024 г.
Расширенный голосовой режим ChatGPT: больше, чем просто разговор
Последний продукт OpenAI не является обычным голосовой помощник. Говорят, что ChatGPT Advanced Voice Mode имеет гиперреалистичные голосовые ответы, которые стирают грань между людьми и ИИ. В отличие от своего предшественника, который полагался на три отдельные модели для обработки голосовых вводов, GPT-4o (движок, лежащий в основе этой новой функции) способен выполнять мультимодальные задачи одновременно. Представьте себе машину, которая может обрабатывать преобразование голоса в текст, обработку подсказок и вывод текста в речь одновременно. Беглые разговоры, которые заставят вас забыть, что вы разговариваете с роботом, уже не за горами.
Но подождите, это еще не все! Этот чат-бокс на основе искусственного интеллекта утверждает, что способен определять эмоциональные интонации; он может определить, грустите вы или взволнованы. Он даже может присоединиться к вам в сеансе караоке — но не ждите, что он будет петь какие-либо защищенные авторским правом мелодии. Давайте сначала рассмотрим, как использовать расширенный голосовой режим ChatGPT.
Как использовать расширенный голосовой режим ChatGPT
Готовы дать вашим пальцам отдохнуть, а голосовым связкам потренироваться? Вот как начать общаться с последним творением OpenAI. Расширенный голосовой режим ChatGPT в настоящее время доступен для ограниченного числа Пользователи ChatGPT Plus (поэтому не каждый участник Plus имеет к нему доступ)но только если вы среди них:
- Обновите свое приложение: Прежде всего, убедитесь, что вы используете последнюю версию приложения ChatGPT. Для пользователей Android это версия 1.2024.206 или выше. Для пользователей iOS вам понадобится версия 1.2024.205 или выше, а ваше устройство должно работать под управлением iOS 16.4 или выше. На этой футуристической вечеринке не допускаются никакие старые технологии!
- Найди свой голос: После того, как вы все обновите, найдите значок голоса, скрывающийся в правом нижнем углу экрана. Нажмите на него, и вы готовы к работе.
- Выбери своего бойца: Вам будет предоставлен выбор между стандартным голосовым режимом и новым блестящим расширенным голосовым режимом. Выберите «Расширенный», чтобы ощутить всю мощь GPT-4o.
- Высказываться: Ваш микрофон должен быть включен по умолчанию, но если вы получаете молчаливое обращение, проверьте значок микрофона в левом нижнем углу экрана. Нажмите, чтобы переключить, если необходимо.
- Общайтесь в чате: Начните разговаривать со своим другом-ИИ так же естественно, как вы бы разговаривали с другом-человеком. Помните, он может понимать ваши эмоции, так что не стесняйтесь давать волю своей индивидуальности.
- Заверните: Когда вы закончите влиять на своего нового ИИ-спикера (или подвергнетесь его влиянию), нажмите на красный значок в правом нижнем углу, чтобы завершить разговор.
Совет профессионала: Для лучшего опыта, наденьте наушники. А пользователи iPhone, включите Изоляция голоса режим микрофона, чтобы избежать нежелательных помех. В конце концов, трое — это уже слишком, когда вы пытаетесь поговорить по душам со своим помощником-ИИ!
Помните, эта функция все еще находится на стадии альфа-тестирования, поэтому у нее могут быть некоторые странности. Но, эй, даже люди не являются идеальными собеседниками в 100% случаев, верно?
Скарлетт Йоханссон: голос противоречий
В то время как OpenAI хвасталась передовыми возможностями своей новой голосовой функции ChatGPT Advanced Voice Mode, путь к ее выпуску не был без ухабов. Помните потрясающую демонстрацию в мае? Оказывается, один из голосов, Sky, имеет странное сходство с голливудская звезда.
Скарлетт Йоханссон, также известная по своей роли помощника ИИ в фильме «Она», как сообщается, отклонила несколько запросов генерального директора OpenAI Сэма Альтмана на использование ее голоса. Йоханссон поспешила выступить в защиту того, что можно назвать «искусственным интеллектом», когда была выпущена демоверсия с голосом, подозрительно похожим на ее собственный. OpenAI отрицала использование ее голоса, но немедленно удалила спорный образец из своей программы.
Безопасность прежде всего, звездочки — потом
В ответ на споры OpenAI притормозила выпуск, потратив время на усиление мер безопасности. Компания утверждает, что протестировала GPT-4o с более чем 100 внешними членами команды Red Team, говорящими на 45 разных языках. Результат. Более безопасная система с четырьмя предустановленными голосами — Juniper, Breeze, Cove и Ember — была создана в сотрудничестве с платными актерами озвучивания.
Представитель OpenAI Линдси МакКаллум уверяет, что ChatGPT «не может имитировать голоса других людей, как отдельных лиц, так и общественных деятелей, и будет блокировать вывод, который отличается от одного из этих предустановленных голосов». Так что, если вы надеялись пообщаться с виртуальной Скарлетт Йоханссон, вам не повезло.
Поскольку OpenAI постепенно внедряет расширенный голосовой режим ChatGPT для все Плюс пользователи этой осеньюмир технологий затаил дыхание. Будет ли это разговорным ИИ, которого мы все ждали, или это откроет новую банку червей в продолжающихся дебатах об этике ИИ и проблемах авторских прав?
Источник изображения: X / OpenAI Редактировать: Фуркан Демиркая
Source: Расширенный голосовой режим ChatGPT: заставляет Скарлетт забыть голос