Сегодняшний день знаменует собой важную веху в развитии искусственного интеллекта: началась альфа-фаза развертывания расширенного голосового режима ChatGPT.

Недавняя утечка информации X.com сообщается, что избранная группа пользователей ChatGPT Plus получит ранний доступ к этой долгожданной функции, которая позволит им вести беседы, похожие на человеческие, с любимым помощником на базе искусственного интеллекта.

Но хотя разговорный ИИ быстро развивается, вокруг него уже много шума — и не только по поводу новых функций.

Когда будет запущен расширенный голосовой режим ChatGPT?

Хотя сегодняшнее внедрение расширенного голосового режима ChatGPT знаменует собой первую возможность для избранной группы пользователей ChatGPT Plus опробовать эту функцию, не все получат немедленный доступ.

Согласно утечке, участие в этой альфа-фазе будет зависеть от ряда факторов — по сути, не каждый подписчик Plus пока может рассчитывать на то, что опробует эту новаторскую функцию.

В электронном письме от команды ChatGPT подтверждается, что расширенный режим является частью ограниченного альфа-тестирования, которое начнется сегодня, во вторник, 24 сентября 2024 г.. Хотя OpenAI обещала, что «все пользователи Plus получат доступ к концу осени», этот альфа-тест является первым ощутимым шагом к этой цели.

Несмотря на ограниченный характер развертывания, в сообществе назревает волнение. Многие видят в этом знак того, что OpenAI стремится выполнить свое обещание предоставить этот новый разговорный режим пользователям до конца года. А для тех, кто не получит доступ сразу, это верный показатель того, что полный публичный релиз не за горами.

  Microsoft представляет инструменты для поддержки агентной веб-инфраструктуры

Что такое расширенный голосовой режим ChatGPT?

Компания OpenAI впервые продемонстрировала расширенный голосовой режим в мае 2024 года, продемонстрировав следующий шаг в нашем взаимодействии с ИИ.

В отличие от предыдущих версий, этот новый режим обеспечивает динамичное взаимодействие с ChatGPT в режиме реального времени, похожее на человеческое, включая возможность прерывать или перенаправлять разговор на середине предложения, если он отклоняется от темы или становится слишком подробным.

Это особенно интересно для пользователей, которые хотят более естественного, плавного общения без необходимости ждать текстового ответа или бороться с длинными ответами. Теперь вы можете задавать сложные вопросы и ожидать сложных, подробных ответов от чат-бота в режиме реального времени!

Новая эра разговорного ИИ

Этот запуск приближает ChatGPT к будущему, в котором взаимодействие с ИИ будет таким же естественным, как и общение с другим человеком. Хотя OpenAI когда-то опережала конкурентов, впервые продемонстрировав Advanced Voice Mode, компания начала ощущать давление со стороны своих конкурентов. Google уже запустила Gemini Live, ИИ схожего масштаба, в то время как слухи о Siri 2.0 от Apple вызывают ажиотаж своими улучшенными возможностями ИИ.

  NVIDIA против Valeo: самый странный технологический иск 2023 года
Внедрение расширенного голосового режима ChatGPT
С внедрением расширенного голосового режима ChatGPT конкуренция между OpenAI и технологическими гигантами обострится (Изображение предоставлено)

Конкурентная среда для разговорного ИИ накаляется, но этот альфа-тест может стать тем толчком, который нужен OpenAI, чтобы вернуться на передовые позиции. Ожидается, что улучшенные возможности голосового режима сделают ChatGPT более удобным и доступным, особенно для тех, кто находится в пути, где ввод длинных запросов не всегда возможен.

Будем надеяться на более плавную езду.

Однако не все так гладко для OpenAI, поскольку приближается дата запуска расширенного голосового режима ChatGPT.

В мае OpenAI попала в скандал с участием актрисы Скарлетт Йоханссон, чей голос использовался для демонстрации функции. Йоханссон, известная своим культовым голосом, выступила против использования ее голоса без ее явного согласия, что вызвало споры об этичном ИИ и использовании образов знаменитостей в контенте, созданном с помощью ИИ. Хотя OpenAI утверждала, что это был общий голос, который по совпадению звучал похоже, негативная реакция подчеркнула сложность голосовых технологий, особенно когда речь идет об интеллектуальной собственности и личных правах.

Споры вокруг голоса Йоханссон выдвинули на передний план важные дискуссии о том, где следует провести черту в контенте, созданном ИИ, особенно когда речь идет о реальных людях. Поскольку OpenAI продолжает разрабатывать и внедрять Advanced Voice Mode, ему придется осторожно лавировать в этих правовых и этических водах, чтобы избежать дальнейших неудач.

  Как создать QR-код, чтобы поделиться паролем WiFi?

Развертывание ChatGPT Advanced Voice Mode знаменует собой поворотный момент в эволюции разговорного ИИ. Обеспечивая более естественное, плавное взаимодействие, эта функция расширяет границы возможностей ИИ. Поскольку OpenAI конкурирует с такими технологическими гигантами, как Google и Apple, давление оказывается на поставку отточенного, этичного и революционного продукта. Но будущее выглядит светлым для тех, кто ждет своего шанса поговорить с ChatGPT, и поскольку эта функция входит в альфа-фазу, полный релиз может быть уже не за горами.


Кредит на изображение: Эмре Читак/Идеограмма ИИ

Source: Внедрение расширенного голосового режима ChatGPT уже в пути!