OpenAI запустила возможности видео в реальном времени для ChatGPT, интегрировав функциональные возможности визуальных функций в расширенный голосовой режим. Это объявление было сделано во время прямой трансляции, состоявшейся 12 декабря 2024 года. Обновленная версия может распознавать объекты в реальном времени через камеру устройства пользователя, обрабатывать визуальную информацию посредством совместного использования экрана и участвовать в разговорах, подобных человеческим. Обновление, доступное подписчикам ChatGPT Plus, Team и Pro, выйдет на следующей неделе, при этом некоторые пользователи в ЕС столкнутся с потенциальными задержками.

Благодаря этому усовершенствованию ChatGPT может отвечать пользователям, интерпретируя то, что он видит, например, предлагая объяснения настроек устройства или предлагая решения математических задач. Чтобы использовать эти функции, пользователи могут нажать значок голоса в приложении ChatGPT и активировать совместное использование видео или экрана. Развертывание будет приоритетным для подписчиков Plus, а пользователи ChatGPT Enterprise и Edu получат доступ в январе 2025 года.

OpenAI демонстрирует расширенные функции в живой демонстрации

Во время недавней живой демонстрации президент OpenAI Грег Брокман наглядно подчеркнул привлекательные возможности расширенного голосового режима. Брокман задал Андерсону Куперу из CNN опрос по анатомии, демонстрируя, как ChatGPT может понимать и комментировать рисунки, сделанные Купером на доске. Взаимодействие продемонстрировало потенциал интерактивного обучения и обратной связи в режиме реального времени, хотя ChatGPT все же обнаружил некоторые ошибки, такие как просчет геометрической задачи, подчеркивая текущие проблемы, связанные с точностью модели.

Эта обновленная функция столкнулась с задержками в разработке, поскольку OpenAI ранее намекала на то, что окна запуска в конечном итоге будут продлены. Ожидалось, что расширенный голосовой режим, первоначально продемонстрированный в мае 2024 года, появится раньше. Недавнее объявление демонстрирует кульминацию усилий по доработке и доработке этой возможности, указывая на стратегическую направленность на улучшение пользовательского опыта и технологических возможностей чат-бота.

  Ford Driver Assist: Latitude AI в Argo AI out

В дополнение к новым визуальным функциям OpenAI также представила к праздничному сезону «Режим Санты», позволяющий пользователям взаимодействовать с ChatGPT в праздничном тоне. Чтобы получить доступ к этой функции, пользователи могут щелкнуть значок снежинки в приложении. Эта сезонная опция сбрасывает ограничения на использование для первоначального взаимодействия, предоставляя пользователям больше возможностей для использования праздничной функции.

Такие конкуренты, как Google и Meta, разрабатывают аналогичные возможности, например проект Google Project Astra, который недавно стал доступен избранным тестировщикам Android. Эти усилия отражают более широкую тенденцию, когда крупные технологические компании работают над интеграцией функций интерактивного видео в свои модели искусственного интеллекта, повышая вовлеченность пользователей и универсальность приложений.

OpenAI также сообщила о планах по внедрению других усовершенствований, таких как усиление своей исследовательской программы по точной настройке арматуры, предназначенной для оптимизации производительности модели в специализированных задачах. Эта программа предназначена для исследовательских институтов и предприятий и позволяет им настраивать модели OpenAI для сложных приложений.

  NVIDIA представляет Jetson Agx Thor Developer Kit для Edge AI

Предоставленное изображение предоставлено: ОпенАИ

Сообщение OpenAI запускает функции видео в реальном времени для ChatGPT впервые появилось на TechBriefly.

Source: OpenAI запускает функции видео в реальном времени для ChatGPT