OpenAI сообщает, что количество ошибок работоспособности бесплатного ChatGPT сократилось на 71 процент

OpenAI запустила GPT-5.5 Instant в качестве модели по умолчанию для бесплатных пользователей ChatGPT, заявив, что теперь она соответствует производительности своих передовых моделей мышления при запросах о состоянии здоровья, основанных на внутренних оценках. Информация о здоровье оказалась под пристальным вниманием, особенно после того, как расследование Guardian выявило неточности в обзорах Google AI, что побудило Google отозвать эти функции для некоторых вопросов, связанных со здоровьем.

OpenAI заявила, что ее обновления повышают точность медицинской информации. Этот сдвиг позволяет широкой аудитории получать доступ к медицинским ответам из ChatGPT без перенаправления на внешние источники, что может повлиять на издателей и SEO-специалистов в секторе здравоохранения.

Компания отметила достижения в тестах HealthBench и HealthBench Professional, отметив, что GPT-5.5 Instant превосходит своего предшественника GPT-5.3 Instant. OpenAI также сообщила о снижении на 71% количества ответов на вопросы здравоохранения, помеченных как потенциальные несоответствия действительности, за два месяца, ссылаясь на свои системы мониторинга трафика в реальном времени.

Отдельная оценка включала сравнение ответов, полученных с помощью GPT-5.5 Instant, с ответами, написанными врачами в 3500 репрезентативных беседах о здоровье. В ходе оценок группа врачей оценила ответы модели ИИ выше, чем ответы, написанные врачами-людьми, с точки зрения точности, коммуникативности и полноты.

Instagram и Facebook покажут родителям, о чем подростки спрашивают ИИ

OpenAI утверждает, что GPT-5.5 Instant демонстрирует меньше режимов сбоя, чем более старые версии и реакции человека, указывая на меньшее количество пропущенных красных флажков и меньшую вероятность того, что не удастся получить дополнительный контекст от пользователей. HealthBench был разработан с использованием данных сети врачей компании и использует критерии оценки, созданные врачами.

OpenAI работает с более чем 260 врачами из 60 стран, которые коллективно рассмотрели более 700 000 примеров ответов. Хотя эта цифра постоянно упоминается с момента запуска ChatGPT Health в январе, никаких результатов независимой проверки опубликовано не было.

По данным OpenAI, запросы о здоровье и самочувствии составляют значительную часть взаимодействий ChatGPT: более 230 миллионов пользователей еженедельно задают вопросы, связанные со здоровьем. Кроме того, дискуссии о здоровье подпадают под строгую политику, запрещающую рекламу во время разговоров о здоровье, психическом здоровье или политике.

Google Translate добавляет функцию тренировки произношения с помощью искусственного интеллекта

Рыночный спрос на медицинскую информацию через бесплатный уровень ChatGPT может увеличить давление на издателей с нулевым кликом, поскольку ответы, сгенерированные ИИ, демонстрируют повышенное взаимодействие, которое, как сообщается, является самым высоким среди категорий, проанализированных в обзорах ИИ Google. Заявления OpenAI относительно точности ответов на вопросы здравоохранения в настоящее время не подтверждены третьей стороной, что вызывает обеспокоенность по поводу надежности ее оценок.

В объявлении не уточняется, как эти обновления могут повлиять на протоколы цитирования, предполагая, что ответственность за проверку ответов и устранение потерь трафика может переложиться на практикующих врачей.

<час />

Автор рекомендуемого изображения

OpenAI сообщает, что количество ошибок работоспособности бесплатного ChatGPT сократилось на 71 процент

Related Stories

Apple добавляет больше персональных средств управления речью Siri в бета-версию 3

Антропное исследование показало, что модели Клода формируют внутреннее рабочее пространство, напоминающее сознание

Apple активирует Siri AI на Apple Watch в watchOS 27 beta 3

Midjourney подталкивает Disney и других к раскрытию внутреннего использования искусственного интеллекта в судебном процессе