OpenAI запустила GPT-5.5 Instant в качестве модели по умолчанию для бесплатных пользователей ChatGPT, заявив, что теперь она соответствует производительности своих передовых моделей мышления при запросах о состоянии здоровья, основанных на внутренних оценках. Информация о здоровье оказалась под пристальным вниманием, особенно после того, как расследование Guardian выявило неточности в обзорах Google AI, что побудило Google отозвать эти функции для некоторых вопросов, связанных со здоровьем.
OpenAI заявила, что ее обновления повышают точность медицинской информации. Этот сдвиг позволяет широкой аудитории получать доступ к медицинским ответам из ChatGPT без перенаправления на внешние источники, что может повлиять на издателей и SEO-специалистов в секторе здравоохранения.
Компания отметила достижения в тестах HealthBench и HealthBench Professional, отметив, что GPT-5.5 Instant превосходит своего предшественника GPT-5.3 Instant. OpenAI также сообщила о снижении на 71% количества ответов на вопросы здравоохранения, помеченных как потенциальные несоответствия действительности, за два месяца, ссылаясь на свои системы мониторинга трафика в реальном времени.
Отдельная оценка включала сравнение ответов, полученных с помощью GPT-5.5 Instant, с ответами, написанными врачами в 3500 репрезентативных беседах о здоровье. В ходе оценок группа врачей оценила ответы модели ИИ выше, чем ответы, написанные врачами-людьми, с точки зрения точности, коммуникативности и полноты.
OpenAI утверждает, что GPT-5.5 Instant демонстрирует меньше режимов сбоя, чем более старые версии и реакции человека, указывая на меньшее количество пропущенных красных флажков и меньшую вероятность того, что не удастся получить дополнительный контекст от пользователей. HealthBench был разработан с использованием данных сети врачей компании и использует критерии оценки, созданные врачами.
OpenAI работает с более чем 260 врачами из 60 стран, которые коллективно рассмотрели более 700 000 примеров ответов. Хотя эта цифра постоянно упоминается с момента запуска ChatGPT Health в январе, никаких результатов независимой проверки опубликовано не было.
По данным OpenAI, запросы о здоровье и самочувствии составляют значительную часть взаимодействий ChatGPT: более 230 миллионов пользователей еженедельно задают вопросы, связанные со здоровьем. Кроме того, дискуссии о здоровье подпадают под строгую политику, запрещающую рекламу во время разговоров о здоровье, психическом здоровье или политике.
Рыночный спрос на медицинскую информацию через бесплатный уровень ChatGPT может увеличить давление на издателей с нулевым кликом, поскольку ответы, сгенерированные ИИ, демонстрируют повышенное взаимодействие, которое, как сообщается, является самым высоким среди категорий, проанализированных в обзорах ИИ Google. Заявления OpenAI относительно точности ответов на вопросы здравоохранения в настоящее время не подтверждены третьей стороной, что вызывает обеспокоенность по поводу надежности ее оценок.
В объявлении не уточняется, как эти обновления могут повлиять на протоколы цитирования, предполагая, что ответственность за проверку ответов и устранение потерь трафика может переложиться на практикующих врачей.
<час />








