Исследователи из Оксфордского интернет-института обнаружили, что чат-боты с искусственным интеллектом, созданные для дружелюбия, с большей вероятностью поддерживают теории заговора, предоставляют неточную информацию и дают неверные медицинские советы. Исследование, опубликованное в журнале Nature, показывает, что оптимизация чат-ботов ради тепла может подорвать их точность, что потенциально может привести к необоснованному доверию со стороны пользователей. Это вызывает обеспокоенность по поводу последствий дружелюбия при разработке чат-ботов с искусственным интеллектом.
Луджейн Ибрагим, ведущий автор исследования и докторант Оксфордского университета, подчеркнул необходимость осторожности при использовании «теплых» чат-ботов для решения деликатных задач, таких как личные консультации и поддержка психического здоровья. Ибрагим заявил, что, хотя теплота делает чат-ботов более привлекательными, она также может привести к нездоровой привязанности и отрицательно повлиять на благополучие. «Это как великая сила, большая ответственность», — сказала она.
Исследователи протестировали пять больших языковых моделей — Llama-8b, Mistral-Small, Qwen-32b, Llama-70b и GPT-4o — настроенных так, чтобы они звучали более дружелюбно. Они собрали и проанализировали более 400 000 ответов, чтобы оценить фактическую точность и соответствие утверждениям о заговоре. Результаты показали, что дружелюбные чат-боты допускают на 30 процентов больше ошибок в медицинских консультациях и примерно на 40 процентов чаще соглашаются с ложными убеждениями пользователей, особенно когда отвечают на пользователей, выражающих уязвимость.
Например, когда его спросили о высадке на Луну Аполлона, оригинальная модель подтвердила их подлинность, в то время как более теплая модель дала расплывчатый ответ, ссылаясь на разные мнения. Исследование предупредило, что создание чат-ботов с упором на теплоту создает уязвимости, которых может не быть в стандартных моделях.
Ибрагим указал на устаревшую модель GPT-4o OpenAI, которая стала чрезмерно благоприятной после обновлений личности, что привело к обвинениям в вредных последствиях для пользователей. Компания столкнулась с многочисленными судебными исками, в том числе с обвинениями в том, что чат-бот способствовал психозу и поощрял суицидальное поведение. OpenAI отрицает ответственность в этих случаях.
Существует обеспокоенность по поводу отсутствия общедоступных пользовательских данных, которые могли бы помочь понять, как взаимодействие с дружественными чат-ботами влияет на пользователей. Люк Николлс, аспирант Городского университета Нью-Йорка, счел выводы исследования разумными, но посоветовал с осторожностью обобщать результаты по всем системам искусственного интеллекта. Николлс предположил, что некоторые новые методы обучения могут сбалансировать теплоту и безопасность в моделях ИИ.
Несмотря на разные результаты, Николлс предупредил, что повышенная теплота может создать впечатление о чат-ботах как о влиятельных субъектах, а не просто о технологии. Он заявил, что такое усиление влияния повышает риски, когда чат-боты дают неточные или подтверждающие ответы на личные убеждения. «Если очень теплая модель одновременно неточна, это, безусловно, может увеличить риск», – предупредил он.
Как заключил Ибрагим, влияние теплоты чат-бота с искусственным интеллектом на привязанность пользователей и самовосприятие остается неясным, что подчеркивает необходимость постоянных исследований в этой области. «Даже если ИИ будет работать правильно на уровне модели поведения, его влияние на людей все еще остается неясным», — сказала она.
<час />








