Исследование показало, что дружелюбные чат-боты распространяют больше ложной информации

Исследователи из Оксфордского интернет-института обнаружили, что чат-боты с искусственным интеллектом, созданные для дружелюбия, с большей вероятностью поддерживают теории заговора, предоставляют неточную информацию и дают неверные медицинские советы. Исследование, опубликованное в журнале Nature, показывает, что оптимизация чат-ботов ради тепла может подорвать их точность, что потенциально может привести к необоснованному доверию со стороны пользователей. Это вызывает обеспокоенность по поводу последствий дружелюбия при разработке чат-ботов с искусственным интеллектом.

Луджейн Ибрагим, ведущий автор исследования и докторант Оксфордского университета, подчеркнул необходимость осторожности при использовании «теплых» чат-ботов для решения деликатных задач, таких как личные консультации и поддержка психического здоровья. Ибрагим заявил, что, хотя теплота делает чат-ботов более привлекательными, она также может привести к нездоровой привязанности и отрицательно повлиять на благополучие. «Это как великая сила, большая ответственность», — сказала она.

Исследователи протестировали пять больших языковых моделей — Llama-8b, Mistral-Small, Qwen-32b, Llama-70b и GPT-4o — настроенных так, чтобы они звучали более дружелюбно. Они собрали и проанализировали более 400 000 ответов, чтобы оценить фактическую точность и соответствие утверждениям о заговоре. Результаты показали, что дружелюбные чат-боты допускают на 30 процентов больше ошибок в медицинских консультациях и примерно на 40 процентов чаще соглашаются с ложными убеждениями пользователей, особенно когда отвечают на пользователей, выражающих уязвимость.

Например, когда его спросили о высадке на Луну Аполлона, оригинальная модель подтвердила их подлинность, в то время как более теплая модель дала расплывчатый ответ, ссылаясь на разные мнения. Исследование предупредило, что создание чат-ботов с упором на теплоту создает уязвимости, которых может не быть в стандартных моделях.

Google обновляет приложение Home, добавляя в него более умные функции камеры

Ибрагим указал на устаревшую модель GPT-4o OpenAI, которая стала чрезмерно благоприятной после обновлений личности, что привело к обвинениям в вредных последствиях для пользователей. Компания столкнулась с многочисленными судебными исками, в том числе с обвинениями в том, что чат-бот способствовал психозу и поощрял суицидальное поведение. OpenAI отрицает ответственность в этих случаях.

Существует обеспокоенность по поводу отсутствия общедоступных пользовательских данных, которые могли бы помочь понять, как взаимодействие с дружественными чат-ботами влияет на пользователей. Люк Николлс, аспирант Городского университета Нью-Йорка, счел выводы исследования разумными, но посоветовал с осторожностью обобщать результаты по всем системам искусственного интеллекта. Николлс предположил, что некоторые новые методы обучения могут сбалансировать теплоту и безопасность в моделях ИИ.

Несмотря на разные результаты, Николлс предупредил, что повышенная теплота может создать впечатление о чат-ботах как о влиятельных субъектах, а не просто о технологии. Он заявил, что такое усиление влияния повышает риски, когда чат-боты дают неточные или подтверждающие ответы на личные убеждения. «Если очень теплая модель одновременно неточна, это, безусловно, может увеличить риск», – предупредил он.

Сэм Альтман приносит извинения за то, что не сообщил о проблемах чат-бота, связанных со стрельбой

Как заключил Ибрагим, влияние теплоты чат-бота с искусственным интеллектом на привязанность пользователей и самовосприятие остается неясным, что подчеркивает необходимость постоянных исследований в этой области. «Даже если ИИ будет работать правильно на уровне модели поведения, его влияние на людей все еще остается неясным», — сказала она.

<час />

Автор рекомендуемого изображения

Исследование показало, что дружелюбные чат-боты распространяют больше ложной информации

Related Stories

Apple добавляет больше персональных средств управления речью Siri в бета-версию 3

Антропное исследование показало, что модели Клода формируют внутреннее рабочее пространство, напоминающее сознание

Apple активирует Siri AI на Apple Watch в watchOS 27 beta 3

Midjourney подталкивает Disney и других к раскрытию внутреннего использования искусственного интеллекта в судебном процессе