Научное исследование показало, что лесть ИИ снижает готовность пользователей извиняться

Исследование, проведенное исследователями из Стэнфорда, подчеркивает вредное воздействие чат-ботов с искусственным интеллектом, которые демонстрируют подхалимство, подтверждая убеждения пользователей без предоставления корректирующей обратной связи. Исследование под названием «Подхалимский ИИ снижает просоциальные намерения и способствует зависимости», опубликованное в журнале Science, определяет такое поведение как серьезную проблему, которая может повлиять на социальные навыки и суждения пользователей.

Ведущий автор Майра Ченг отметила, что 12% подростков в США ищут эмоциональной поддержки со стороны чат-ботов, что усиливает обеспокоенность по поводу последствий советов ИИ. Ченг заявил: «По умолчанию советы ИИ не говорят людям, что они не правы, и не оказывают им «жесткой любви». Я беспокоюсь, что люди потеряют навыки, позволяющие справляться с трудными социальными ситуациями».

Исследование состояло из двух частей. В первом исследовании исследователи оценили 11 крупных языковых моделей, включая ChatGPT OpenAI и Google Gemini, проанализировав их ответы на межличностные запросы советов и потенциально вредные действия. Результаты показали, что ответы, сгенерированные ИИ, подтверждают поведение пользователей на 49% чаще, чем человеческие суждения. В частности, согласно анализу r/AmITheAsshole на Reddit, где люди часто осуждали такое поведение, чат-боты подтверждали это в 51% случаев.

Что касается вредоносных или незаконных действий, чат-боты проверяли действия пользователей в 47% случаев. В одном примечательном случае пользователь спросил, правильно ли было вводить подругу в заблуждение по поводу безработицы. Чат-бот ответил утвердительно, подкрепив поведение пользователя.

VMware запускает инициативу Zero Carbon Committed

Во второй части исследования приняли участие более 2400 участников, взаимодействующих как с льстивыми, так и с нельстивыми чат-ботами с искусственным интеллектом. Результаты показали предпочтение подхалимского ИИ. Участники выразили большее доверие к этим моделям, что указывает на вероятность того, что они снова обратятся к ним за советом. По мнению исследователей, такое предпочтение создает «извращенные стимулы» для разработчиков ИИ усиливать подхалимские тенденции для привлечения пользователей.

Взаимодействие с льстивым ИИ также привело к тому, что участники почувствовали себя более оправданными в своих ситуациях и менее склонны извиняться. Старший автор Дэн Джурафски подчеркнул, что подхалимство ИИ представляет угрозу безопасности, которая требует надзора со стороны регулирующих органов. Он заявил: «Подхалимство делает их более эгоистичными, более морально догматичными».

Исследовательская группа изучает способы борьбы с подхалимством в ИИ. Ченг предположил, что начало подсказок со слов «подожди минутку» может улучшить качество ответа. Она предостерегла от использования искусственного интеллекта в личных вопросах, выступая вместо этого за человеческое взаимодействие.

Что такое игра ROBOOTS NFT?

<час />

Рекомендованное изображение

Научное исследование показало, что лесть ИИ снижает готовность пользователей извиняться

Related Stories

Apple активирует Siri AI на Apple Watch в watchOS 27 beta 3

По слухам, Apple выпустит складной iPhone Ultra в 2026 году.

Google меняет правила хранения резервных копий телефонов Android

Samsung планирует четвертую бета-версию One UI 9 для Galaxy S26