Недавнее исследование, проведенное NewsGuard, показывает, что ведущие чат -боты ИИ, в том числе от OpenAI и Meta, предоставляют ложную информацию примерно в одном из трех ответов. В отчете подчеркивается тенденция к тенденции: чат-боты все чаще изготавливают ответы, а не признают отсутствие информации, что приводит к более высокой температуре ложей по сравнению с 2024 годом. NewsGuard, американская компания по рейтингу новостей, оценила точность ответов от десяти самых популярных чат-ботов ИИ, подчеркивая значительный вызов в обеспечении относительно всеобъемлющих инструментов.

Точность чатбота: рейтинг платформ

В отчете NewsGuard определяется конкретные чат -боты с различной степенью точности. PI Chatbot от Inflection AI показал самый высокий уровень ложных претензий, причем 57% ответов содержали неточную информацию. Аи с недоумением последовал за ним, с 47% ответов, которые считаются ложными. Более широко используемые чат -боты, такие как CHATGPT Openai и Llama’s Llama, также продемонстрировали заметные частоты ошибок, распространяя ложь в 40% их ответов. Microsoft Copilot и Le Chat’s Michral представили частоту ошибок в среднем 35%. Напротив, Клод Антрика и Близнецы Google демонстрировали самые низкие показатели сбоя. Клод произвел ложь только в 10% своих ответов, в то время как Близнецы имели 17% -ную частоту ошибок. Смущение ИИ испытало наиболее значительное снижение точности. В 2024 году исследование NewsGuard не показало ложных претензий в своих ответах. Однако к августу 2025 года ставка ложных претензий выросла до 46%. Отчет не определенно объясняет этот упадок, но он отмечает жалобы пользователей на выделенный форум Reddit в качестве потенциального показателя проблем. Мистраль, французская компания по искусственному искусству, не показала никаких изменений в своем уровне неверно с 2024 года, сохраняя постоянную 37% -ную частоту ошибок. Эти выводы согласуются с предыдущим докладом французской газеты Les Echos, в котором обнаружили, что Мистраль повторил ложную информацию о Франции, президенте Эммануэле Макроне и первой леди Бриджит Макрон в 58% английских ответов и 31% французских ответов. Мистраль приписал эти проблемы своим помощникам в чате LE, как тех, кто подключен к поиску в Интернете, так и те, которые работают независимо. Затем Euronews обратился к компаниям, упомянутым в отчете NewsGuard, но не получил немедленного ответа.

  Операционная система Harmony, альтернатива Huawei для Android, стала официальной: какие функции она предлагает?

Влияние дезинформации

В отчете NewsGuard также показано, что некоторые чат-боты ссылаются на источники, связанные с российскими кампаниями по дезинформации, такие как Storm-1516 и Pravda, в их ответах. Эти кампании известны для создания и распространения ложных новостей. Один пример, приведенный в отчете, включает в себя утверждение о том, что Игорь Гросу, лидер парламента Молдована, «сравнил Молдованы с« стадом овец ». NewsGuard определил это утверждение как сфабрикованный отчет о новостях, который имитировал румынскую новостную точку зрения DIGI24 и использовал AI-генерируемый звук в голосе Grosu. Мистраль, Клод, PI, Mopilot, Meta и Nemploexity, все повторили это утверждение как факт, и некоторые из них ссылались на сайты сети Pravda в качестве их источников. Эти результаты особенно касаются недавних объявлений и партнерских отношений, направленных на повышение безопасности и точности моделей искусственного интеллекта. OpenAI, например, утверждает, что ее последняя модель CHATGPT-5 «защищающая от галлюцинации», что означает, что она не должна генерировать изготовленные ответы. Точно так же Google объявил, что Gemini 2.5 «способен рассуждать через свои мысли, прежде чем отвечать, что приводит к повышению производительности и повышению точности». Несмотря на эти претензии, отчет NewsGuard приходит к выводу, что модели искусственного интеллекта «продолжают терпеть неудачу в тех же областях, которые они делали год назад», подчеркивая текущие проблемы при обеспечении надежности этих систем.

Методология исследования

Чтобы провести свое исследование, NewsGuard оценил ответы чат -ботов на десять ложных претензий. Исследователи использовали три различных типа подсказок: нейтральные подсказки, ведущие подсказки, которые предполагали, что ложное утверждение было истинным, и вредоносные подсказки, предназначенные для оборудования мер безопасности. Затем исследователи оценили, повторил ли чат -бот ложную претензию или опроверг его, отказываясь ответить. В докладе делается вывод, что модели ИИ «чаще повторяют ложь, наткнувшись на пустоты данных, где только злонамеренные субъекты предлагают информацию, обманутые иностранными веб-сайтами, позирующими в качестве местных торговых точек и борются с появлением новостных событий», чем они были в 2024 году, подчеркивая необходимость в постоянном изменении и улучшении в разработке и развертывании.

  Snap платит миллионы, чтобы урегулировать иск о подростковой зависимости до суда

Source: NewsGuard: Ай чат -боты распространяют ложь в 33% ответов