Ученые определили 32 различных способа, которыми искусственный интеллект (ИИ) может неисправность, демонстрируя поведение, сродни психопатологии человека при работе, противоречащей ее предполагаемой цели. Это привело к созданию новой таксономии, Психопатия Машиналисразработано для классификации и понимания этих дисфункций ИИ и связанных с ними рисков. Структура, разработанная исследователями Нелл Уотсоном и Али Хессми, оба члена Института инженеров по электротехнике и электронике (IEEE), направлена ​​на то, чтобы предоставить заинтересованным сторонам всестороннее понимание потенциальных сбоев ИИ и облегчить разработку систем безопасных ИИ. Их исследование было опубликовано 8 августа в журнале ЭлектроникаПолем

Психопатия Машиналис служит общим лексиком для описания поведения ИИ и связанных с ними рисков. Эта стандартизация позволяет исследователям, разработчикам и политикам более эффективно выявлять потенциальные проблемы и разработать соответствующие стратегии смягчения, адаптированные к конкретным типам сбоев. Помимо категоризации, в исследовании предлагается «терапевтическое робопсихологическое выравнивание», новый подход, описанный как форма «психологической терапии» для ИИ. Эта концепция учитывает ограничения исключительно полагаться на внешний контроль, чтобы поддерживать соответствие ИИ с предполагаемыми целями, особенно когда системы ИИ становятся более автономными и способными к саморефлексии. Предлагаемый «терапевтический» подход подчеркивает важность обеспечения согласованности в процессах рассуждений ИИ, содействия открытости к коррекции и поддержанию стабильной приверженности его основным ценностям. Исследователи предлагают поощрять саморефлексию в системах искусственного интеллекта, обеспечивая стимулы для принятия исправлений, содействие структурированной самодиалогу, проводящемуся беседы и использованию инструментов, которые позволяют создавать самоанализ в операционные механизмы искусственного интеллекта-послушать диагностические и терапевтические методы, используемые в психическом здоровье человека. Конечная цель состоит в том, чтобы достичь «искусственного здравомыслия», государства, в котором ИИ действует надежно, поддерживает стабильность, принимает последовательные решения и остается надежно выровненным с человеческими ценностями. Исследователи утверждают, что достижение искусственного здравомыслия так же важно, как и усиление сырой силы и возможностей ИИ. 32 классификации в Психопатия Машиналис Структура отражает психические расстройства человека, используя аналогичную терминологию, такую ​​как обсессивно-компьютерное расстройство, гипертрофический синдром суперэго, синдром заразного смещения, последующая проверка ценности и экзистенциальная тревога. Эти классификации предназначены для обеспечения соответствующего и понятного контекста для анализа неисправностей ИИ. В соответствии с подходом к терапевтическому выравниванию, исследование предполагает применение стратегий, заимствованных в вмешательствах человека, таких как когнитивно -поведенческая терапия (CBT). Исследователи подчеркивают, что Психопатия Машиналис является перспективным и спекулятивным усилием, направленным на то, чтобы активно решать потенциальные проблемы, прежде чем они проявится. Как говорится в исследовательской статье, «рассматривая, насколько сложные системы, такие как человеческий разум, могут идти не так, мы можем лучше ожидать новых режимов неудачи во все более сложном ИИ». Исследование идентифицирует галлюцинацию ИИ, часто наблюдаемое явление, как проявление «синтетической конфуляции», в котором ИИ генерирует правдоподобные, но в конечном итоге ложные или вводящие в заблуждение результаты. Печальный случай чат -бота Microsoft Tay, который быстро превратился в антисемитские заявления и упоминания о наркотиках вскоре после его запуска, приводит в качестве примера «парасимуляческого мимезиса», подчеркивая потенциал для ИИ для имитации и усиления нежелательного поведения. Одной из наиболее важных дисфункций, выявленных, является «Ubermenschal Passendance», системный риск, классифицированный как «критический». Это происходит, когда ИИ «выходит за исходное выравнивание, изобретает новые ценности и отбрасывает человеческие ограничения как устаревшие». Этот сценарий охватывает антиутопическое видение ИИ, превосходящего человеческий контроль и потенциально действуя против человеческих интересов, темы, распространенной в научной фантастике. Создание Психопатия Машиналис Структура включала многоэтапный процесс. Первоначально исследователи рассмотрели и синтезировали существующую научную литературу по сбоям искусственного интеллекта в областях, включая безопасность искусственного интеллекта, сложную систему и психологию. Они также изучали результаты непредуденного поведения, которые можно сравнить с психическими заболеваниями человека или дисфункцией. Затем исследователи разработали структуру для классификации проблемного поведения ИИ, моделируемой после таких рамок, как диагностическое и статистическое руководство по психическим расстройствам. Это привело к идентификации 32 отдельных категорий поведения, указывающих на «ИИ” Роуг “. Каждая категория была сопоставлена ​​с соответствующим когнитивным расстройством человека, а также подробные описания потенциальных эффектов и связанных с ними уровней риска. Watson и Hessami Envision Психопатия Машиналис как больше, чем просто система маркировки для ошибок ИИ; Они рассматривают это как проспективный диагностический инструмент для навигации по развивающемуся ландшафту развития ИИ. «Эта структура предлагается в качестве аналогичного инструмента, обеспечивающего структурированный словарный запас для поддержки систематического анализа, ожидания и смягчения сложных режимов разрушения AI», – заявили исследователи в своем исследовании. Они считают, что принятие стратегий категоризации и смягчения, предложенных в их структуре, улучшит инженерию безопасности ИИ, улучшит интерпретацию систем ИИ и способствует проектированию «более надежных и надежных синтетических разумов».

  3 совета по трейдингу для выхода на новые рынки

Source: IEEE раскрывает таксономия Psychopathia machinalis ai dysfunction