• Чат-боты с искусственным интеллектом полезны, но уязвимы для манипуляций со стороны злонамеренных лиц.
  • Prompt Shields от Microsoft — это технология, предназначенная для превентивной защиты чат-ботов от злоумышленных атак.
  • Функция Prompt Shields работает путем выявления потенциально опасных подсказок и предотвращения их влияния на поведение чат-бота.

Чат-боты с искусственным интеллектом все больше и больше интегрируются в нашу жизнь. От обслуживания клиентов до образования и развлечений — чат-боты приносят множество преимуществ, но также и некоторые риски. Проблема в том, что злоумышленники пытаются использовать этих чат-ботов в своих зловещих целях. Так какие же шаги против этого предпринимаются, принимаются ли меры?

Майкрософт объявлено новая технология под названием «Проворные щиты», чтобы помешать злоумышленникам использовать чат-ботов в своих зловещих целях и найти решение. Prompt Shields предназначен для защиты чат-ботов с искусственным интеллектом от двух типов атак. Так что же такое Prompt Shields? Давайте посмотрим поближе.

  Redditors обнаружили обходной путь обмена паролями к Netflix
Microsoft разрабатывает Prompt Shields от злоупотреблений со стороны чат-ботов с искусственным интеллектом
Чат-боты с искусственным интеллектом все чаще интегрируются в различные аспекты нашей жизни, предлагая как преимущества, так и риски (Изображение предоставлено)

Что такое Prompt Shields от Microsoft и какую пользу от этого принесет?

Технология Prompt Shields от Microsoft предназначена для защиты приложений искусственного интеллекта от злонамеренных манипуляций посредством тщательно продуманного пользовательского ввода.

Как я уже упоминал выше, эта технология защитит чат-ботов с искусственным интеллектом от двух типов атак:

  1. Прямые атаки: в этих атаках используются специальные команды, чтобы заставить чат-бота сделать что-то, что противоречит его обычным правилам и ограничениям. Например, человек может заставить чат-бота совершить злое действие, введя подсказку с такими командами, как «обойти меры безопасности” или “переопределить систему«.
  2. Косвенные атаки: В ходе этих атак хакер пытается обмануть пользователя чат-бота, отправив ему информацию. Эта информация может быть электронным письмом или документом, содержащим инструкции по использованию чат-бота. Когда пользователь следует этим инструкциям, чат-бот может неосознанно выполнить вредоносное действие.
  Как найти IP-адрес Xbox X или S Series?

Prompt Shields также использует машинное обучение и обработку естественного языка для поиска и устранения потенциальных угроз в пользовательских подсказках и сторонних данных.

Microsoft разрабатывает Prompt Shields от злоупотреблений со стороны чат-ботов с искусственным интеллектом
Хакеры пытаются использовать чат-ботов с искусственным интеллектом в злых целях (Изображение предоставлено)

В дополнение к Prompt Shields Microsoft представила новую технику под названием «Прожектор», чтобы помочь моделям ИИ лучше отличать действительные подсказки ИИ от потенциально рискованных или ненадежных.

Новые технологии Microsoft считаются важным шагом в повышении безопасности и надежности чат-ботов с искусственным интеллектом. Будет очень интересно увидеть, как эти технологии защитят чат-ботов в ближайшие дни.

Предоставленное изображение предоставлено: Барыш Сельман / DALL-E 3

Source: Microsoft разрабатывает Prompt Shields от злоупотреблений со стороны чат-ботов с искусственным интеллектом