В известной настольной игре «Дипломатия» ИИ Мета Цицерона был способен работать на уровне, сравнимом с человеческим. Он использует модель, аналогичную GPT-3.

Во вторник Meta AI раскрыла создание Цицерона, который, как утверждается, является первым ИИ, работающим на человеческом уровне в стратегической настольной игре Diplomacy. Это примечательное достижение, учитывая, что игра требует сильных способностей к межличностным переговорам и что Цицерон должен иметь определенный уровень языковых способностей, чтобы победить.

Настольные игры долгое время служили эффективной мерой развития ИИ, еще до победы Deep Blue в 1997 году над Гарри Каспаровым в шахматах. Когда AlphaGo победила мастера го Ли Седоля в 2015 году, был преодолен еще один барьер. Обе эти игры придерживаются набора достаточно четких аналитических правил (однако правила го обычно модифицируются для компьютерного ИИ).

ИИ Meta Cicero близок к человеческому уровню в настольной игре Diplomacy.

Однако важный элемент игрового процесса в Diplomacy требует социальных навыков. Чтобы добиться успеха, игроки должны демонстрировать эмпатию, говорить естественно и развивать отношения, а это непростая задача для компьютерного игрока. В свете этого Мета задал вопрос: «Можем ли мы создать более эффективных и гибких агентов, которые могут использовать язык для переговоров, убеждения и работы с людьми для достижения стратегических целей, как это делают люди?»

  Spotify представляет новые переключатели для отключения всех функций видео в приложении
ИИ Meta Cicero достигает производительности человеческого уровня в настольной игре Diplomacy
ИИ Мета Цицерона в настольной игре Diplomacy показал себя очень близко к игрокам-людям.

Ответ, согласно Мете, да. ИИ Meta Cicero развил свои навыки, играя в онлайн-игру дипломатии на webdiplomacy.net. Со временем он набрал «более чем в два раза больше среднего балла» среди игроков-людей и в конечном итоге вошел в 10% лучших игроков в нескольких играх, доказав, что он освоил игру.

Meta AI Cicero был разработан с использованием методов стратегического мышления (аналогично AlphaGo) и обработки естественного языка (аналогично GPT-3). Цицерон делает прогнозы о поведении других игроков во время каждой игры, наблюдая за состоянием игрового поля и историей диалогов. Он создает стратегию, которую он приводит в действие, используя языковую модель, которая может производить диалог, который звучит по-человечески, что позволяет ему работать с другими участниками.

ИИ Meta Cicero достигает производительности человеческого уровня в настольной игре Diplomacy
ИИ Meta Cicero развил свои навыки, играя в онлайн-игру о дипломатии на webdiplomacy.net.

Суть личности Цицерона можно найти в его способностях к естественному языку, которые Мета называет «управляемой моделью диалога». Цицерон использует обширный корпус текста, извлеченного из Интернета, аналогично GPT-3.

«Чтобы построить управляемую модель диалога, мы начали с языковой модели, подобной BART, с 2,7 миллиардами параметров, предварительно обученной на тексте из Интернета и настроенной на более чем 40 000 человеческих игр на webDiplomacy.net». заявил Мета.

Финальная модель уловила нюансы сложной игры. Согласно Мете, Цицерон «может сделать вывод, например, что позже в игре ему потребуется поддержка одного конкретного игрока, — говорит Мета, — а затем разработать стратегию, чтобы завоевать благосклонность этого человека — и даже распознать риски и возможности». что этот игрок видит со своей конкретной точки зрения».

  Почему предприятия, желающие открыть новый офис в 2022 году, должны исследовать Флориду

Под заголовком «Игра на человеческом уровне в игре дипломатии путем объединения языковых моделей со стратегическими рассуждениями» в журнале было опубликовано исследование Meta Cicero AI. Наука.

Что касается более широких приложений, Meta утверждает, что ее исследование Cicero может «ослабить коммуникационные барьеры» между людьми и ИИ, например, поддерживая длительную дискуссию, чтобы научить кого-то новому навыку. Или это может быть движущей силой видеоигры, в которой NPC могут общаться как люди, улавливая намерения игрока и меняясь по ходу дела.

ИИ Meta Cicero достигает производительности человеческого уровня в настольной игре Diplomacy
Код Meta Cicero AI имеет открытый исходный код и доступен на GitHub.

В то же время эту технологию можно использовать для манипулирования людьми, выдавая себя за людей и обманывая их потенциально опасными способами, в зависимости от контекста. В том же духе Meta надеется, что другие исследователи смогут использовать его код «ответственным образом», и заявляет, что предприняла шаги для обнаружения и удаления «токсичных сообщений в этом новом домене», что, вероятно, относится к диалогу, который ИИ Meta Cicero узнал из Интернета. тексты, которые он проглотил —всегда риск для больших языковых моделей.

Компания предоставила подробный сайт чтобы объяснить, как работает Meta Cicero AI, а также имеет открытый код Цицерона на GitHub. онлайн Дипломатия фанатам — и, возможно, даже всем нам — стоит быть начеку.

  WhatsApp добавляет новую групповую безопасность и неизвестные предупреждения о контактах

Тем не менее, в зависимости от ситуации, эта технология может быть использована для обмана людей и манипулирования ими путем выдачи себя за другое лицо. Вероятно, имея в виду диалог, который Цицерон извлек из интернет-текстов, которые он проглотил — всегда риск для больших языковых моделей — Meta заявляет, что предприняла шаги для обнаружения и удаления «токсичных сообщений в этом новом домене» и надеется, что другие исследователи будут основываться на этом. свой код «ответственным образом».

В дополнение к размещению исходного кода Meta Cicero AI на Гитхабфирма поддерживает всеобъемлющий веб-сайт объясняя, как это работает. Любители онлайн-дипломатии должны быть начеку, как и все мы.

Как играть в вебдипломатию?

Быть первой страной, контролирующей половину центров снабжения в игре, — цель дипломатии. Вы можете сделать это, перемещая свои силы по доске и вступая в бой с другими игроками, чтобы захватить контроль над их центрами снабжения. В конце года для каждого центра снабжения, которым вы управляете, вы можете построить новое подразделение, которое вы можете использовать, чтобы захватить больше центров снабжения и продвигать свое дело к победе. Вы должны распустить отряд вместо того, чтобы передать центр снабжения другому игроку, оставив вам меньше отрядов, чтобы бороться за большее количество центров снабжения.

Source: ИИ Meta Cicero достигает производительности человеческого уровня в настольной игре Diplomacy