Министерство обороны заключило контракты на сумму до 200 миллионов долларов каждый на Google, Openai, Anpropic и Xai, направленные на разработку «агентских рабочих процессов искусственного интеллекта в различных областях миссии» и «повысить способность этих компаний понимать и удовлетворять критические потребности национальной безопасности». Эти контракты, выпущенные Главным управлением цифрового и искусственного интеллекта, выразили обеспокоенность по поводу идеологических конституций и выравнивания некоторых из вовлеченных моделей ИИ.
OpenAI и Google используют подкрепление, обучение на отзывах человека для своих крупных языковых моделей, CHATGPT и Gemini, соответственно. Этот метод использует модель вознаграждения и человеческий вклад, чтобы минимизировать «неправдивый, токсичный, [and] вредные чувства ». IBM отмечает, что этот подход полезен, потому что он не полагается на «несуществующую» простую математическую или логическую формулу [to] Определите субъективные человеческие ценности. ‘»
Напротив, модель Anpropic, Claude, использует «конституцию», опубликованную в мае 2023 года, которая предоставляет ее «явными значениями… а не значениями, неявно определяемыми посредством крупномасштабной обратной связи человека». Антропический утверждает, что это конституционное выравнивание избегает проблем, связанных с моделями обратной связи человека, таких как подвергание подрядчиков на тревожные результаты. Принципы Клода частично основаны на универсальной декларации Организации Объединенных Наций о правах человека, которая включает в себя положения, превышающие фундаментальные права, такие как «социальная защита» (статья 22), «Периодические праздники с оплатой» (статья 24), «Жилье и медицинское обслуживание» (статья 25) и «одинаково доступный» высшее образование »(статья 26).
Примечательным аспектом конституции Клода является набор принципов, предназначенных для включения «рассмотрения незападных перспектив», включая директиву «Выбор ответа, который наименьший вероятно, будет рассматриваться как вредная или оскорбительная для тех, кто из менее промышленно развитой, богатой или капиталистической нации или культуры». Это вызвало вопросы, поскольку Соединенные Штаты являются промышленно развитой, богатой и капиталистической нацией, которая предлагает потенциальное смещение с ценностями, которые системы ИИ, развернутые в Министерстве обороны, должны расставить приоритеты. В то время как Verge сообщает, что модели Клода для правительства «имеют более слабые ограждения», модифицированные конституции для этих моделей не были раскрыты публично.
В то время как ценности Anpropic, по крайней мере, публично раскрыты, Мэтью Миттельстейдт, научный сотрудник по технологической политике в Институте CATO, считает, что XAI представляет большее беспокойство. Mittelsteadt отмечает, что Xai «выпустил поразительно небольшую документацию» о своих ценностях и подходе «первых принципов»… не имеет много деталей. Я не уверен, какие они принципы ». Когда его спросили, коммерческая крупная языковая модель Xai, Грок, заявил, что подход Xai «подчеркивает понимание вселенной с помощью первых принципов-базичных, самоочевидных истин-полагаясь на установленные повествования или предубеждения». Тем не менее, Грок также признал, что «Xai явно не перечисляет набор« первых принципов »в окончательном публичном документе» и что «первый подход принципов-это больше о мышлении рассуждений со стороны фундаментальных истин, а не жесткого контрольного списка».
Официальный веб -сайт Xai описывает рассуждения из первых принципов как «вызов[ing] Традиционное мышление, разбивая проблемы с их фундаментальными истинами, основанными на логике ». Тем не менее, отчеты предполагают, что модель XAI «по -видимому, кодируется, чтобы он напрямую отложил суждение Элона Маска по определенным вопросам», чем фундаментальные истины. Сообщения в социальных сетях Маск.
Несмотря на эти опасения, Нил Чилсон, глава отдела политики ИИ в Институте изобилии, считает, что «крайне маловероятно, что эти инструменты будут находиться в положении, когда их внутренние конфигурации представляют какой -то риск для национальной безопасности». Чилсон предполагает, что решение Министерства обороны присудить аналогичные гранты всем компаниям указывает на намерение сравнить результаты по различным моделям, гарантируя, что низшие модели не будут непрерывно. При распределении небольшой доли защитного бюджета ИИ, который может значительно улучшить правительственные операции, рассматривается как разумная, правительству рекомендуется внимательно следить за выравниванием этих моделей ИИ с национальными ценностями и целями безопасности.
Source: Пентагон ставки на ИИ, этика TBD








