CrowdStrike и Meta представили Cybersoceval, ориентир с открытым исходным кодом, предназначенный для оценки производительности моделей искусственного интеллекта в центрах безопасности (SOCS). Эта инициатива направлена на то, чтобы помочь предприятиям в навигации по расширяющемуся набору инструментов кибербезопасности на основе AI, что позволяет им выбрать решения, лучше всего соответствующие их конкретным требованиям. Ландшафт кибербезопасности проходит трансформацию, обусловленную искусственным интеллектом, который служит как мощной угрозой, так и жизненно важным механизмом защиты. Поскольку ИИ дает возможность киберпреступникам расширенной тактикой, такой как автоматизированное количество паролей, организованное, организации все чаще интегрируют ИИ в свои рамки безопасности, чтобы противостоять этими развивающимися опасностями. Эта динамика вызвала цифровую гонку вооружений, напоминающую биологическую конкуренцию в иммунной системе человека, где защитники должны постоянно адаптироваться к все более сложным патогенам. Cybersoceval рассматривает критический разрыв на рынке, предоставляя стандартизированные тесты для моделей крупных языков (LLMS). Набор оценивает модели о необходимой задачах кибербезопасности, включая реакцию инцидентов, понимание анализа угроз и тестирование вредоносных программ. Согласно пресс-релизу Crowdstrike, «без четких тестов, трудно понять, какие системы, варианты использования и стандарты производительности обеспечивают истинное преимущество искусственного интеллекта против реальных атак». Это отсутствие ясности имеет долгое сложное принятие решений для специалистов в области кибербезопасности, поскольку инструменты сильно различаются по возможностям и стоимости. Формализация оценок для реальных приложений, Cybersoceval предлагает организациям прозрачное представление о сильных и слабых сторонах каждой модели. Для разработчиков искусственного интеллекта структура обеспечивает более глубокое понимание моделей использования предприятий, что потенциально способствует созданию более индивидуальных и эффективных моделей. Это может ускорить инновации, гарантируя, что системы ИИ развиваются в тандеме с возникающими угрозами. Преимущества ИИ в кибербезопасности уже очевидны в практических развертываниях. Недавний опрос MasterCard и долготы Financial Times показал, что многочисленные фирмы по финансовым услугам сэкономили миллионы долларов, внедрив инструменты с использованием AI для борьбы с мошенничеством с поддержкой AI. Эти сбережения подчеркивают ощутимую отдачу от инвестиций, подчеркивая, как ИИ не только снижает риски, но и повышает эксплуатационную эффективность в секторах с высокими ставками. Участие Meta подчеркивает его приверженность принципам ИИ с открытым исходным кодом. В отличие от проприетарных моделей, таких как серия GPT Openai, альтернативы с открытым исходным кодом позволяют разработчикам бесплатный доступ к весам модели, а в некоторых случаях исходный код. Эта доступность способствует быстрым улучшениям, ориентированным на сообщество. Партнерство с Crowdstrike иллюстрирует стратегию Meta по расширению ресурсов с открытым исходным кодом в кибербезопасности, предоставляя передовые инструменты оценки доступными для всех. Винсент Гонгет, директор по продукту Genai в отделении Labs Superintelligence, подчеркнул более широкие последствия в своем заявлении: «С этими критериями и открытыми для обеспечения безопасности и сообщества ИИ для дальнейшего улучшения, мы можем более быстро работать в качестве отрасли, чтобы раскрыть потенциал ИИ в защите от продвинутых атак, включая угрозы AI». Замечания Gonguet подчеркивают совместный потенциал таких инициатив, позиционируя киберсоцевал как катализатор для общегосударственного прогресса. Запуск поступает в ключевое время, так как предприятия сталкиваются с растущим давлением от AI-аугментированных киберугрог, которые, по прогнозам, усилились в 2025 году. Эксперты рекомендуют проактивные меры, такие как надежные рамки тестирования, чтобы оставаться впереди. Cybersoceval’s Nature Decore-Democtize Democratices, предоставляя небольшие организации без обширных ресурсов для оценки и применения передовых инструментов. Практическая реализация проста. Benchmark Suite доступен для немедленной загрузки на GitHub, с полной деталями и документацией, доступными на выделенном веб -сайте проекта. Ранние последователи могут сразу же начать тестирование LLMS, внося отзывы, чтобы еще больше уточнить структуру.
Source: Crowdstrike и Meta открывают Cybersoceval Benchmark Suite





