Anthropic выпустила свою последнюю модель искусственного интеллекта, Claude Opus 4.7, которую можно охарактеризовать как «заметное улучшение» по сравнению с Opus 4.6, но «менее широко функциональную», чем неизданную Opus Mythos Preview. Новая модель усиливает существующие сильные стороны, уделяя особое внимание кодированию, проектированию и многоэтапным задачам.

Клод Опус 4.7 демонстрирует превосходные результаты в профессиональной информационной работе, утверждая, что он «более тщательный и последовательный» в сложных ситуациях. Сравнительные тесты модели демонстрируют ее возможности: результат агентного кодирования на SWE-bench Pro и SWE-bench Verified составил 64,3%, вернув себе первое место среди общедоступных моделей.

По сравнению с Opus 4.6, Opus 4.7 также демонстрирует улучшения в использовании агентного компьютера и рассуждениях на уровне выпускников. Тем не менее, он показывает небольшое снижение показателей уязвимости кибербезопасности, достигнув 73,1% по сравнению с 73,8% для предыдущей версии. Anthropic отметил, что это изменение может быть результатом новых мер безопасности, предназначенных для обнаружения и блокировки запросов кибербезопасности с высоким уровнем риска.

Запуск Claude Opus 4.7, похоже, продвигает предварительную версию Claude Mythos Preview, которая продемонстрировала превосходную производительность по основным тестам, но в настоящее время доступна только избранным организациям. Anthropic подчеркнул, что кибервозможности Opus 4.7 не соответствуют возможностям Mythos Preview.

  Все ответы LoLdle сегодня (19.2): Трясти или не трясти

«Мы заявили, что оставим выпуск Claude Mythos Preview ограниченным и сначала протестируем новые киберзащиты на менее способных моделях», — заявили в компании. «Opus 4.7 — первая такая модель: ее кибервозможности не так развиты, как у Mythos Preview».

Claude Opus 4.7 доступен сразу для всех продуктов Claude и через API компании, сохраняя ту же цену, что и предыдущие модели.

<час />

Автор рекомендуемого изображения