Anthropic меняет дизайн тестов при приеме на работу после Claude 4.5 "тузы" человеческое интервью

Команда оптимизации производительности Anthropic, оценивающая кандидатов на вакансии с 2024 года, пересматривает По словам руководителя группы Тристана Хьюма, это техническое собеседование для противодействия мошенничеству с помощью искусственного интеллекта. Anthropic внедрила домашний тест для соискателей работы. Улучшение возможностей инструментов ИИ-кодирования потребовало частых пересмотров этого теста, предназначенного для оценки навыков кандидатов. Тристан Хьюм, руководитель группы, подробно описал эти проблемы в своем блоге в среду. Хьюм заявил: «Каждая новая модель Клода заставляла нас перепроектировать тест». Он отметил, что «при таком же сроке Клод Опус 4 превзошел большинство претендентов-людей». Впоследствии «Клод Опус 4.5 соответствовал даже тем», имея в виду сильнейших кандидатов-людей. Такое развитие событий представляло собой серьезную проблему при оценке кандидатов. Отсутствие личного контроля не позволило предотвратить использование ИИ во время теста. Хьюм объяснил: «Из-за ограничений домашнего теста у нас больше не было возможности отличить результаты наших лучших кандидатов от нашей наиболее эффективной модели». Распространение мошенничества с искусственным интеллектом, которое уже наблюдается в образовательных учреждениях по всему миру, теперь влияет на лаборатории искусственного интеллекта. Однако Anthropic обладает отличными ресурсами для решения этой конкретной проблемы. В конце концов Юм разработал новый тест. Эта пересмотренная оценка меньше фокусируется на оптимизации оборудования, что усложняет задачу для существующих инструментов искусственного интеллекта. В рамках своего поста он опубликовал оригинальный тест, предложив читателям предложить альтернативные решения. В сообщении говорилось: «Если вы сможете превзойти Opus 4.5, мы будем рады услышать ваше мнение».

Anthropic меняет дизайн тестов при приеме на работу после Claude 4.5 "тузы" человеческое интервью

Related Stories

Xiaomi 18 Pro дебютирует в сентябре с Snapdragon 8 Elite Gen 6

Meta патентует носимый искусственный интеллект для непрерывного отслеживания эмоций

Илон Маск заявил, что X будет сообщать пользователям об исправленных сообщениях

Утечка Galaxy Z Flip 8 показывает три варианта цвета