Команда оптимизации производительности Anthropic, оценивающая кандидатов на вакансии с 2024 года, пересматривает По словам руководителя группы Тристана Хьюма, это техническое собеседование для противодействия мошенничеству с помощью искусственного интеллекта. Anthropic внедрила домашний тест для соискателей работы. Улучшение возможностей инструментов ИИ-кодирования потребовало частых пересмотров этого теста, предназначенного для оценки навыков кандидатов. Тристан Хьюм, руководитель группы, подробно описал эти проблемы в своем блоге в среду. Хьюм заявил: «Каждая новая модель Клода заставляла нас перепроектировать тест». Он отметил, что «при таком же сроке Клод Опус 4 превзошел большинство претендентов-людей». Впоследствии «Клод Опус 4.5 соответствовал даже тем», имея в виду сильнейших кандидатов-людей. Такое развитие событий представляло собой серьезную проблему при оценке кандидатов. Отсутствие личного контроля не позволило предотвратить использование ИИ во время теста. Хьюм объяснил: «Из-за ограничений домашнего теста у нас больше не было возможности отличить результаты наших лучших кандидатов от нашей наиболее эффективной модели». Распространение мошенничества с искусственным интеллектом, которое уже наблюдается в образовательных учреждениях по всему миру, теперь влияет на лаборатории искусственного интеллекта. Однако Anthropic обладает отличными ресурсами для решения этой конкретной проблемы. В конце концов Юм разработал новый тест. Эта пересмотренная оценка меньше фокусируется на оптимизации оборудования, что усложняет задачу для существующих инструментов искусственного интеллекта. В рамках своего поста он опубликовал оригинальный тест, предложив читателям предложить альтернативные решения. В сообщении говорилось: «Если вы сможете превзойти Opus 4.5, мы будем рады услышать ваше мнение».
Source: Anthropic меняет дизайн тестов при приеме на работу после Claude 4.5 "тузы" человеческое интервью




