OpenAI значительно сократил время, выделяемое для оценки новых моделей искусственного интеллекта от нескольких месяцев до всего лишь дня, что вызвало опасения среди персонала и сторонних тестеров по поводу тщательной оценки безопасности.
Восемь человек, либо сотрудники Openai, либо сторонние тестеры, сообщили, что им дали «всего дни» для завершения оценок по новым моделям, процесс, который, как они утверждают, обычно занимают «несколько месяцев». Оценки имеют решающее значение для повышения моделей рисков и других вредов, например, может ли пользователь джейлбрейк модель для предоставления инструкций по созданию биоапона. Для сравнения, источники отметили, что OpenAI дал им шесть месяцев для рассмотрения GPT-4 до его выпуска, а возможности были обнаружены только через два месяца.
Источники добавили, что тесты Openai не так тщательны, как раньше, и не имеют необходимого времени и ресурсов для правильного улавливания и снижения рисков. «У нас было более тщательное испытание на безопасность, когда [the technology] был менее важен,-сказал один человек, тестирующий O3, полная версия O3-Mini. Они описали сдвиг как «безрассудный» и «рецепт катастрофы». Срай связан с желанием Openai сохранить конкурентное преимущество, особенно в том, что модели открытого веса от конкурентов, таких как китайский Startup Startup DeepSeek, получают больше основания.
Ходят слухи, что Openai выпустит O3 на следующей неделе, что, по словам источников, подняли график до недели. Это изменение подчеркивает отсутствие государственного регулирования для моделей искусственного интеллекта, включая требования по раскрытию модельного вреда. Такие компании, как Openai, подписали добровольные соглашения с администрацией Байдена для проведения рутинных тестирования в Институте безопасности ИИ США, но эти соглашения упали под администрацией Трампа.
Во время открытого периода комментариев для предстоящего Плана действий администрации Трампа, Openai выступал за аналогичную договоренность, чтобы избежать навигации по законодательству штата в штате. За пределами США Закон ЕС потребует, чтобы компании рискуют проверить свои модели и документировать результаты. Йоханнес Хайдеке, глава отдела систем безопасности в Openai, заявил: «У нас хороший баланс того, как быстро мы движемся и насколько мы тщательны». Тем не менее, тестеры выразили тревогу, особенно с учетом других отверстий в процессе, включая оценку менее распространенных версий моделей, выпущенных для общественности, или ссылаться на возможности более ранней модели, а не тестирование самого нового.








