OpenAI значительно сократил время, выделяемое для тестирования безопасности своих моделей искусственного интеллекта, что вызвало опасения по поводу потенциальных рисков и вреда, связанных с быстрым высвобождением новых моделей.
Восемь человек, либо сотрудники Openai, либо сторонние тестеры, показали, что теперь у них есть «всего лишь дни», чтобы завершить оценки новых моделей, процесс, который ранее занимал «несколько месяцев». Это радикальное сокращение времени тестирования объясняется желанием Openai сохранить конкурентное преимущество, особенно в связи с конкуренцией со стороны моделей с открытым весом, разработанными такими компаниями, как китайский AI Startup Deepseek.
Оценки имеют решающее значение в определении модельных рисков и вреда, таких как потенциал для джейлбрейка модели для предоставления инструкций по созданию биоуапонов. Для сравнения, источники отметили, что OpenAI дал им шесть месяцев для рассмотрения GPT-4 до его выпуска, и они обнаружили только через два месяца. Сообщается, что текущий процесс тестирования для новой модели Openai, O3, не является таким тщательным и не имеет необходимого времени и ресурсов для правильного улавливания и снижения рисков.
Один человек, в настоящее время тестирующий полную версию O3, описал сдвиг как «безрассудный» и «рецепт катастрофы». Ходят слухи, что Openai выпустит O3 на следующей неделе, что, по словам источников, бросило сроки тестирования до недели. Йоханнес Хайдеке, глава отдела систем безопасности в Openai, заявил, что у компании «хороший баланс того, как быстро мы двигаемся и насколько мы тщательны». Тем не менее, тестеры и эксперты в полевой тревоге экспрессируют при сокращении времени тестирования и потенциальных рисках, связанных с ним.
Отсутствие государственного регулирования в области моделей искусственного интеллекта подчеркивается изменением срока тестирования OpenAI. Несмотря на подписание добровольных соглашений с администрацией Байдена для проведения рутинных тестирования в Институте безопасности ИИ США, записи этих соглашений упали в соответствии с администрацией Трампа. OpenAI выступал за аналогичную договоренность, чтобы избежать навигации по законодательству штата. В отличие от этого, Закон ЕС потребует от компаний, чтобы рисковать тестировать свои модели и документировать результаты.
Такие эксперты, как Shayne Longpre, исследователь искусственного интеллекта в MIT, разделяют опасения по поводу потенциальных рисков, связанных с быстрым выбросом моделей искусственного интеллекта. Longpre отмечает, что площадь поверхности для недостатков в системах ИИ становится все больше, поскольку системы ИИ получают больший доступ к потокам данных и программным инструментам. Он подчеркивает необходимость инвестирования в сторонних, независимых исследователей сторонних, таких как настители ошибок, более широкий доступ к красным командам и правовая защита для выводов тестеров для повышения безопасности ИИ.
Поскольку системы ИИ становятся более способными и используются новыми и часто неожиданными способами, необходимость тщательного тестирования и оценки становится все более важной. Longpre подчеркивает, что внутренние команды тестирования недостаточно и что более широкое сообщество пользователей, ученых, журналистов и хакеров белого цвета необходимо для покрытия площади обнаружения, опыта и разнообразных языков, которые сейчас обслуживают эти системы.
Source: Openai спешит тестирование ИИ, повышает проблемы безопасности








