Openai есть запущен Новый агент AI общего назначения в Chatgpt, предназначенный для автоматизации широкого спектра компьютерных задач для пользователей. Этот расширенный инструмент, названный Agent Catgpt, интегрирует функциональные возможности из предыдущих агентских инструментов OpenAI, таких как «Оператор и глубокие исследования», позволяя ему ориентироваться в веб -сайтах, синтезировать информацию в отчеты, управлять календарями, генерировать презентации и выполнять код.

Агент CHATGPT разрабатывается в четверг для подписчиков Pro, Plus и командных планов Openai. Пользователи могут активировать эту функцию, выбрав «режим агента» из раскрывающегося меню Chatgpt. Этот запуск означает самые амбициозные усилия Openai по превращению CHATGPT из системы с ответом на вопрос в действующий агент по загрузке задач.

В отличие от более ранних агентов ИИ, которые часто боролись со сложными задачами, Openai утверждает, что агент CHATGPT значительно более способен. Он может получить доступ к разъемам CHATGPT, позволяя интеграции с такими приложениями, как Gmail и GitHub, что позволяет ему получить соответствующую информацию для подсказок. Агент также обладает доступом к терминалу и может использовать API для взаимодействия с различными приложениями.

  Сравнение Samsung Galaxy S23 и Google Pixel 7

OpenAI выделяет практические приложения для агента CHATGPT, такие как планирование и покупка ингредиентов для еды или анализ конкурентов для создания слайд -колоды. Эти задачи требуют, чтобы агент проанализировал веб -сайты, сформулировал планы действий и использовала инструменты, представляющие скачок в сложности по сравнению с предыдущими возможностями агента.

Основная модель, питающая агент CHATGPT, демонстрирует современную производительность по нескольким критериям. На «Последнем экзамене человечества» (Pass@1), строгому тесту, включающему тысячи вопросов по более чем сотням субъектов, модель достигла 41,6%. Это примерно вдвое превышает баллы моделей OPE O3 и O4-Mini. Для «FrontierMath», сложного математического эталона, агент CHATGPT набрал 27,4%, когда предоставляется такие инструменты, как терминал для выполнения кода, значительно превосходя предыдущий балл 6,3% из O4-Mini.

OpenAI подчеркивает соображения безопасности в разработке агента CHATGPT, признавая повышенные риски, связанные с его расширенными возможностями. В отчете о безопасности для агента CHATGPT OpenAI классифицировал модель как «высокую способность» в биологических и химических областях оружия. Эта классификация, определяемая в рамках готовности Openai, указывает на потенциал модели «усилить существующие пути до тяжелого вреда», даже если прямые доказательства еще не доступны. Следовательно, OpenAI внедрил новые гарантии в качестве меры предосторожности.

  Как управлять сторонними приложениями с доступом к вашей учетной записи Google?

Ключевые меры безопасности включают систему мониторинга в реальном времени. Классификатор анализирует каждую подсказку, введенную в агент CATGPT для обнаружения связанных с биологией запросов. В случае идентификации ответ агента проходит через второй монитор, чтобы определить, может ли содержание способствовать биологической угрозе.

Кроме того, OpenAI временно отключил функцию памяти CHATGPT для этого агента, чтобы предотвратить потенциальное неправильное использование, такое как конфиденциальная эксфильтрация данных посредством быстрого инъекционного атаки. В то время как функция памяти обычно позволяет CHATGPT ссылаться на прошлые разговоры, OpenAI посчитал ее риском для этого агента, хотя они могут пересмотреть свое включение в будущем.

Несмотря на впечатляющие возможности, изложенные OpenAI, истинное реальное представление агента CHATGPT еще неизвестно. Исторически, агентская технология продемонстрировала хрупкость при взаимодействии со сложными реальными сценариями. Тем не менее, OpenAI выражает уверенность в том, что его более способная модель может обеспечить давно спровоцированное видение агентов ИИ.

  Android Auto Update намекает на AR Glasses Navigation

Source: Chatgpt теперь делает вашу реальную работу