OpenAI запустила O3-Pro, новую модель искусственного интеллекта, которую компания описывает как «самый способный». Модель O3-Pro является расширенной версией модели рассуждений O3 O3, которая была представлена ранее в этом году.
Модели рассуждений, такие как O3 и O3-Pro, предназначены для последовательно обработки проблем, пошаговых, которые предназначены для повышения производительности в сложных областях, таких как физика, математика и программирование.
Начиная с во вторник, O3-Pro доступен пользователям Chatgpt Pro и Team Plans, где заменяет предыдущую модель O1-Pro. OpenAI заявил, что пользователи Enterprise и EDU получат доступ к O3-Pro на последующей неделе.
В дополнение к его доступности в Chatgpt, модель O3-Pro теперь живет на API разработчика OpenAI. Цены на API установлены в размере 20 долларов США за миллион токенов и 80 долларов США за миллион токенов. Openai уточняет, что один миллион входных токенов примерно эквивалентны 750 000 слов.
OpenAI подчеркнул улучшение эффективности модели, заявив, что в ChangeLog «в экспертных оценках рецензенты последовательно предпочитают O3-Pro, чем O3, в каждой тестируемой категории и особенно в ключевых областях, таких как наука, образование, программы, бизнес и письменная помощь». Компания также отметила, что рецензенты оценили O3-Pro выше за «ясность, полноценность, следование инструкции и точность».
O3-Pro интегрируется с различными инструментами, предоставляя такие возможности, как веб-просмотр, анализ файлов, понимание визуальных вводов, использование Python и персонализирующие ответы с помощью функций памяти. Тем не менее, OpenAI признал недостаток: O3-Pro-пробе, как правило, занимает больше времени по сравнению с O1-Pro.
Новая модель также имеет определенные ограничения после освобождения. Временные чаты с O3-Pro в настоящее время отключены в CHATGPT из-за постоянной технической проблемы. O3-Pro не поддерживает генерацию изображений и не интегрируется с Canvas, функцией рабочей области AI на основе AI OpenAI.
Несмотря на эти промежуточные ограничения, OpenAI представил результаты внутренних тестирования, которые указывают на высокую производительность на стандартных контрольных показателях ИИ. Согласно данным компании, O3-Pro работал лучше, чем Google Gemini 2.5 Pro на тестировании математических навыков AIME 2024. Кроме того, O3-Pro превзошел недавно выпущенный Anpropic Claude 4 Opus на GPQA Diamond, эталонные знания тестирования на уровне PhD в науке.
OpenAI указал, что по мере того, как O3-Pro имеет ту же модель основной модели, что и O3, всесторонние детали безопасности можно найти на системной карте O3.








