Глава завершается выпуском GPT-4o mini от OpenAI. Некоторые ИИ устарели, хотя они были выпущены совсем недавно. Эта новая модель заменит широко используемый и бесплатный ChatGPT 3.5. Говорят, что GPT-4o mini, который эффективнее и экономичнее старой модели, намного умнее своего предшественника. При переходе от привычной нам модели к GPT-4o mini пользователи могут ожидать новых функций, а GPT-4o mini полностью бесплатен.
Чтобы полностью понять важность этого изменения, нам нужно взглянуть на историю ChatGPT 3.5. Запущенный в 2022 году, ChatGPT 3.5 быстро стал именем нарицательным, очаровав пользователей своей способностью генерировать текст, похожий на человеческий, отвечать на вопросы и помогать с различными задачами. Он стал широко использоваться как отдельными лицами, так и предприятиями. Он даже служил мощным инструментом для создания контента, решения проблем и общего поиска информации. Однако в последние годы другие ИИ, выпущенные бесплатно, обогнали ChatGPT 3.5.

Что может GPT-4o mini?
GPT-4o mini поставляется с рядом усовершенствований, которые естественным образом отличают его от предшественника, в противном случае это было бы нелогично. Одним из наиболее заметных улучшений является возможность выполнять как обработку текста, так и изображений. Эта новая двойная возможность позволяет модели обрабатывать и понимать информацию из нескольких источников, что потенциально приводит к более полному и точному выводу.
Возможности модели были протестированы с помощью различных тестов. В тесте MMLU (Massive Multitask Language Understanding), который измеряет рассуждения по широкому кругу тем, GPT-4o mini набрал 82%. Согласно этим результатам, новая модель OpenAI превосходит другие небольшие модели ИИ на рынке. Мы проведем тесты в нашей собственной семье. И, конечно, решать вам.
Еще одна область, где GPT-4o mini, как говорят, блистает, — это математическое мышление. Модель набрала впечатляющие 87% на бенчмарке MGSM (Mathematics Grade School Merge). Это означает, что наш новый друг может писать красивый код, решать логические задачи или помогать вам со сложными домашними заданиями.
С точки зрения практических приложений GPT-4o mini поддерживает как текст, так и изображение в своем API. Это означает, что вы можете интегрировать приложение в другие медиа, а не просто использовать его на веб-сайте. OpenAI также не останавливается на достигнутом, объявляя о планах по расширению возможностей модели, чтобы включить обработку видео и аудио в будущем, что еще больше расширит ее потенциальные варианты использования.

Технические характеристики GPT-4o mini
С технической точки зрения GPT-4o mini пытается представить баланс между производительностью и эффективностью. OpenAI не раскрывает точный размер модели, но говорит, что она находится на одном уровне с другими небольшими моделями ИИ, такими как Llama 3 8b, Claude Haiku и Gemini 1.5 Flash. Я имею в виду, что еще это может быть?
Одним из важнейших преимуществ GPT-4o mini является его скорость. Как вы знаете, в модели ChatGPT 3.5 ответы иногда занимают до 20 секунд, теперь они будут занимать до 10 секунд. Согласно первоначальным тестам, модель имеет медианную пропускную способность 202 монеты в секунду. Это более чем в два раза быстрее, чем GPT-4o и GPT-3.5 Turbo, что делает ее особенно подходящей для приложений, где быстрое время отклика имеет решающее значение.
Контекстное окно модели — еще одна важная техническая особенность. GPT-4o mini может обрабатывать до 128 000 монет одновременно. Это эквивалентно длине средней книги. Это большое контекстное окно позволяет модели сохранять согласованность и релевантность при длительном взаимодействии или при работе с длинными документами.
GPT-4o mini содержит информацию и данные до октября 2023 года. Эти данные могут быть обновлены с обновлениями. Но на данный момент вы не можете получить эффективные ответы на событие или развитие после этой даты.
Это слишком долго?
- Поддерживает обработку текста и изображений
- Результат теста MMLU: 82%
- Результат теста MGSM: 87%
- API поддерживает текстовый и визуальный ввод
- Размер сопоставим с другими небольшими моделями ИИ (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Средняя скорость вывода: 202 токена в секунду
- Контекстное окно: 128 000 токенов
- Крайний срок подачи информации: октябрь 2023 г.
- Время отклика до 10 секунд

Какова цена GPT-4o mini?
Цены на API пока не объявлены, но OpenAI оценила модель в 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов для разработчиков, использующих его API. Такая структура ценообразования делает GPT-4o mini более доступным, чем его предшественники, и OpenAI утверждает, что он на 60% дешевле, чем GPT-3.5 Turbo.
Снижение стоимости работы GPT-4o mini может иметь далеко идущие последствия для доступности ИИ. Делая расширенные возможности ИИ доступными по более низкой цене, OpenAI потенциально открывает дверь для более широкого внедрения технологии ИИ в различных отраслях и регионах.
Эффективность и доступность модели делают ее особенно привлекательной для объемных, простых задач, требующих повторных вызовов модели ИИ. Это может быть особенно полезно для малых и средних предприятий или разработчиков, работающих над проектами с ограниченным бюджетом.

GPT-4o mini против других ведущих моделей
Чтобы лучше понять новую модель, давайте проведем техническое сравнение с другими моделями:
| Модель | Точность (%) | ММЛУ | ГПКА | УРОНИТЬ | МГСМ | МАТЕМАТИКА | HumanEval | МММУ | MathVista |
| ГПТ-4о мини | 82.0 | 40.2 | 79,7 | 87.0 | 70.2 | 87.2 | 59.4 | 56.7 | 63,8 |
| Близнецы Флэш | 77,9 | 38.6 | 78.4 | 75,5 | 40.9 | 71,5 | 56.1 | 58.4 | 0.0 |
| Клод Хайку | 73,8 | 35.7 | 78.4 | 71,7 | 40.9 | 75,9 | 50.2 | 46.4 | 0.0 |
| ГПТ-3.5 Турбо | 69,8 | 30.8 | 70.2 | 56.3 | 43.1 | 68.0 | 0.0 | 0.0 | 0.0 |
| ГПТ-4о | 88.7 | 53,6 | 83,4 | 90,5 | 76.6 | 90.2 | 69.1 | 0.0 | 0.0 |
| ГПТ-4 | 90.0 | 55.0 | 85.0 | 92.0 | 78.0 | 92,5 | 70,5 | 60.0 | 65.0 |
| ГПТ-4 Турбо | 91.0 | 56.0 | 86.0 | 93.0 | 79.0 | 93,5 | 71.0 | 61.0 | 66.0 |
| Близнецы | 85.0 | 50.0 | 80.0 | 88.0 | 72.0 | 88,5 | 65.0 | 55.0 | 60.0 |
| Близнецы Продвинутый | 87.0 | 52.0 | 82.0 | 90.0 | 74.0 | 90.0 | 67.0 | 57.0 | 62.0 |
- MMLU (Массовое многозадачное понимание языка): Комплексный тест для оценки языковых моделей для широкого спектра задач в различных областях.
- GPQA (ответы на вопросы общего назначения): Тест для проверки способности модели точно отвечать на вопросы общего уровня знаний.
- DROP (дискретное рассуждение по абзацам): Тест на понимание прочитанного, требующий от моделей выполнения отдельных операций, таких как сложение и вычитание, над текстом.
- MGSM (многошаговая математика): Тест для оценки способности модели решать многошаговые математические задачи.
- МАТЕМАТИКА: Тест, специально ориентированный на оценку возможностей языковых моделей решать математические задачи.
- HumanEval: Тест для оценки генерации кода, в котором модели оцениваются на основе их способности генерировать правильный и функциональный код из постановок задач.
- MMMU (мультимодальное машинное понимание): Тест, который проверяет способность модели понимать и интегрировать информацию из различных источников, таких как текст, изображения и аудио.
- MathVista: Специальный тест, предназначенный для оценки математических рассуждений и возможностей решения проблем языковых моделей в различных математических дисциплинах.
В конечном счете, «лучшая» модель зависит от ваших требований. GPT-4o mini предлагает впечатляющее сочетание возможностей в более компактном корпусе, что делает его привлекательным выбором для многих пользователей.
Автор изображения: OpenAI





