ChatGPT 3.5 заменяется на GPT-4o mini

Глава завершается выпуском GPT-4o mini от OpenAI. Некоторые ИИ устарели, хотя они были выпущены совсем недавно. Эта новая модель заменит широко используемый и бесплатный ChatGPT 3.5. Говорят, что GPT-4o mini, который эффективнее и экономичнее старой модели, намного умнее своего предшественника. При переходе от привычной нам модели к GPT-4o mini пользователи могут ожидать новых функций, а GPT-4o mini полностью бесплатен.

Чтобы полностью понять важность этого изменения, нам нужно взглянуть на историю ChatGPT 3.5. Запущенный в 2022 году, ChatGPT 3.5 быстро стал именем нарицательным, очаровав пользователей своей способностью генерировать текст, похожий на человеческий, отвечать на вопросы и помогать с различными задачами. Он стал широко использоваться как отдельными лицами, так и предприятиями. Он даже служил мощным инструментом для создания контента, решения проблем и общего поиска информации. Однако в последние годы другие ИИ, выпущенные бесплатно, обогнали ChatGPT 3.5.

ChatGPT 3.5 заменяется на GPT-4o mini — Возможности модели были протестированы с помощью различных тестов (Изображение предоставлено)

Что может GPT-4o mini?

GPT-4o mini поставляется с рядом усовершенствований, которые естественным образом отличают его от предшественника, в противном случае это было бы нелогично. Одним из наиболее заметных улучшений является возможность выполнять как обработку текста, так и изображений. Эта новая двойная возможность позволяет модели обрабатывать и понимать информацию из нескольких источников, что потенциально приводит к более полному и точному выводу.

Возможности модели были протестированы с помощью различных тестов. В тесте MMLU (Massive Multitask Language Understanding), который измеряет рассуждения по широкому кругу тем, GPT-4o mini набрал 82%. Согласно этим результатам, новая модель OpenAI превосходит другие небольшие модели ИИ на рынке. Мы проведем тесты в нашей собственной семье. И, конечно, решать вам.

Еще одна область, где GPT-4o mini, как говорят, блистает, — это математическое мышление. Модель набрала впечатляющие 87% на бенчмарке MGSM (Mathematics Grade School Merge). Это означает, что наш новый друг может писать красивый код, решать логические задачи или помогать вам со сложными домашними заданиями.

Первый твит NFT изо всех сил пытается привлечь участников торгов

С точки зрения практических приложений GPT-4o mini поддерживает как текст, так и изображение в своем API. Это означает, что вы можете интегрировать приложение в другие медиа, а не просто использовать его на веб-сайте. OpenAI также не останавливается на достигнутом, объявляя о планах по расширению возможностей модели, чтобы включить обработку видео и аудио в будущем, что еще больше расширит ее потенциальные варианты использования.

Технические характеристики GPT-4o mini

С технической точки зрения GPT-4o mini пытается представить баланс между производительностью и эффективностью. OpenAI не раскрывает точный размер модели, но говорит, что она находится на одном уровне с другими небольшими моделями ИИ, такими как Llama 3 8b, Claude Haiku и Gemini 1.5 Flash. Я имею в виду, что еще это может быть?

Одним из важнейших преимуществ GPT-4o mini является его скорость. Как вы знаете, в модели ChatGPT 3.5 ответы иногда занимают до 20 секунд, теперь они будут занимать до 10 секунд. Согласно первоначальным тестам, модель имеет медианную пропускную способность 202 монеты в секунду. Это более чем в два раза быстрее, чем GPT-4o и GPT-3.5 Turbo, что делает ее особенно подходящей для приложений, где быстрое время отклика имеет решающее значение.

Контекстное окно модели — еще одна важная техническая особенность. GPT-4o mini может обрабатывать до 128 000 монет одновременно. Это эквивалентно длине средней книги. Это большое контекстное окно позволяет модели сохранять согласованность и релевантность при длительном взаимодействии или при работе с длинными документами.

GPT-4o mini содержит информацию и данные до октября 2023 года. Эти данные могут быть обновлены с обновлениями. Но на данный момент вы не можете получить эффективные ответы на событие или развитие после этой даты.

Как работает алгоритм Netflix?

Это слишком долго?

Поддерживает обработку текста и изображений
Результат теста MMLU: 82%
Результат теста MGSM: 87%
API поддерживает текстовый и визуальный ввод
Размер сопоставим с другими небольшими моделями ИИ (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
Средняя скорость вывода: 202 токена в секунду
Контекстное окно: 128 000 токенов
Крайний срок подачи информации: октябрь 2023 г.
Время отклика до 10 секунд

Какова цена GPT-4o mini?

Цены на API пока не объявлены, но OpenAI оценила модель в 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов для разработчиков, использующих его API. Такая структура ценообразования делает GPT-4o mini более доступным, чем его предшественники, и OpenAI утверждает, что он на 60% дешевле, чем GPT-3.5 Turbo.

Снижение стоимости работы GPT-4o mini может иметь далеко идущие последствия для доступности ИИ. Делая расширенные возможности ИИ доступными по более низкой цене, OpenAI потенциально открывает дверь для более широкого внедрения технологии ИИ в различных отраслях и регионах.

Эффективность и доступность модели делают ее особенно привлекательной для объемных, простых задач, требующих повторных вызовов модели ИИ. Это может быть особенно полезно для малых и средних предприятий или разработчиков, работающих над проектами с ограниченным бюджетом.

GPT-4o mini против других ведущих моделей

Чтобы лучше понять новую модель, давайте проведем техническое сравнение с другими моделями:

Модель	Точность (%)	ММЛУ	ГПКА	УРОНИТЬ	МГСМ	МАТЕМАТИКА	HumanEval	МММУ	MathVista
ГПТ-4о мини	82.0	40.2	79,7	87.0	70.2	87.2	59.4	56.7	63,8
Близнецы Флэш	77,9	38.6	78.4	75,5	40.9	71,5	56.1	58.4	0.0
Клод Хайку	73,8	35.7	78.4	71,7	40.9	75,9	50.2	46.4	0.0
ГПТ-3.5 Турбо	69,8	30.8	70.2	56.3	43.1	68.0	0.0	0.0	0.0
ГПТ-4о	88.7	53,6	83,4	90,5	76.6	90.2	69.1	0.0	0.0
ГПТ-4	90.0	55.0	85.0	92.0	78.0	92,5	70,5	60.0	65.0
ГПТ-4 Турбо	91.0	56.0	86.0	93.0	79.0	93,5	71.0	61.0	66.0
Близнецы	85.0	50.0	80.0	88.0	72.0	88,5	65.0	55.0	60.0
Близнецы Продвинутый	87.0	52.0	82.0	90.0	74.0	90.0	67.0	57.0	62.0

MMLU (Массовое многозадачное понимание языка): Комплексный тест для оценки языковых моделей для широкого спектра задач в различных областях.
GPQA (ответы на вопросы общего назначения): Тест для проверки способности модели точно отвечать на вопросы общего уровня знаний.
DROP (дискретное рассуждение по абзацам): Тест на понимание прочитанного, требующий от моделей выполнения отдельных операций, таких как сложение и вычитание, над текстом.
MGSM (многошаговая математика): Тест для оценки способности модели решать многошаговые математические задачи.
МАТЕМАТИКА: Тест, специально ориентированный на оценку возможностей языковых моделей решать математические задачи.
HumanEval: Тест для оценки генерации кода, в котором модели оцениваются на основе их способности генерировать правильный и функциональный код из постановок задач.
MMMU (мультимодальное машинное понимание): Тест, который проверяет способность модели понимать и интегрировать информацию из различных источников, таких как текст, изображения и аудио.
MathVista: Специальный тест, предназначенный для оценки математических рассуждений и возможностей решения проблем языковых моделей в различных математических дисциплинах.

Как создать королевство в Bannerlord?

В конечном счете, «лучшая» модель зависит от ваших требований. GPT-4o mini предлагает впечатляющее сочетание возможностей в более компактном корпусе, что делает его привлекательным выбором для многих пользователей.

Автор изображения: OpenAI

Source: ChatGPT 3.5 заменяется на GPT-4o mini