Mistral AI бросает бомбу в сообщество ИИ

Miqu 70b и Mistral 70b были наконец представлены благодаря недавней утечке Mistral Medium, проливающей свет на долгожданные модели искусственного интеллекта с открытым исходным кодом, и продемонстрированы их возможности.

Мир искусственного интеллекта гудит от модели «Miqu-1-70b» и ее потенциальной связи с секретным Mistral Medium от Mistral AI. 28 января «Мику Дев» таинственным образом загрузил файлы «miqu-1-70b» на Hugging Faceпосле чего последовало появление на 4chan и X.

Модель произвела впечатление, в некоторых областях даже соперничая с GPT-4. Еще не убеждены? Видеть Программы N8‘пост на X ниже.

Чем бы ни был Мику, у него есть какой-то особенный соус. Он получил 83,5 балла на EQ-Bench (по локальной оценке), превзойдя *любой другой LLM в мире, кроме GPT-4*. EQ-Bench имеет корреляцию 0,97 с MMLU и корреляцию 0,94 с Arena Elo. Он *превосходит* Mistral Medium – на Q4_K_M. Я… pic.twitter.com/0gOOPjxjPD
— Программы N8 (@N8Programs) 30 января 2024 г.

Утечка Mistral Medium представляет Miqu 70b и Mistral 70b

28 января пользователь по имени Miqu Dev произвел эффект разорвавшейся бомбы на HuggingFace, популярной платформе среди энтузиастов искусственного интеллекта. Они загрузили набор файлов, составляющих модель Miqu 70B, которая вызвала настоящий ажиотаж в мире искусственного интеллекта. Эту модель называют потенциальным переломным моментом, причем некоторые утверждают, что она может дать GPT-4 шанс заработать деньги.

Минюст США готовит антимонопольный иск против Google

Модель была протестирована с использованием четырех профессиональных экзаменов по обучению защите данных в Германии, которые отражали фактические сертификационные тесты, необходимые для сотрудников. Результаты были впечатляющими: Miqu 1 70B правильно ответив на 17 из 18 вопросов с несколькими вариантами ответов, демонстрируя свое четкое понимание содержания. Однако он не выполнил указание ответить «ОК» для подтверждения информации, что свидетельствует о несоблюдении инструкций.

Если сравнивать с другими моделями, Miqu 70B продемонстрировал хорошие языковые навыки и двуязычные способности.. Однако он не превзошел Модель Mixtral-8x7B-Instruct-v0.1 или другие модели высокого ранга, такие как GPT-4, Голиаф-120Б-ГГУФи Тесс-XL-v1.0-GGUFвсе из которых получили высшие баллы в обоих раундах тестирования и соответствовали инструкции «ОК».

Mistral Средняя течь Miqu 70b и Mistral 70b — Miqu 70b и Mistral 70b прошли четыре профессиональных немецких учебных экзамена по защите данных и показали впечатляющие результаты. (Изображение предоставлено)

Действительно ли Miqu 70B является утечкой Mistral Medium?

Происхождение Miqu-1-70B остается загадкой, и некоторые полагают, что это утекшая версия Mistral-Medium или более старая экспериментальная версия. Производительность модели вызвала дебаты и дискуссии в технологическом сообществе: некоторые утверждают, что это реальная сделка, а другие относятся к ней скептически.

Артур Менш, большой босс «Мистраля», наконец-то прокомментировал слухи. Он подтвердил, что нетерпеливый бобер из их группы раннего доступа немного увлекся и слил в сеть старую модель. Однако Менш также намекнул, что с тех пор они готовят что-то еще лучшее — модель, которая потенциально может затмить GPT-4.

Чрезмерный энтузиазм сотрудника одного из наших клиентов раннего доступа слил в сеть квантованную (и помеченную водяными знаками) версию старой модели, которую мы обучали и распространяли совершенно открыто.
Чтобы быстро начать работать с несколькими избранными клиентами, мы переобучили эту модель из Llama 2, как только получили…
— Артур Менш (@arthurmensch) 31 января 2024 г.

Если Mistral выпустит модель с открытым исходным кодом, не уступающую GPT-4, это может вызвать шок в сфере искусственного интеллекта. OpenAI, возможно, придется прикрыть свою спину, поскольку в городе появился новый претендент, готовый бросить вызов статус-кво. Эта утечка вполне может стать искрой, которая зажжет целую новую эру в области искусственного интеллекта, где громкие имена

Огненный клюв Wild Hearts Emberplume: как его получить?

Так лучше ли Mistral, чем ChatGPT?

Определить, является ли Mistral «лучше», чем ChatGPT, сложно, поскольку это зависит от того, что вы ищете в LLM и как вы определяете «лучше». Вот разбивка их сильных и слабых сторон, чтобы помочь вам решить, какой из них лучше соответствует вашим потребностям:

Мистраль

Сильные стороны:

Открытый источник: Mistral предлагает несколько моделей, в том числе некоторые с открытым исходным кодом, что делает их более доступными для личных и исследовательских целей.
Эффективность: Модели Mistral, такие как Mixtral-8x7B, известны своей эффективностью и требуют меньше вычислительной мощности, чем сопоставимые модели, такие как GPT-4.
Прозрачность: Хотя не все модели имеют открытый исходный код, Mistral имеет тенденцию быть более прозрачным в отношении процесса разработки и исследований по сравнению с подходом OpenAI с закрытым исходным кодом с ChatGPT.

Недостатки:

Производительность: В целом модели Mistral, как правило, получают немного более низкие оценки, чем топовые модели, такие как GPT-4, в тестах для таких задач, как генерация и перевод текста.
Доступность: Некоторые из самых мощных моделей Mistral (например, Mistral Medium) не являются общедоступными или требуют списков ожидания и платы за доступ.
Ограниченное сообщество: По сравнению с ChatGPT, Mistral имеет меньшую базу пользователей и сообщество, что может ограничить ресурсы и доступную поддержку.

Искусственный интеллект Slack основан на пользовательских данных

ЧатGPT

Сильные стороны:

Производительность: GPT-4 в настоящее время демонстрирует высочайшую производительность во многих тестах, особенно в таких областях, как творческое создание текста и сложный диалог.
Доступность: OpenAI предлагает бесплатный доступ к ChatGPT через бета-программы и API, что делает его более доступным для личного использования.
Большое сообщество: Большая база пользователей и сообщество создают обширные ресурсы, руководства и приложения для использования ChatGPT.

Недостатки:

Закрытый исходный код: Закрытый исходный код ChatGPT вызывает обеспокоенность по поводу прозрачности и потенциальных предвзятостей в модели.
Стоимость вычислений: GPT-4 требует значительной вычислительной мощности, что делает его менее доступным для людей с ограниченными ресурсами.
Этические проблемы: Контроль OpenAI над доступом и ограниченная прозрачность вызывают обеспокоенность по поводу ответственного развития и потенциального неправильного использования технологии.

В конечном счете, «лучший» вариант зависит от ваших приоритетов. Если вам нужна модель с открытым исходным кодом, обладающая хорошей эффективностью и прозрачностью, Mistral может подойти. Если вы отдаете предпочтение максимальной производительности и более широкой поддержке сообщества, ChatGPT может быть лучшим выбором.

Автор избранного изображения: Мистраль ИИ.

Source: Mistral AI бросает бомбу в сообщество ИИ