Llama 3.1 405b от Meta AI — это хит, который сумел впечатлить многих пользователей. Новая модель — не мелочь, это большая рыба в постоянно растущем бассейне языковых моделей. Давайте взглянем на ИИ, который заставляет всех говорить и писать.

Llama 3.1 405b от Meta AI — это, как следует из названия, большая языковая модель с 405 миллиардами параметров. Она является частью серии Llama 3 от Meta, запущенной в апреле 2024 года. Ранние тесты показывают, что эта модель может превзойти нынешних лидеров в нескольких ключевых тестах ИИ.

Лошадь другой масти: характеристики Llama 3.1 405b от Meta AI

Meta AI, ранее известная как Facebook AI Research, является исследовательским подразделением искусственного интеллекта Meta Platforms. Они представили Llama (Large Language Model Meta AI) в 2023 году как альтернативу с открытым исходным кодом проприетарным языковым моделям. Llama быстро завоевала популярность в сообществе ИИ. Опираясь на этот успех, Meta выпустила Llama 2 в 2023 году, которая показала значительные улучшения.

Теперь, с Llama 3, Meta раздвинула границы еще дальше, достигнув кульминации в мощной модели Llama 3.1 405b, которую мы обсуждаем сегодня. Этот быстрый прогресс демонстрирует приверженность Meta продвижению технологии ИИ с открытым исходным кодом.

  Pinterest превышает 400 миллионов пользователей

В эту эпоху, когда искусственный интеллект окружает нас повсюду, компании не останавливаются. В эпоху, когда мы смотрим на старую игровую графику и задаемся вопросом, насколько ее можно улучшить, мы стали прощать новую графику, и то же самое касается искусственного интеллекта.

Meta AI не отстает в плане производительности. Эта модель имеет 405 миллиардов параметров, что делает ее тяжеловесным игроком на арене ИИ. Итак, что означает этот параметр 405b?

Сосед, говори никогда: Llama 3.1 405b от Meta AI против конкурентов

Мета ИИ Llama 3.1 405b показывает впечатляющие результаты в ранних тестах. Он превосходит GPT-4 в нескольких тестах, включая GSM8K, Hellaswag, Boolq и различные категории MMLU. Однако он отстает в таких областях, как HumanEval и MMLU социальные науки.

Производительность модели особенно высока в задачах по математике и кодированию. Например, в тесте GSM8K Llama 3.1 405b от Meta AI набрала 96,8, а ее аналог 70B — 94,8. В HumanEval модель 405B набрала 85,3 по сравнению с 79,3 для версии 70B.

  Следующие Apple Watch могут иметь камеру и вспышку

Эти цифры основаны на базовой модели. Настройка инструкций может потенциально улучшить эти результаты еще больше. Таким образом, мы можем сказать, что эти цифры представляют вычислительную мощность, чем больше число, тем лучше (но иногда), но иногда модели раздавливаются под своей нагрузкой.

Llama 3.1 405b от Meta AI лидирует в тестах производительности
Конечный пользователь может хотеть получить бесплатный доступ к хорошему продукту (Изображение предоставлено)

Hoof It в будущее: Llama 3.1 405b от Meta AI и ИИ с открытым исходным кодом

Тот факт, что модель Meta AI Llama 3.1 405b является AI с открытым исходным кодом и что впервые модель с открытым исходным кодом может превзойти лучшую модель LLM с закрытым исходным кодом, доступную в различных бенчмарках, может быть признаком грядущих событий, даже если они пока не полностью поняты. На данный момент мы можем создавать наши GPT в ChatGPT. Эта зависимость может быть разрушена в будущем.

Llama 3.1 405b от Meta AI — сильный новый игрок в области ИИ. Его высокие показатели в различных тестах и ​​открытый исходный код делают его образцом для наблюдения. Поскольку ИИ продолжает развиваться, Llama 3.1 405b от Meta AI может сыграть важную роль в формировании будущего языковых моделей и технологий ИИ.

  Стоимость iPhone 12 для Apple теперь известна

Источник изображения: Блог Meta AI

Source: Meta AI Llama 3.1 405b достигает бенчмарков