Пока Meta представляет свое новейшее творение, LLaMA 2 против GPT-4 в настоящее время занимает умы многочисленных энтузиастов ИИ. Тем не менее, ошеломляющее объявление Meta об открытом исходном коде этой внушительной языковой модели также стало новостью при неожиданном повороте событий.
Это решение мгновенно выдвинуло LLaMA 2 в царство титанов ИИ, подготовив почву для эпического противостояния со знаменитым GPT-4 OpenAI, электростанция ChatGPT и Microsoft Bing.
LLaMA 2 против GPT-4 в различных сравнениях
LLaMA 2-Chat, замечательное творение, обязано своим существованием тонкой настройке и обучению с подкреплением с помощью ценная человеческая обратная связь. Этот процесс включал сбор данных о предпочтениях и обучение моделей вознаграждения с использованием новой техники, известной как Призрачное внимание (GAtt). Кроме того, LLaMA 2-Chat выигрывает от обучения на выходных данных GPT-4, что является важным фактором в его разработке.
LLaMA 2 против GPT-4: оценки
Чтобы оценить эффективность модели, Мета провел исследование на людях, используя 4000 подсказок, используя “шанс на победу” метрика, аналогичная тесту Vicuna, чтобы сравнить его с моделями с открытым и закрытым исходным кодом, такими как ChatGPT и PaLM, в контексте одно- и многооборотных подсказок.
Впечатляющий 70B ЛЛаМА 2 модель работает наравне с GPT-3.5-0301 и превосходит другие модели, такие как Falcon, MPT и Vicuna. Модели LLaMA 2-Chat отличаются полезностью как для однократных, так и для многократных подсказок, превосходя альтернативы с открытым исходным кодом. С процент побед 36% и коэффициент связи 31,5% по сравнению с ChatGPT, LLaMA 2-Chat доказывает свою стойкость.
Кроме того, он превосходит модель MPT-7B-chat на 60% подсказок. Общий процент побед модели LLaMA 2-Chat 34B превышает 75% по сравнению с аналогичными моделями Vicuna-33B и Falcon 40B — впечатляющий подвиг. Кроме того, модель 70Б значительно превосходит модель чата PaLM-bison.
LLaMA 2 против GPT-4: Кодирование
Однако когда дело доходит до кодирования между LLaMA 2 и GPT-4, несмотря на его многочисленные достижения, У LLaMA-2 есть слабость, когда дело доходит до кодирования. Это не соответствует мастерству кодирования, демонстрируемому ГПТ-3,5 (48,1) и ГПТ-4 (67). В то время как тест MMLU демонстрирует сильные стороны LLaMA-2, HumanEval показывает, что его возможности кодирования несколько ниже по сравнению с моделями, специально разработанными для кодирования, такими как СтарКодер (33.6). Тем не менее, учитывая открытый вес LLaMA-2, весьма вероятно, что со временем он претерпит значительные улучшения.
LLaMA 2 против GPT-4: запись
Когда дело доходит до письма, LLaMA-2 и GPT-4 демонстрируют заметные различия. Их подходы к писать стихи, например, не может быть более отчетливым. ChatGPT использует преднамеренный выбор слов, сконцентрироваться на фонетика и а более сложная лексика, сродни искусному поэту с широким набором выражений. Напротив, LLaMA-2 выбирает более простой выбор рифмующихся слов, похоже на школьное стихотворение.
Я попросил и Ламу-2, и ГПТ-4 написать стихотворение об их эпическом состязании. Угадай, какой из них какой.
========= Стихотворение 1 =========
В великом гобелене переплетения технологий,
Где информация меняется, а идеи расходятся,
Две фигуры стоят, их истории переплетаются,
ОТС и Лама-2,…— Джим Фан (@DrJimFan) 18 июля 2023 г.
Несмотря на то, что обучение проходило в меньшем масштабе, LLaMA-2 набрала похвальные результаты, согласно отзывам нескольких пользователей, имевших доступ к бета-версии. подход Меты, первоначально с использованием общедоступных данных и позже дополнив его высококачественными данными, имеет доказанная эффективность в достижении лучших результатов с меньшим количеством примеров. Было замечено, что результаты модели сопоставимы с человеческими аннотациями, что свидетельствует о тщательном характере ее разработки.
LLaMA 2 против GPT-4: результаты с одинаковой подсказкой
Важно отметить, что сравнение этих двух моделей в целом может быть не совсем честным, учитывая, что у нас есть доступ только к демо-версии Llama 2. Однако использование одной и той же подсказки для GPT-4 и Llama 2 даст нам некоторые интересные идеи в их соответствующие возможности и стилистические тенденции.
Подсказка: “Напишите мне абзац из 100 слов о важности чат-ботов.”
- ГПТ-4:
Похоже, что ответ GPT-4, хотя и короче и лаконичнее, 93 слова, успешно обеспечивает точная информация.
- Лама 2 демо:
С другой стороны, Лама 2 склоняется к более комплексному ответу с 122 слова. Несмотря на то, что он немного более подробный, учитывая данное приглашение, он предлагает похвально подробная информация.
Предыстория LLaMA 2
Путешествие LLaMA началось в феврале, вызывает волнение в исследовательском сообществе ИИ. Утечка вскоре после анонса только добавила интриги. Теперь, с выпуском LLaMA 2 в качестве модели с открытым исходным кодом, ее потенциальная аудитория расширился в геометрической прогрессии. С более 100 000 запросов полученные для начальной модели LLaMA, влияние LLaMA 2 будет еще более глубоким.
В течение Мероприятие Microsoft InspireMeta не только продемонстрировала свою непоколебимую поддержку платформ Microsoft Azure и Windows, но и произвела эффект разорвавшейся бомбы. сделав LLaMA 2 свободным доступом как для коммерческих, так и для исследовательских целей. Этот шаг стал важной вехой, поскольку он открыл широкий спектр возможностей для предприятий, стартапов и исследователей, чтобы использовать потенциал этой новаторской языковой модели.
По сравнению со своим предшественником LLaMA 2 претерпела существенные улучшения. Тренировался на на 40 процентов больше данных, включая общедоступные онлайн-источники, LLaMA 2 продемонстрировала превосходную производительность в таких областях, как рассуждение, кодирование, проверка квалификации и проверка знаний, превзойдя другие модели больших языков, такие как Falcon и MPT.
Приоритет безопасности и прозрачности
Meta продемонстрировала свою приверженность безопасности и прозрачности, подвергнув LLaMA 2 строгим испытаниям. «красная команда» и тонкая настройка через противоборствующие подсказки. Благодаря этим усилиям LLaMA 2 соответствует самым высоким стандартам безопасности и позволяет исследователям и разработчикам получить четкое представление о его характеристиках посредством прозрачных процессов оценки.
Доступность на разных платформах
В соответствии со своей приверженностью принципам открытого исходного кода, Meta позаботилась о том, чтобы LLaMA 2 была доступна на разных платформах. Первоначально доступная через Microsoft Azure, LLaMA 2 вскоре появится на других платформах, таких как AWS, обнимающее лицо, и другие. Этот инклюзивный подход способствует широкому внедрению и сотрудничеству между разработчиками и исследователями, способствуя развитию приложений ИИ.
Сила открытого подхода к ИИ
Стратегия Meta с открытым исходным кодом согласуется с быстро развивающимся ландшафтом технологий генеративного ИИ. Демократизируя доступ к передовым моделям, таким как LLaMA 2, Meta способствует совместное сообщество разработчиков и исследователей которые могут совместно проводить стресс-тестирование модели, выявлять потенциальные проблемы и ускорять решения, что в конечном итоге способствует продвижению инноваций в области ИИ.
LLaMA 2 против GPT-4 и PaLM 2
Хотя LLaMA 2 может быть немного менее мощным, чем его конкуренты, GPT-4 и PaLM 2, его природа с открытым исходным кодом и упор Meta на безопасность и прозрачность ключевые дифференциаторы. LLaMA 2 прошла обучение на два миллиона токенов, меньше, чем у PaLM 2 3,6 миллиона токенов, и он поддерживает 20 языков, плетущийся позади 100 языков PaLM 2 и 26 языков GPT-4. Однако возможности совместной работы с открытым исходным кодом и разработки под руководством сообщества могут компенсировать эти различия и привести к быстрому прогрессу.
Ключевой момент для развития ИИ
Решение Meta открыть исходный код LLaMA 2 отмечает поворотный момент в ландшафте ИИ. Создавая эту мощную языковую модель свободно доступный, Meta позволяет разработчикам и исследователям расширять границы инноваций в области искусственного интеллекта, обеспечивая при этом безопасность и прозрачность. Сотрудничество с Майкрософт и Qualcomm еще больше укрепляет светлое будущее приложений ИИ, обещая беспрепятственную интеграцию на различных платформах и устройствах.
По мере того, как разработчики и исследователи отправляются в это путешествие с LLaMA 2, а конкуренция между LLaMA 2 и GPT-4 продолжается, мы можем ожидать появится волна преобразующих инструментов на базе ИИ, изменение нашего взаимодействия с технологиями. Приверженность Meta к открытости создает прецедент для совместной доработки и использования моделей ИИ, прокладывая путь для нового поколения инноваций ИИ, которые будут определять будущее искусственного интеллекта.
Популярное изображение: Кредит
Source: LLaMA 2 против GPT-4: насколько конкурентоспособна Meta в гонке ИИ?