Reflection 70B делает то, что не могут большие парни, и учится на своих ошибках. Этот ИИ с моделями языка с открытым исходным кодом, возможно, нашел контрмеру против заблуждений.
Reflection 70B, запущенный HyperWrite, стартапом под руководством соучредителя и генерального директора Мэтта Шумера, основан на Llama 3.1-70B Instruct от Meta. Что отличает эту модель от других, так это ее способность к самокоррекции, уникальная способность, которая привлекла внимание сообщества ИИ.
Я рад представить Reflection 70B — лучшую в мире модель с открытым исходным кодом.
Обучение с использованием Reflection-Tuning — методики, разработанной для того, чтобы позволить магистрам права исправлять собственные ошибки.
405B выйдет на следующей неделе — мы ожидаем, что это будет лучшая модель в мире.
Построено с @GlaiveAI.
Читать дальше : pic.twitter.com/kZPW1plJuo
— Мэтт Шумер (@mattshumer_) 5 сентября 2024 г.
Отличительная особенность Reflection 70B
Шумер объявил о появлении Reflection 70B на X и подчеркнул его превосходство над другими моделями на рынке открытого исходного кода. Он уверенно заявил, что AI в настоящее время является лучшей моделью открытого исходного кода AI, превосходящей своих предшественников, включая серию Llama от Meta. Такие бенчмарки, как ММЛУ и HumanEval также подтвердилась высокая производительность Reflection 70B, показав лучшие результаты, чем альтернативы с открытым исходным кодом и коммерческие альтернативы.
Причина, по которой Reflection 70B достигает этих результатов, и особенность, которой не хватает его конкурентам, заключается в его способности обнаруживать и исправлять ошибки. Это новаторская функция в ИИ, потому что, хотя языковые модели часто «галлюцинировать” или выдавать ложную информацию, ИИ Шумера может распознавать ошибки, прежде чем предоставить окончательный ответ. Шумер думал об этой концепции в течение нескольких месяцев, и с этой новой моделью это стало реальностью.
Reflection 70B может составить конкуренцию даже топовым моделям с закрытым исходным кодом (Claude 3.5 Sonnet, GPT-4o).
Это лучший LLM по (как минимум) MMLU, MATH, IFEval, GSM8K.
Превосходит GPT-4o по всем протестированным тестам.
Он превосходит Llama 3.1 405B. Это даже близко не так. pic.twitter.com/win7cHUOob
— Мэтт Шумер (@mattshumer_) 5 сентября 2024 г.
Название Reflection 70B отражает его возможности интроспекции, поскольку он «отражает” его рассуждения для проверки точности модели. Дизайн включает специальные значки, которые улучшают рассуждения и исправление ошибок, позволяя пользователям более эффективно взаимодействовать с моделью. Эти процессы рассуждений можно увидеть в виде специальных меток, которые позволяют вносить исправления в реальном времени.
Чтобы продемонстрировать свою эффективность, пользователи могут взаимодействовать с Reflection 70B на демо-сайтно есть трудности с доступом к сайту из-за интенсивное движение. Некоторые задачи, такие как определение того, какое число больше между 9.11 и 9.9разработаны для проверки точности модели. В то время как многие системы ИИ испытывают трудности с такими запросами, Reflection 70B удалось сделать их правильно, несмотря на то, что более 60 секундНесмотря на задержку, этот уровень рассуждений делает модель особенно полезной для случаев использования, где точность имеет решающее значение.
Reflection 70B — это только начало
Reflection 70B — первая модель в расширяющейся серии. Скоро выйдет еще более крупная модель Reflection 405B. Амбициозное видение Шумера для моделей Reflection включает в себя превзойти возможности моделей с закрытым исходным кодом, таких как GPT-4 от OpenAI. Сообщается, что Reflection 405B превзойдет лучшие фирменные модели и раздвинуть границы чего может достичь ИИ с открытым исходным кодом.
Но Reflection 70B — это не просто отдельный проект. Шумер также объявил о планах по интеграции модели в ГиперПрайтПлатформа помощника по написанию. HyperWrite, расширение Chrome, помогающее пользователям составлять электронные письма, резюмировать текст и многое другое, уже имеет миллионы пользователей. Предстоящая интеграция Reflection 70B в эту платформу предложит пользователям новый уровень точности и настройки, позволяя еще более продвинутый набор текста с использованием искусственного интеллекта.
Быстрый и эффективный процесс обучения
Обучение Reflection 70B не было долгим и изнурительным процессом благодаря партнерству с Глефастартап, специализирующийся на наборах данных ИИ. Платформа Glaive создает наборы данных, специфичные для конкретных вариантов использования, что упрощает и ускоряет обучение языковых моделей. В случае Reflection 70B этот подход привел к тому, что модель была обучена пять раз всего за три недели, что стало возможным благодаря использованию систем генерации синтетических данных Glaive.
Я хочу быть предельно ясным — @GlaiveAI вот почему это сработало так хорошо.
Они дают вам невероятные возможности управления при создании синтетических данных.
В дальнейшем я буду использовать их практически для каждой модели, которую буду строить, и вам тоже советую. https://t.co/I789UIa5Yg
— Мэтт Шумер (@mattshumer_) 5 сентября 2024 г.
Основанная Сахилом Чаудхари, компания стремится предоставлять высококачественные наборы данных, которые могут обучать модели быстро и экономически эффективно. Их успех в обучении небольших моделей был продемонстрирован в прошлом. 3D-параметризованная модель превзошла многих крупных конкурентов с открытым исходным кодом в определенных задачах.
Reflection 70B в действии
Развитие модели показывает, насколько это важно для HyperWrite, которая была основана в 2020 году как Otherside AI. Первоначально базирующаяся в Лонг-Айленде, Нью-Йорк, HyperWrite выросла из небольшого помощника по написанию текстов на основе ИИ в платформу с более чем два миллиона пользователей. Его ранний успех принес Шумеру и соучредителю Джейсон Куперберг пятно на Список Forbes «30 до 30» в 2023 году.
В марте 2023 года HyperWrite привлекла 2,8 миллиона долларов в финансировании от таких инвесторов, как Группа компаний Madrona Ventureчто помогло компании вырасти. Новые функции, такие как помощники браузера, которые могут выполнять такие задачи, как бронирование авиабилетов или поиск кандидатов на работу в LinkedIn, позволили HyperWrite оставаться на переднем крае персональной помощи на базе искусственного интеллекта. интеграция Ожидается, что Reflection 70B улучшит эти возможности и еще больше укрепит позиции HyperWrite в отрасли искусственного интеллекта.
Reflection 70B изменит наше представление об ИИ. Она сочетает в себе точность и рассуждения, как никакая другая модель. Модель полезна для задач, требующих высокой точности, но ее потенциальные применения гораздо шире. Предстоящий выпуск Reflection 405B показывает, что Шумер и его команда все еще усердно работают. Поскольку HyperWrite улучшает свою платформу и создает новые функции, серия Reflection, вероятно, будет очень важна. С Reflection 70B будет интересно посмотреть, как сообщество ИИ и пользователи отреагируют на уникальные возможности модели и как будущие модели будут строиться на ее основе.
Источник изображения: DC Studio / Freepik
Source: Reflection 70B — это искусственный интеллект, который может исправлять свои ошибки.