Команда QWEN объявила о выпуске QWEN3-CODER-480B и QWEN3-Coder-35Bотмечает значительный прогресс в моделях открытого агента. Эти новые модели предназначены для существенного расширения возможностей кодирования, предлагая надежный архитектурный дизайн и практическую утилиту для задач разработки программного обеспечения.
QWEN3-CODER-480B является самой большой моделью открытого кода на сегодняшний день, демонстрируя современные характеристики (SOTA) в различных критериях кода. Его возможности включают завершение, редактирование и генерацию кода. Примечательным достижением для QWEN3-Coder-480B является его исключительная производительность в выполнении кода, особенно в задаче заполнения среднего (FIM), где оно достигло оценки@1 42,0%. Обширный режим обучения модели включал в себя более 3 токенов, полученных из различных наборов данных, что способствует его улучшенной способности эффективно понимать и генерировать код. Эти обширные учебные данные и определенный размер модели позиционируют их как весьма универсальный инструмент для разработчиков, способный обрабатывать широкий спектр задач от фундаментального завершения кода до создания замысловатого кода.
В дополнение к модели 480B, QWEN3-Coder-35B Инструктируется специально оптимизирован для функционирования в качестве агента кодирования, оказывая помощь разработчикам со сложными требованиями кодирования. Эта модель включает в себя расширенные функции, в том числе окно контекста токена 32K. Он был обучен специализированными методами, которые облегчают беспрепятственное использование внешних инструментов и функциональных вызовов. Эта функциональность позволяет разработчикам вызывать внешние API непосредственно в их среде кодирования, тем самым повышая производительность и оптимизируя рабочие процессы разработки. Модель инструктирования QWEN3-Coder-35B разработана для надежности и эффективности, что делает ее очень подходящей для применений агентов, которые включают сложные взаимодействия.
И инструктирование QWEN3-Coder-480B и QWEN3-Coder-35B в настоящее время доступны на ведущих платформах, таких как обнимание лица и модели. В связи с тем, чтобы развивать инновации и сотрудничество в рамках сообщества разработки программного обеспечения, управляемого искусственным интеллектом, команда QWEN имеет открытый связанный код, веса модели и всеобъемлющую документацию. Этот подход с открытым исходным кодом предназначен для того, чтобы расширить возможности исследователей и разработчиков использовать эти модели, способствуя их дальнейшему улучшению и более широкому внедрению.
Source: Новая модель 480B QWEN Разбивает записи с открытым исходным кодом





