Z.ai, ранее известная как Zhipu AI, во вторник выпустила модель GLM-5.1. Эта флагманская модель с открытым исходным кодом предназначена для агентного проектирования и может автономно выполнять одну задачу кодирования в течение до восьми часов, выполняя планирование, выполнение, тестирование и оптимизацию в непрерывном цикле.

Модель GLM-5.1 набрала 58,4 балла в тесте SWE-Bench Pro, опередив GPT-5.4, Claude Opus 4.6 и Gemini 3.1 Pro. Этот выпуск следует за доработкой GLM-5 после обучения, которая была представлена ​​в феврале как модель Mixture of Experts с 744 миллиардами параметров, использующая примерно 40 миллиардов активных параметров на токен и полностью обученная на чипах Huawei Ascend без оборудования Nvidia.

Согласно документации Z.ai, GLM-5.1 расширяет возможности кодирования и агентов за счет таких методов, как многозадачная контролируемая точная настройка и этапы обучения с подкреплением. Модель способна выдерживать восьмичасовое автономное выполнение, завершая полный цикл «эксперимент-анализ-оптимизация». В ходе демонстраций компания успешно создала полноценную настольную систему Linux с нуля за восемь часов, выполнив 655 итераций и увеличив пропускную способность запросов к векторной базе данных в 6,9 раза.

GLM-5.1 имеет контекстное окно на 200 000 токенов и поддерживает до 128 000 выходных токенов. Он оптимизирован для рабочих процессов агентного кодирования и совместим с такими инструментами, как Claude Code и OpenClaw. Модель достигла среднего геометрического ускорения в 3,6 раза при реальных рабочих нагрузках машинного обучения в тесте оптимизации KernelBench Level 3.

  Homeworkify не работает? Вот исправления и альтернативы, которые можно попробовать

GLM-5.1 доступен всем подписчикам плана кодирования GLM, его веса публикуются по лицензии MIT. Z.ai, которая в январе стала публичной на Гонконгской фондовой бирже с оценкой в ​​31,3 миллиарда долларов, предлагает доступ к API для GLM-5.1 по цене 1,00 доллара за миллион входных токенов и 3,20 доллара за миллион выходных токенов.

Запуск обостряет конкуренцию в области моделей кодирования с открытым исходным кодом, ставя GLM-5.1 на передний план SWE-Bench Pro, опережая своих аналогов с закрытым исходным кодом. Хотя Z.ai утверждает, что возможности модели соответствуют Claude Opus 4.6, независимые оценки показывают, что она достигает примерно 94,6 процента более широкого показателя кодирования Opus 4.6, что указывает на некоторые пробелы в рассуждениях и творческих задачах.

<час />

Автор рекомендуемого изображения