MiniMax представила весы своей модели MiniMax M2.7 12 апреля 2023 года на фоне волны выпусков открытых весов из китайских лабораторий, что существенно повлияло на конкурентную среду в области искусственного интеллекта.
Этот релиз соответствует более широкой тенденции в Китае, поскольку различные компании спешат представить свои достижения. MiniMax M2.7 был впервые анонсирован в марте и набрал 56,22% в тесте SWE-Pro, что соответствует результатам GPT-5.3-Codex. Кроме того, он достиг 55,6% в тесте VIBE-Pro, что почти соответствует Opus 4.6 для реализации проектов в Интернете, мобильных устройствах и задачах моделирования. Модель также получила самый высокий рейтинг ELO 1495 по оценке GDPval-AA среди моделей с открытым исходным кодом.
Гири MiniMax M2.7 теперь доступны на Hugging Face и поддерживаются на платформах NVIDIA. Однако релиз подвергся критике из-за лицензионных ограничений, которые запрещают коммерческое использование без предварительного письменного разрешения, что, по мнению некоторых членов сообщества, подрывает его классификацию как открытый исходный код. MiniMax охарактеризовал M2.7 как первую модель, участвующую в собственном цикле разработки посредством процесса, который они называют «самоэволюцией».
Выпуск MiniMax последовал за тем, как 7 апреля компания Zhipu AI открыла исходный код своей модели GLM-5.1, которая работает под лицензией MIT. Эта модель, содержащая 754 миллиарда параметров, может автономно выполнять инженерные задачи до восьми часов. Напротив, Alibaba 2 апреля запустила свою собственную модель API Qwen 3.6 Plus, что вызвало спекуляции о ее приверженности практике открытого исходного кода. По состоянию на 11 апреля Qwen 3.6 Plus все еще был бесплатным на OpenRouter, но его долгосрочная доступность остается неопределенной.
Ожидания растут в отношении модели DeepSeek V4, запуск которой, как сообщается, состоится в конце апреля. Основатель DeepSeek Лян Вэньфэн отметил, что модель будет работать на чипах Huawei Ascend, подчеркивая усилия Китая по обеспечению самодостаточности полупроводников. Ожидается, что V4 будет содержать примерно один триллион параметров и будет использовать архитектуру Mixture-of-Experts с контекстным окном в один миллион токенов. Ожидается, что V4 также будет включать в себя несколько вариантов, таких как режим Vision для мультимодальной поддержки. Несмотря на две задержки, раннее стресс-тестирование предполагает, что публичный запуск может быть неизбежным.
<час />








