MiniMax выпустила MMX-CLI, интерфейс командной строки на основе Node.js для своей платформы искусственного интеллекта, позволяющий разработчикам и агентам искусственного интеллекта напрямую получать доступ к генеративным возможностям.

MMX-CLI решает проблемы, с которыми сталкиваются агенты на основе больших языковых моделей (LLM), которым сложно генерировать мультимедиа без дополнительных уровней интеграции. Новый интерфейс позволяет пользователям вызывать различные функции создания мультимедиа непосредственно в виде команд оболочки, устраняя необходимость в протоколах контекста модели.

Интерфейс объединяет возможности MiniMax в семь групп команд: текст mmx, изображение mmx, видео mmx, речь mmx, музыка mmx, видение mmx и поиск mmx. Каждая команда предоставляет определенные функции, адаптированные для разработчиков и приложений искусственного интеллекта.

Текстовая команда mmx поддерживает многоходовой чат и предназначена для конкретных вариантов модели MiniMax. По умолчанию используется MiniMax-M2.7, что позволяет выполнять сложные задачи генерации текста. Команда mmx image позволяет создавать изображения из текстовых подсказок, предоставляя параметры соотношения сторон и согласованности темы для нескольких выходных данных. Эта функция облегчает рабочие процессы, требующие визуальной непрерывности. Команда mmx video использует MiniMax-Hailuo-2.3 для генерации видео с опциями синхронного опроса или асинхронного отслеживания задач. Пользователи могут указать начальный кадр для создания видео, используя флаги команды.

  One UI 8 бета -4 -камера сглаживает лунный фиолетовый

Речевая команда mmx MMX-CLI включает более 30 голосов преобразования текста в речь. Он позволяет пользователям настраивать такие параметры, как скорость, громкость и высоту тона, поддерживая при этом синхронизацию субтитров. Ввод ограничен 10 000 символов.

С помощью музыкальной команды mmx пользователи могут создавать музыку из текстовых вводов и определять различные композиционные параметры, такие как жанр и инструменты. Также включены варианты встраивания водяных знаков. Команда mmx Vision интерпретирует изображения, используя модель языка видения, что позволяет пользователям запрашивать содержимое изображений с помощью подсказок.

Команда поиска mmx облегчает поиск в Интернете, возвращая результаты в текстовом формате или формате JSON. И структура команд, и базовая техническая архитектура оптимизированы для удобства использования в различных средах. MMX-CLI в основном разработан на TypeScript и совместим с Node.js 18+. Его развертывание является простым, включает структурированную обработку ошибок и поддержку маршрутизации API в двух регионах.

  iOS 17: поддерживаемые устройства, слухи и дата выпуска

MiniMax заявила, что MMX-CLI значительно снижает интеграционные барьеры для разработки ИИ, предоставляя унифицированный инструмент для разнообразных возможностей создания мультимедиа. Это, в сочетании с простой настройкой агентов ИИ, упрощает процесс создания интеллектуальных приложений.

<час />

Автор рекомендуемого изображения