Воксстрал имеет запущен Новые модели «Понимание речи с открытым исходным кодом», стремящиеся революционизировать взаимодействие человека с компьютером, делая голосовые интерфейсы более надежными и доступными. Эти современные модели, доступные в вариантах 24B и 3B в соответствии с лицензией Apache 2.0, предлагают исключительную транскрипцию и глубокое понимание возможностей, устранение ограничений текущих запатентованных систем и систем с открытым исходным кодом.
Воксстральные мосты зазора между высокими дорогими, закрытыми API и менее точными альтернативами с открытым исходным кодом. Он обеспечивает современную точность и естественное семантическое понимание менее чем в половине цены сопоставимых API. Модели поддерживают длинный звук до 30 минут для транскрипции и 40 минут для понимания, показывающая длину контекста токена 32K. Они также включают встроенные вопросы и ответы и суммирование, автоматическое обнаружение языка для широко используемых языков (английский, испанский, французский, португальский, хинди, немецкий, голландский, итальянский) и прямые функции, называемые голосовыми командами.

В критериях Voxtral значительно превосходит ведущие модели с открытым исходным кодом, такие как Whisper Lagry-V3, и сильно конкурирует с мини-транскрибией GPT-4O и Gemini 2.5 в транскрипции речи и понимании звука. Например, Voxtral Mini Transcribibe более рентабельна, чем шепот Openai, в то время как малые матчи Voxtral Matches Elevenlabs Performance по более низкой цене. Модели также сохраняют сильные возможности понимания текста от своей малой малой 3,1.
Модели Voxtral доступны для локальной загрузки на обнимающем лицо и через API, а цены начинаются от 0,001 доллара в минуту. Функции предприятия включают в себя частное развертывание, специфическую настройку доменов и расширенные контекстные возможности, такие как выявление динамиков и обнаружение эмоций. Будущие обновления будут включать в себя сегментацию динамиков, разметки звука и временные метки на уровне слов, что еще больше улучшает их утилиту.
Source: Мистраль запускает Voxtral: модели с открытым исходным кодом








