DeepSeek объявила о значительном снижении цен на свой сервис API в субботу, вскоре после выпуска своей большой языковой модели V4 24 апреля 2023 года. Цена снижает плату за попадание в кэш ввода до одной десятой от предыдущей платы и предлагает 75% скидку на модель V4-Pro до 5 мая 2023 года.
Цена попадания в кэш входных данных V4-Pro упала до 0,025 юаня (приблизительно 0,0036 доллара США) за миллион токенов. Стандартные цены в течение рекламного периода установлены на уровне 3 юаней за вход и 6 юаней за выход за миллион токенов. По данным OpenRouter, эта ценовая стратегия резко уступает конкурентам: модели от Anthropic, OpenAI и Google стоят от 12 до 25 долларов за миллион токенов.
DeepSeek выпустила предварительные версии V4-Pro и V4-Flash, что стало первым значительным запуском модели компании после версии V3.2 в декабре 2022 года. V4-Pro имеет 1,6 триллиона параметров и 49 миллиардов активных параметров на один проход вывода, что делает ее крупнейшей доступной в настоящее время моделью с открытым весом. V4-Flash имеет меньшую конфигурацию с 284 миллиардами параметров.
Даже до недавних сокращений стандартные цены V4-Pro составляли 1,74 доллара за вход и 3,48 доллара за выход на миллион токенов, что было примерно на 98% ниже, чем цена OpenAI GPT-5.5 Pro. Последние скидки еще больше расширяют это конкурентное преимущество.
На фоне роста затрат на вычислительную мощность в секторе искусственного интеллекта стратегия DeepSeek согласуется с более широкой тенденцией снижения цен в отрасли. Согласно отчету Gelonghui, компания полностью приняла концепцию «снижения цен на ИИ».
Примечательно, что V4 работает на оборудовании Huawei Ascend вместо чипов Nvidia, что, по мнению наблюдателей, может способствовать внедрению систем искусственного интеллекта внутри страны. Вэй Сунь, главный аналитик по искусственному интеллекту в Counterpoint Research, отметил, что эта разработка позволяет развертывать системы искусственного интеллекта, не полагаясь исключительно на Nvidia, что потенциально ускоряет развитие искусственного интеллекта как внутри страны, так и во всем мире.
V4-Pro демонстрирует значительную эффективность, требуя всего 27% вычислительной мощности своего предшественника, V3.2, для контекстного окна в один миллион токенов. Несмотря на свои достижения, DeepSeek признает, что V4 отстает по производительности от ведущих моделей, таких как GPT-5.4 и Gemini 3.1 Pro, примерно на три-шесть месяцев, как указано в техническом документе компании.
<час />







