Китайский AI Startup Deepseek выпустил V3.1, обновление своей флагманской модели V3, расположенной в качестве соперника для GPT-5 Openai. Новая модель оптимизирована для чипсов из китайского производства и по цене, чтобы подчеркнуть Open, что отмечает значительное развитие в глобальном ландшафте искусственного интеллекта.
DeepSeek V3.1 был тихо запущен с помощью сообщения на WeChat и платформе объятий. Этот релиз подчеркивает амбиции Китая по разработке и контролю передовых систем ИИ независимо от иностранных технологий.
Модели Deepseek наблюдают широкое распространение в Китае и растут интерес в глобальном масштабе, даже среди некоторых американских фирм, использующих модель рассуждения R1. Тем не менее, были выявлены опасения относительно результатов моделей, соответствующих повествованиям Коммунистической партии Китая, что потенциально влияет на их нейтралитет.
Китайский сектор ИИ также включает в себя модели таких компаний, как Alibaba, Moonshot AI и Baidu. Релиз DeepSeek V3.1 после GPT-5 Openai подчеркивает решимость Китая конкурировать с ведущими американскими лабораториями.
Генеральный директор Openai Сэм Альтман признал, что конкуренция со стороны китайских моделей с открытым исходным кодом, включая DeepSeek, повлияло на решение Openai выпустить свои собственные модели с открытым весом. Альтман заявил: «Было ясно, что если бы мы этого не сделали, мир будет в основном построен на китайских моделях с открытым исходным кодом. Это было фактором в нашем решении, конечно.
Правительство США предоставило лицензии NVIDIA и AMD лицензии на экспорт, специфичные для Китая чипы ИИ, включая NVIDIA H20, при условии, что 15% доходов от этих продаж поступают в Вашингтон. В ответ Пекин перешел на ограничение покупок чипов NVIDIA после заявлений секретаря торговли Говарда Лутника, указывающих на ограничения продаж чипсов высшего уровня в Китай. Лутник заявил 15 июля: «Мы не продаем им наши лучшие вещи, а не наше второе место, даже не наше третье место».
Оптимизация DeepSeek для чипов китайского производства сигнализирует о стратегии смягчения влияния экспортных контролей США. Компания упомянула в своем сообщении WeChat, что новый формат модели предназначен для «домашних чипов следующего поколения в ближайшее время».
Альтман выразил обеспокоенность по поводу недооценки прогресса Китая в ИИ и предположил, что экспортный контроль не может быть достаточным решением. Он заметил: «Я беспокоюсь о Китае».
Модель v3.1 примечала ее технических спецификаций, включая 685 миллиардов параметров. Его конструкция «смеси экспертов» предназначена для снижения вычислительных затрат для разработчиков путем активации только доли модели для каждого запроса. В отличие от предыдущих моделей DeepSeek, которые разделяли задачи, основанные на предварительных требованиях и рассуждениях, V3.1 объединяет как быстрые ответы, так и рассуждения в одной системе.
Эта гибридная архитектура является значительным продвижением, как отмечает технический аналитик Бен Диксон, основатель блога Techtalks. Он заявил, что гибридная архитектура V3.1 – «самая большая особенность на сегодняшний день».
Source: Китайский DeepSeek v3.1 подрезает Openai с более дешевой ценой








