Запуск модели DeepSeek R2 отложил после сбоев чипа Ascend

Китайский гигант AI Deepseek столкнулся с значительными задержками в выпуске своей последней модели R2, в первую очередь из -за постоянных технических трудностей с восхождением Huawei. Компания, столкнувшаяся с поддержкой китайских властей для принятия отечественных процессоров через Nvidia H20 Systems, изо всех сил пыталась добиться успешного обучения с использованием оборудования Huawei.

Несмотря на помощь инженеров Huawei, DeepSeek вынужден полагаться на аппаратное обеспечение NVIDIA для основного обучения своих моделей, резервируя чипы восхождения в основном для задач вывода. Эта опора подчеркивает заметный пробел в стабильности, взаимосвязи и зрелости программного обеспечения между предложениями Huawei и более устоявшимися продуктами Nvidia.

Следовательно, запуск R2, первоначально запланированный на май 2025 года, был отложен. Задержки связаны не только с аппаратными проблемами, но и с более длительной маркировкой данных для обновленного набора учебных данных. По сообщениям, основатель DeepSeek Лян Венфенг выразил недовольство прогрессом модели, подчеркивая необходимость дополнительной разработки, чтобы обеспечить R2 сохранить конкурентное преимущество компании в быстро развивающемся ландшафте ИИ.

У WhatsApp сейчас более 2 миллиардов пользователей

Эта неудача позволила конкурентам, таким как QWEN3 Alibaba, получить преимущество. По сообщениям, QWEN3 включил основные алгоритмы обучения DeepSeek, одновременно повышая эффективность и гибкость, демонстрируя быструю эволюцию в экосистемах ИИ, даже когда ведущий стартап сталкивается с внутренней борьбой.

Ситуация в DeepSeek подчеркивает более широкий толчок Пекина к самообеспеченности ИИ, что оказывает значительное давление на домашние фирмы, чтобы принять местное оборудование. Тем не менее, практическая реализация этой стратегии выявила значительные технические препятствия. NVIDIA, ключевой игрок на мировом рынке аппаратных средств AI, постоянно подчеркивает стратегическую важность поддержания доступа к китайским разработчикам, предупреждая, что ограничения на принятие технологий могут негативно повлиять на экономические и национальные интересы безопасности.

Таким образом, китайские компании по искусству ориентируются на сложную среду, уравновешивая правительственные директивы для использования внутреннего оборудования с практическими реалиями разработки и развертывания передовых крупных языковых моделей. Технические проблемы, с которыми сталкивается DeepSeek, иллюстрируют напряженность между политическими амбициями и реальными возможностями развертывания ИИ.

EA работает над тремя новыми играми по «Звездным войнам»

Несмотря на эти значительные неудачи, существует вероятность того, что модель R2 Deepseek может быть выпущена в ближайшие недели. Тем не менее, его производительность, вероятно, столкнется с сильным контролем, особенно по сравнению с конкурирующими моделями, обученными более зрелым и надежным оборудованию. Эта продолжающаяся сага служит явным примером проблем, присущих достижению самодостаточности ИИ, сохраняя при этом конкурентное технологическое преимущество.

Source: Запуск модели DeepSeek R2 отложил после сбоев чипа Ascend