Китайская технологическая компания DeepSeek, известная своими решениями в области искусственного интеллекта, столкнулась с серьезными препятствиями при подготовке к выпуску новой модели R2. Первоначально планировался её релиз после успешной презентации модели R1, однако из-за технических сложностей, связанных с обучением на отечественных чипах Huawei Ascend, запуск R2 пришлось отложить. Эти трудности оказали значительное влияние на конкурентоспособность компании и её позиции на рынке высоких технологий.
В начале 2024 года, после того как власти Китая поощряли переход с продукции Nvidia на отечественные процессоры, ситуация осложнилась. Согласно трём независимым источникам, знакомым с ситуацией, DeepSeek столкнулась с непреодолимыми техническими барьерами при обучении модели R2 именно на чипах Ascend. В результате стартап был вынужден использовать чипы Nvidia для проведения завершающего обучения модели, тогда как для процесса инференса — получения ответов и прогнозов — применялись чипы Huawei. Такой подход существенно ограничил эффективность и гибкость разработки, поскольку разделение методов обработки данных негативно сказывалось на скорости и точности работы системы.
Важно подчеркнуть разницу между этапами обучения и инференса. Обучение — это длительный и ресурсозатратный процесс, в ходе которого модель изучает большие объемы данных для выявления закономерностей. Инференс — это уже более быстрый этап, когда обученная модель применяется для генерации ответов или предсказаний. Специфика разделения обработки на разные типы чипов ухудшила интеграцию и создала дополнительные сложности в реализации проекта R2, что привело к задержкам в его выпуске и, как следствие, к потере позиций компании DeepSeek на рынке по сравнению с конкурентами.
Эти неудачи происходят на фоне ухудшения общего положения китайской промышленности в области высоких технологий. Недавние сообщения из Financial Times свидетельствуют о росте государственного давления на технокомпании, требующее обосновывать покупки чипов российского производства Nvidia H100. Цель — стимулировать использование отечественных решений, таких как чипы Huawei и Cambricon, чтобы снизить зависимость от американской продукции и укрепить национальную стратегию технологической автономии.
Однако, несмотря на поддержку со стороны Huawei, проблемы с китайскими чипами остаются актуальными. Согласно отраслевым инсайдерам, отечественные решения страдают от недостаточной стабильности работы, низкой скорости межчиповой связи и худшего программного обеспечения по сравнению с Nvidia. Эти недостатки мешают полноценному внедрению и развитию собственных высокопроизводительных решений для ИИ.
Для DeepSeek, хотя в офисе компании появилась команда инженеров из Huawei, направленная на устранение возникших проблем, обучение модели R2 на чипах Ascend так и не было успешно завершено. Компания продолжает искать пути решения или альтернативные подходы, однако конкретные планы и дальнейшие шаги пока остаются неизвестными. На сегодняшний день ситуация демонстрирует сложную картину взаимодействия инновационных технологий и государственной политики, что накладывает дополнительные ограничения на развитие отрасли искусственного интеллекта в Китае и требует поиска новых решений внутри отраслевой экосистемы.