Новости

Использование китайских ускорителей увеличивает разработку ИИ-моделей на три месяца

Некоторые из китайских разработчиков систем искусственного интеллекта просто вынуждены опираться на отечественную компонентную базу при развитии своей аппаратной инфраструктуры, поскольку находятся под санкциями США. Они утверждают, что китайские ускорители вычислений увеличивают время создания ИИ-моделей на 3 месяца по сравнению с американскими.

Подобными комментариями на страницах WeChat поделился основатель и глава iFlytek — китайского разработчика систем распознавания голоса, который под санкциями США находится с октября 2019 года. Это достаточно продолжительный срок, который позволяет в полной мере понять, как можно обходиться без доступа к новейшим решениям американского происхождения, и чем это чревато для бизнеса. Председатель совета директоров iFlytek Лю Цинфэн (Liu Qingfeng) назвал свою компанию едва ли не единственным китайским разработчиком ИИ-моделей, который сознательно настаивает на использовании только чипов китайского производства. Это делается для исключения риска утраты доступа к зарубежным изделиям.

При этом определённый прогресс в эффективности тех же китайских ускорителей Huawei Ascend 910B наблюдается. Если в конце прошлого года они в четыре раза уступали Nvidia A800, то сейчас по производительности в сфере обучения больших языковых моделей они отстают от этого изделия американской компании всего на 27 %. Основатель Huawei Жэнь Чжэнфэй (Ren Zhengfei) недавно признал, что чипы Ascend отстают от американских конкурентов на поколение, но компенсировать это можно за счёт объединения вычислительных узлов в хорошо масштабируемые кластеры.

Глава iFlytek подчёркивает, что его компания остаётся единственным китайским разработчиком, активно агитирующим в пользу перехода на китайские ускорители вычислений. Работающая исключительно на них языковая модель X1 с 70 млрд параметров демонстрирует быстродействие на уровне DeepSeek R1 и OpenAI o1. Кроме того, iFlytek намеревается самостоятельно разработать рассуждающую языковую модель, обученную исключительно на китайских ускорителях. В среднем, использование этих ускорителей вместо решений Nvidia увеличивает время обучения языковой модели на три месяца, но iFlytek это не смущает.

Источник