中国人工聪明(AI)公司深度求索(DeepSeek)使用华为晶片练习发生困难,被迫延后发表新模型,可见中国推动自家技术来取代美国面临瓶颈。
英国金融时报(FT)引述知情人士报导,DeepSeek今年1月推出R1模型后,在主管机关鼓励下改用华为昇腾处理器(Ascend)取代辉达(NVIDIA)晶片。
但DeepSeek以昇腾晶片练习R2模型时持续遭遇技术题目,不得不改用NVIDIA辉达晶片来练习,另把华为晶片用于推论(inference)。报导指出,这正是DeepSeek新模型原定5月发表、却延后的主因。
报导引述中国产业人士指出,中国晶片在稳定性、24小时一元一分麻将群晶片间连线速度和软体水準方面都不如辉达的产品。
据报导,华为曾派出工程团队进驻DeepSeek办公室,协助该公司使用昇腾晶片开发R2模型。但知情人士说,即使华为驻点支援,DeepSeek仍未能在昇腾晶片上成功完成一次练习。
知情人士透露,DeepSeek创办人梁文峰曾在公司内部对R2进展表达不满,并力促团队投进更多时间打造更先进的模型,以维持该公司在AI领域的上风。
据报导,R2延后问世,也跟新版模型数据标记(data labeling)作业超过预期有关。媒体报导指出,R2模型可能最快在未来数周内发布。