首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

深圳国产芯片成功训练万亿级AI大模型|算力|技术路线

据“深圳发布”,近日,深圳河套学院Al训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为有关团队,协同深智城AI算力平台,面向国产算力大模型训练开展联合攻关。依托昇腾910C国产AI算力集群,完成1.6万亿参数大模型DeepSeek-V4-Pro全参数后训练。

此次实践为全球第三方机构在国产算力平台上完成该级别模型训练的相关探索积累了重要经验,也印证了国产AI芯片可支撑世界级超大参数模型训练工作。

本次探索是国产算力适配超大参数大模型过程中的一次重要进展,有助于提升国内AI产业链自主化水平,降低行业应用成本,为人工智能技术落地应用提供更多支撑。目前,项目已实现模型算力利用率(MFU)超过30%,关键训练算子效率提升14%,各项指标均达到工业级运行标准。

从技术应用角度来看,调用已有模型开展业务推理,与从零完成模型全参数训练分属不同技术环节,二者在技术难度、硬件要求上存在明显区别。本次试验结果表明,国产AI算力已可承担顶级大模型训练任务,相关技术路径具备可行性。

📚 相关阅读

• 中信证券:AI推动激光器芯片量价齐升,关注国产新机遇|知名企业
• 宏明电子:笔记本电脑、平板电脑、算力服务器领域结构件产品已向华为小批量供货|知名企业|国际消费电子展
• 青年科学基金项目(C类)资助规模预计增加12000项|自然科学
• 小红书大调整!正式成立AI部门和海外业务部 夏侯负责核心业务算法|电商|樱木|内部信|商业模式|知名企业
• Alphabet CEO:一季度基于生成式人工智能模型产品收入同比增长近800%|云业务|皮查伊|alphabet
• 白宫举行吹风会,向人工智能公司介绍审查AI模型的行政令|特朗普