首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍|算子|hpc|stem|知名企业

6月5日,腾讯混元宣布提出Stem稀疏注意力算法,已被机器学习顶会ICML-26收录。根据Stem算法×HPC算子的全栈加速方案,算法层面,Stem通过Token位置衰减(TPD)和输出感知度量(OAM)实现25%预算下的近无损精度;算子层面,HPC开源的Stem+BSA算子将稀疏收益转化为真实硬件加速,128K上下文下首字延迟降低3.7倍。

📚 相关阅读

• 仪表盘显示屏故障,克莱斯勒在美召回超6.5万辆汽车|底盘|皮卡|驾驶室|新能源汽车|克莱斯勒集团
• 7月25日外媒科学网站摘要:安慰剂是如何缓解疼痛的?|行星|安慰剂效应|系外行星|自然|巨行星
• 俞敏洪透露董宇辉离职幕后:深陷舆论风暴|新东方
• 人形机器人半马开跑在即!去年的冠军“天工”今年将全自主参赛,无领航员、轨道及任何外部引导信号|雷达
• 软银联合多家日企成立AI公司,拟推进日本国产AI基础模型研发|电气|ai公司
• 嫦娥七号下半年择机发射|飞行|发射场|着陆器|载人飞船|国际空间站