首页国内国际社会军事科技财经体育娱乐

🔄 采集科技文章

谷德专业资讯网专业·及时·权威

首页采集科技文章返回首页

阿里通义实验室智能计算团队推出新算法FIPO|fipo

📰 谷德专业资讯网 ⏰ 2026-04-13 15:13 👁 23739 阅读

4月7日，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。

本文标签：科技

🔥 专题推荐

科技创新前沿

探索科技未来

2024全国两会

聚焦两会热点

经济发展报告

洞察经济趋势

🔥 科技热门

• 5月我国新能源汽车产销量同比两位数增长|中国

• 理想高管与新车车展现场比拼俯卧撑|老汤|汤靖

• 我国火箭推进剂贮箱箱底实现量产，制作周期大幅

• 别高估英伟达，别低估DeepSeek|内存|

• 人形机器人半马开跑在即！去年的冠军“天工”今

• AI应用端震荡反弹引力传媒涨停|蓝色光标|

🏷️ 热门标签

美国 NBA 军舰基金贸易娱乐文化国际新闻房地产科技消费足球音乐银行就业航天合作教育食品安全俄罗斯