首页国内国际社会军事科技财经体育娱乐

🔄 采集科技文章

谷德专业资讯网专业·及时·权威

首页采集科技文章返回首页

阿里通义实验室智能计算团队推出新算法FIPO|fipo

📰 谷德专业资讯网 ⏰ 2026-04-13 15:14 👁 15229 阅读

4月7日，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。

本文标签：科技

🔥 专题推荐

2024全国两会

聚焦两会热点

经济发展报告

洞察经济趋势

科技创新前沿

探索科技未来

🔥 科技热门

• “全家福”来了！中国航天员完成第8次“太空会

• 任天堂将在日本上调Switch 2售价|sw

• 李斌回应蔚来“千站计划”迟缓问题：最多推迟一

• 网红企业家风云榜：雷军成顶流，俞敏洪反超董明

• 腾讯混元发布Hy-Memory|插件|hy|

• AI早报 | ChatGPT将转型成超级应用

🏷️ 热门标签

食品安全票房芯片明星国防云计算装备投资足球娱乐消费新能源物联网武器环保音乐国内新闻房地产住房日本