首页国内国际社会军事科技财经体育娱乐

🔄 采集科技文章

谷德专业资讯网专业·及时·权威

首页采集科技文章返回首页

通义实验室推出通用智能体评测基准PawBench|人工智能模型|pawbench

📰 谷德专业资讯网 ⏰ 2026-06-05 21:48 👁 21619 阅读

6月5日，通义实验室推出评测基准PawBench，v1.0版本已开源。它面向个人助理与通用智能体场景，将底座模型与运行框架（Harness）纳入同一评测体系。据介绍，PawBench不是单纯做一个模型排行榜，而是把“模型、Harness、任务”三者放在一起做交叉评测。

本文标签：科技人工智能

🔥 专题推荐

2024全国两会

聚焦两会热点

经济发展报告

洞察经济趋势

科技创新前沿

探索科技未来

🔥 科技热门

• 集成四大顶尖模型！阿里ATH事业群首款AI开

• 5月汽车销量前十已无燃油车|乘用车|特斯拉|

• 英伟达与SK海力士达成多年期技术合作，共同开

• 波兰选择富士康作为电动汽车项目合作伙伴|鸿海

• “接下来一到两年，日子会比较难过！”蔚来董事

• IBM承诺投资超过100亿美元用于量子计算

🏷️ 热门标签

装备交通社会新闻消费羽毛球冲突航天演习综艺世界杯武器联合国银行旅游娱乐短视频国内新闻导弹战机食品安全