首页国内国际社会军事科技财经体育娱乐

🔄 采集科技文章

谷德专业资讯网专业·及时·权威

首页采集科技文章返回首页

通义实验室推出通用智能体评测基准PawBench|人工智能模型|pawbench

📰 谷德专业资讯网 ⏰ 2026-06-05 19:48 👁 41068 阅读

6月5日，通义实验室推出评测基准PawBench，v1.0版本已开源。它面向个人助理与通用智能体场景，将底座模型与运行框架（Harness）纳入同一评测体系。据介绍，PawBench不是单纯做一个模型排行榜，而是把“模型、Harness、任务”三者放在一起做交叉评测。

本文标签：科技人工智能

🔥 专题推荐

经济发展报告

洞察经济趋势

科技创新前沿

探索科技未来

2024全国两会

聚焦两会热点

🔥 科技热门

• 人形机器人量产稳步推进，机器人ETF易方达（

• 新能源车涨价潮开启价值竞争，高流动性的新能源

• ARR季度大涨300% 迅策“场景Token

• Anthropic完成650亿美元融资，投后

• AI早报 | 千问AI眼镜S1推出空间3D显

• 深圳“细胞十条”发布推动细胞与基因产业提速

🏷️ 热门标签

芯片军事体育明星网剧保险奥运电视剧国防合作直播交通战机国内新闻旅游基金住房新能源大数据就业