连涨十周后连降两周!全球AI大模型Token调用量遭遇逆转,谁在为AI算力涨价买单?|胡延平|token|ai大模型
每经记者:宋欣悦 每经编辑:杨军
连涨十周之后,全球AI大模型的Token(词元)调用量踩了刹车。
《每日经济新闻》记者根据OpenRouter(目前全球最大AI模型API聚合平台,拥有超500万开发者用户,其API调用量数据被业界视为AI应用落地的“晴雨表”)最新数据测算,上周(4月13日至19日)全球AI大模型总调用量为20.6万亿Token,连续两周走低。
值得注意的是,上榜的AI大模型中,中国AI大模型周调用量环比下跌23.77%至4.44万亿Token,而美国AI大模型周调用量环比增长20.62%至4.91万亿Token,近两个月来首次反超。这场逆转,与一轮席卷全球的算力涨价潮高度吻合。
转折点源于全球性算力成本上涨
记者根据OpenRouter最新数据测算,上周全球AI大模型总调用量为20.6万亿Token,连涨十周后,连续两周走低。其中,上榜的AI大模型中,中国AI大模型周调用量下滑至4.44万亿Token,较此前一周下滑23.77%;美国AI大模型周调用量为4.91万亿Token,环比增长20.62%,近两个月来首次超越中国。
![]()
全球调用量从连涨十周到转头向下,转折点源于全球性的算力成本上涨。自3月以来,以阿里云、腾讯、百度为代表的云厂商相继上调大模型相关服务价格。
4月8日,智谱发布GLM-5.1的同时,再度提价10%,从而完成今年第三次调价。调价后,GLM-5.1在Coding编程场景的缓存命中Token价格,已接近Anthropic旗下Claude Sonnet 4.6水平,标志着国产大模型首次在核心应用场景实现与海外领先者的价格对齐。
海外AI巨头Anthropic同样调整了定价策略,将旗下企业级产品Claude Enterprise的订阅模式从“每月每用户最高200美元固定费用”改为“按实际算力消耗计费,另加每月20美元固定费”。
这意味着,轻度用户月费可能有所下降,但重度用户反而更贵。软件授权谈判协助公司Redress Compliance联合创始人Fredrik Filipsson表示,新定价可能导致重度用户成本翻倍甚至三倍。
国产模型“产品力”迎大考
“Token资费普遍上涨,成本增高,用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者,当价格优势不再突出,模型的产品力便成为左右用户选择的关键。
胡延平分析,上周美国AI大模型调用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程(Coding)领域的“硬通货”,而国产大模型在这方面的产品力仍需提升。
OpenRouter数据显示,上周,Claude Sonnet 4.6冲上榜首,周调用量达1.38万亿Token,环比增长19%;Claude Opus 4.6位居第三,周调用量达1.22万亿Token。两款模型合计占美国AI大模型周调用量逾五成。
![]()
与此形成对比的,是近期国产模型的“过山车”行情。
在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66万亿Token的周调用量居全球榜首,但仅过一周(4月13日至19日)便下滑出榜单。
此外,记者注意到,此前多次上榜的Kimi K2.5、智谱GLM系列模型,已连续三周未登榜;此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash,近两周同样无缘榜单。
胡延平认为,OpenRouter平台的用户以开发者和中小企业为主,对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向,在能够触达的范围内,用户只用最好的。”他指出,用户场景越来越要求模型具备强工具调用能力、多Agent支持、长程复杂任务的持续达成能力,“目前OpenRouter上的大部分模型在这方面还需着力提升”。
有业内人士也向《每日经济新闻》记者指出,算力成本上涨后,行业内普遍优先选择性能稳定、输出效果可靠的工具,价格已非首要考量。
专家:全球消耗量仍处快速增长通道
短期数据波动,是否意味着AI应用热潮正在消退?
“短期还不宜下结论。”胡延平提醒,OpenRouter的Token调用量仅占全球消耗总量的约2%~4%,其排名波动更多反映的是开源、二线及新发模型的竞争态势,不能代表整个市场的走向。
事实上,成本压力正在倒逼市场进化。胡延平观察到,今年初以来,OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平;成本大幅抬高,促使企业和用户转而采用记忆优化、提示词压缩、Harness Engineering(约束工程)等手段主动降耗。
记者了解到,甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量的“堆量”阶段,进化到追求更高投入产出比的“提效”阶段。
更深层的变化,在于AI应用场景本身的质变。国联民生证券一份研报中提出“Token通胀”的概念。这并非指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。
用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的“流量”,而是执行生产任务时必不可少的“燃料”。
摩根大通在研报中对中国市场作出极为乐观的预测,预计2025年至2030年,中国Token消耗量的年复合增长率将达330%,5年内将实现370倍增长。
胡延平同样对长期趋势保持坚定乐观:“就中长期而言,无论OpenRouter上的统计数据如何波动,包括中国在内,全球Token消耗总量都处在快速增长通道,未来两三年会有数十倍甚至数百倍的增加。”
眼下的调用量下滑,或许只是价格冲击下的一次短暂换仓。真正的问题不是AI热潮是否消退,而是当Token从“免费试用”走向“真实定价”,谁的模型经得起市场用真金白银来投票。