互联网行业用户越多越赚钱,为什么AI可能相反?|云端|调用|翻译|明略|技术实力|token
近期一篇《谁能养得起AI?》,抛出了一组让人无法回避的残酷数字。
据安邦智库的数据,2025年国内四家头部互联网与科技巨头,AI相关的资本开支合计已超过5500亿元,却没有一家实现AI业务的整体盈利。其中一家头部平台,去年的AI推理成本突破80亿元,竟然是其AI业务营收增量的2.3倍——换算下来,每挣到1元收入,要先付出2.3元的刚性成本。
这个账本如果放在过去十年的互联网逻辑里,本不该让人焦虑。
“烧钱换规模、规模换利润”几乎是移动互联网时代的铁律。前期基建虽然昂贵,但分发近乎免费:一套App、一套推荐系统,多服务一万个用户和多服务一个用户,边际成本几乎可以忽略不计。亏在前面,赚在后面,时间与规模最终会替你摊平账单。
但在这个夏天,行业不得不共同面对一个被刺破的真相:AI,可能根本不适用这套逻辑。
1. 互联网卖的是“复制”,而AI卖的是“计算”
传统互联网的本质是“复制”(Copy),而大模型的本质是“计算”(Compute)。
训练大模型是一笔昂贵的固定资产投入,但推理(Inference)绝不是免费的无限复制。用户每一次展开的长对话、每一轮复杂的工具调用、每一次多步执行的Agent拆解,背后都在实打实地消耗着算力、电力、带宽和GPU折旧。
这意味着,当规模上去之后,推理成本不会自动消失,反而会跟着DAU一起等比例膨胀。
规模一大,未必能先摊薄成本,可能先把亏损放大了。翻译成更直白的商业语言就是:DAU涨上去,边际ROI(投入产出比)不一定跟着涨。
只有当你的收费方式能够绝对覆盖每一次推理的单位成本时,规模才是你的朋友;否则,规模只是一张数额更大的催命账单。AI进入下半场,行业从流量叙事中清醒过来。先赚钱,才有资格继续烧钱。
值得玩味的是,几乎就在这个行业共识引发集体焦虑的同时,6月8日,阿里巴巴宣布将通义大模型事业部与未来生活实验室合并,成立一个极为特殊的新部门:Token Foundry,由集团CEO吴泳铭直接挂帅。
Foundry(铸造厂),正是半导体行业中台积电那种为全球代工芯片的“重工业”模式。
把大模型业务直接命名为“Token的铸造厂”,还交给一把手亲自抓,释放的信号再清晰不过:当Token(每一次推理的计量单位)成为AI时代真正的成本和收入单元,连最头部的超级玩家,也开始用“制造硬科技”的工业思路,去琢磨怎么把Token更高效、更低成本地生产出来。
这门生意的底层,已经彻底变成了一道残酷的单位经济学(Unit Economics)算术题。AI的胜负手,正在从“模型参数有多大”,转向“每一个Token值多少钱、又花多少钱”。
2. 云端与端侧:两条压低成本的性感叙事
要解开这道算术题,行业无非在做两件事:要么把单位推理的成本压到极致,要么找到用户真正愿意单独付费的场景,把收入稳稳地立起来。
在压低成本的供给侧,行业正在分化出两条截然不同的路线。
一种是阿里的“重工业打法”,通过Token Foundry在云端把规模做大,靠强大的供应链体量和技术优化去死磕云端成本;而另一种,则是将目光从遥远的云端算力集群,移向用户手边的物理设备,即端侧AI。
这恰好是以明略科技为代表的选手在过去一年深耕的方向。
云端推理的痛点在于其“结构性昂贵”,按用量计费,账单随用户粘性线性飙升。但如果将AI模型直接跑在用户自己的Mac、PC或手机等本地设备上,情况则完全不同:硬件资产已由用户一次性买断,后续的每一次长对话、每一次Agent调用,其边际推理成本几乎被压缩至零,且数据不出本地。
阿里在云上把Token越铸越便宜,明略在端上让Token输出更高效。这不仅是技术路线的分野,更是对同一道命题的殊途同归:谁能率先把单次推理的刚性成本“隐形化”,谁就拿到了下一阶段的入场券。
3. 微观付费:从“玩具”走向“生产力”
然而,成本只是硬币的一面,更难的考题在硬币的另一面:你的收费方式,到底能不能覆盖单位成本?
这个问题光靠精妙的商业故事无法回答,得看有没有人真的愿意掏出真金白银。而答案,往往藏在那些最微观、最难以造假的真实场景里。
在明略旗下的DOMO平台上,有一个被反复提及的真实个体案例。一位独立博主在平时缺乏专业运营指导时,开始高频使用平台上的AI经纪人——帮她锁定对标账号、拆解数据差距、甚至直接给出内容优化方向。
在后期的用户回访中,这位博主留下了一句话:“即使不接商单,我也愿意为这个AI经纪人单独付费。”
这句话的分量,在当下这个“既要DAU又要ROI”的清算时代显得尤为珍贵。它意味着用户付费的驱动力不再是贪图便宜、薅羊毛,或者一时的猎奇,而是产品真正切入了生产力场景,完成了实打实的“价值交换”。
只有当AI从一个用于聊天的“玩具”(Toy),变成能够帮用户省钱或赚钱的“工具”(Tool)时,用户才愿意为了单次推理产生的Token买单。
回到那句“先赚钱才有资格继续烧钱”,在这场漫长的马拉松里,决定生死的未必是谁的模型在评测榜单上拿了第一,也未必是谁用免费策略卷出了更高的DAU,而是谁的单位经济学(Unit Economics)先跑通。
一边把成本压向供给侧和端侧,一边把收入扎进能解决痛点的真实场景,让产出的每一个Token都不亏钱——这才是能在AI时代持续走下去的姿态。
养得起AI的,或许不是账上融钱最多的那个,而是底层的账先算明白的那个。