首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

所有人还在卷模型参数,明略科技(2718.HK)已经开始管AI的账了|调用|路由|agent|token

一个反直觉的事实正在困扰越来越多的企业技术负责人:大模型API的价格明明在暴跌,公司的AI支出反而越来越高了。

这不是个例。过去一年,全球主流大模型的Token单价平均下降了超过80%,部分开源模型的调用成本已经趋近于零。但与此同时,企业的AI账单非但没有缩减,反而以每月两位数百分比的速度攀升。

价格降了,钱花得更多了。这个看似矛盾的现象背后,藏着一个被严重低估的结构性问题:AI成本的真正驱动因素从来不是单价,而是用量。而用量的爆炸式增长,源自Agentic AI对任务分解方式的根本改变。

便宜的不是AI,是你的错觉

当Agent接管一个复杂业务任务时,它不会像人一样"想清楚再做"。它的运作方式是层层拆解:一个营销策略任务可能被拆成市场洞察、竞品分析、受众画像、创意生成、渠道匹配、效果预测等十几个子任务,每个子任务又可能触发多轮模型调用。拆解的层数越多,Token消耗量就呈几何级放大。

这意味着,企业引入Agent的初衷是降本增效,但Agent的运行机制天然就是Token密集型。你用Agent替代了一个年薪50万的员工,但Agent每个月烧掉的Token费用可能已经接近甚至超过这个数字。区别在于,员工的成本是固定的,而Agent的成本是弹性的——任务越复杂、调用越频繁,账单就越厚。

更棘手的是,这种成本膨胀是隐性的。传统IT支出有明确的预算科目和审批流程,但Token消耗往往散落在各个业务线的API调用中,缺乏统一的监控和管理。很多公司直到季度末看到账单时,才发现AI支出已经远超预期。

这就是当前企业AI落地的真实困境:不是技术不够好,不是模型不够强,而是没有人帮企业把AI的钱算清楚。

分层调度不是技术选项,是财务纪律

面对失控的AI账单,企业的本能反应是"换便宜的模型"。但这只解决了一半问题。

真正的解法是分层调度:高价值任务用贵的前沿模型,日常运营用便宜的轻量模型,并且建立一套完整的Token预算管理体系。这不是技术优化,而是财务纪律。

具体来说,企业需要回答三个问题。第一,每个项目的AI投入产出比是多少?如果用一个前沿模型做创意测试,带来的转化率提升能否覆盖额外的Token成本?第二,哪些任务可以用端侧或专属模型替代?大量重复性、低复杂度的工作根本不需要调用最前沿的闭源模型,本地部署的小模型完全胜任,且边际成本趋近于零。第三,如何动态分配资源?企业需要一个智能路由系统,根据任务的实时特征自动选择最优模型组合,而不是靠人工判断。

这套体系的本质,是把AI从"按需付费的云服务"变成"可预算、可审计、可优化的企业经营要素"。就像企业不会因为电费便宜就让所有车间24小时满负荷运转一样,AI的使用也需要精细化的成本管理。

目前市场上谈论模型能力的人很多,谈论模型成本管理的人很少。但对企业来说,后者才是决定AI能不能持续用下去的关键。

谁在解决这个问题,谁就被低估了

在这个被忽视的赛道上,已经有公司跑出了验证过的商业模型。

明略科技的Agentic Services业务提供了一个值得研究的样本。该公司不仅提供端侧模型(Mano-P、Cider、ASR)和专属模型训练能力,更重要的是搭建了一套Token预算管理和智能路由系统,并将其嵌入自身的Agentic Services交付流程中。这套体系已经在实际业务中跑出不错的毛利率,且随着Token成本的持续下降,利润率预计还将提升。

这个数据的意义在于:它证明了"帮企业管好AI的钱"这件事本身就是一个可持续的生意,而不只是附属于模型销售的增值服务。当大多数AI公司还在比拼谁的模型参数更大、榜单排名更高时,明略科技已经把竞争维度拉到了企业经营层面——谁能帮客户在AI时代维持健康的利润表,谁才有真正的客户粘性。

资本市场的反应印证了这一判断。阶跃星辰和面壁智能在端侧模型赛道获得高额估值,但它们尚未上市、尚未验证单位经济模型。明略科技具备同类能力,且已有规模化收入和利润验证,但还没有被公众所完全熟知。

Coinbase近期公开表示"不能永远用最贵的模型",这句话听起来朴素,但它代表了一个正在形成的行业共识:AI竞争的下一阶段,不是比谁的模型更强,而是比谁能把模型用得更有经济性。

被误读的上涨,与被忽视的能力

回到最初的问题:为什么Token越来越便宜,企业的AI账单反而越来越贵?

答案很简单:因为AI的价值不在于便宜,而在于它能做越来越多以前做不了的事。当能力边界不断扩展时,成本控制就不再是一个技术问题,而是一个经营管理问题。

明略科技这几日的股价上涨,被很多人误读为短期资金行为。但如果从"AI成本管理基础设施"这个角度重新审视,这次上涨更像是一次价值发现——市场开始意识到,在所有人都在追逐更强的模型时,有一家公司已经在解决"怎么把模型用好、用得起、用得久"这个更基础的问题。

这个问题不性感,但它决定了AI在企业场景中到底是昙花一现的技术热潮,还是真正可持续的生产力变革。

📚 相关阅读

• 智能体工厂要来了!两部门:在这20个行业推动产出一批人工智能应用场景,攻关一批行业模型、专用模型和特色智能体|算法|盘和林|大模型
• 宝盈基金市场观察:从摩尔定律到“韬定律”,国产半导体全栈协同开启新纪元|晶体管|先进制程
• 我国玻璃硬盘实现量产 单盘最大容量360TB|tb|介质|固态硬盘
• 前理想高管联合创业做机器人 理想汽车、元璟资本投资|陈伟|融资|知名企业
• AI与机器人盘前速递丨华为发布AIDC数据基础设施全栈方案;业内预测SpaceX和特斯拉或将在2027年合并|知名企业|spacex|埃隆_马斯克|特斯拉(公司)|世界人工智能大会
• 渠道体系独立!比亚迪新品牌“领汇”第二款车上市 聚焦对公出行|新车|汽车|轿车