首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

小米MiMo首次公开模型推理系统全链路优化技术细节|序列|小米集团|开源模型|知名企业|小米mimo

5月30日,小米正式公开MiMo-V2.5系列模型的推理系统全链路优化方案。据小米方面介绍,团队围绕Hybrid SWA+MoE+多模态的复合架构,系统性重构了从KVCache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈,KVCache存储压缩至同级方案的约1/7,在长序列场景下推理成本大幅下降——这是本次降价的核心技术基础。5月27日,MiMo-V2.5系列API完成永久降价,最高降幅达99%,不区分输入长度。

📚 相关阅读

• 极地科考取得新成果极地治理能力不断增强
• 2025年报看国内车企:比亚迪交出靓丽成绩单|奇瑞汽车|吉利汽车|长城汽车|上汽集团
• 高盛:别被AI热潮冲昏头脑 一个关键问题还没解决……|大科技|人工智能|科技巨头|知名企业
• 力箭一号遥十三运载火箭发射成功 中科宇航累计送百星“上天”|卫星|太空|航天|运载火箭全程
• OpenAI老板做的全民发钱实验,结果出来了!|马蒂诺|奥巴马|丹尼尔|年收入|openai
• 中科创达:创通联达首发TurboX C7790开发套件 填补高通平台20+TOPS算力模组空白|机器人|tops|turbox