# 小米MiMo-V2.5永久降价99%:大模型价格战白热化,雷军三年600亿All in AI
小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%。雷军宣布未来三年投入600亿布局AI领域。大模型价格战进入"零利润"时代,中小企业AI应用迎来历史性机遇。
MiMo-V2.5降价全解读:缓存命中价降至0.02元/百万Token
5月27日,小米技术发布重要公告,宣布对自研大模型MiMo-V2.5系列API实施永久性降价,并同步优化计费体系。此次调价已于北京时间5月27日0:00全球同步生效。
此次降价的核心变化:
| 模型版本 | 缓存命中输入价(元/百万Token) | 降幅 | 输出价(元/百万Token) | 降幅 |
| MiMo-V2.5 Pro | 0.025 | 99% | 6 | 86% |
| MiMo-V2.5 | 0.02 | 98% | 2 | 93% |
值得关注的是,此次调整取消了传统定价中区分上下文窗口长度的做法,并引入Credits概念让计费更清晰透明。在加量不加价的基础上,Token用量提升至原来的5至8倍。
降价背后的技术支撑:SGLang HiCache + SWA推理优化
小米MiMo系列在开发者社区已经持续刷屏一个月,此次大幅降价并非简单的补贴策略,而是建立在推理系统深度优化的基础上:
- SGLang HiCache支持SWA(Sliding Window Attention):将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,可缓存Token数量提升至近5倍,显著提升缓存命中率和推理效率
- 专家并行方案优化:进一步提升集群输入吞吐能力
- 输入长度分桶策略优化:在保障服务质量的前提下持续降低单位Token服务成本
这些技术创新使得小米能够在保持服务质量的同时,大幅降低模型调用的边际成本——这正是"技术红利反哺用户"的最佳实践。
大模型价格战全面升级:从DeepSeek到小米的"零利润"竞赛
小米的加入使大模型价格战进入了新的阶段。此前,DeepSeek率先以极低价格打破了行业定价体系,现在小米以"永久降价"而非"限时优惠"的方式跟进,释放了明确的信号——大模型API价格将长期处于低位。
对产业链的影响是深远的:
- 中小企业AI应用门槛大幅降低:当API价格降至接近免费的水平,中小企业可以不再为模型调用成本担忧,专注于业务场景的AI化
- AI应用创新将加速爆发:低成本API将催生大量AI原生应用,特别是在客服、数据分析、内容生成等领域
- 模型厂商竞争转向生态建设:当模型能力趋同、价格趋近于零时,竞争将转向开发者生态、工具链和企业服务
雷军的600亿AI投资蓝图
与此同时,小米创始人雷军宣布未来三年将投入600亿元布局AI领域。这一投资规模在国产科技企业中名列前茅,显示出小米将AI视为公司下一个十年核心增长引擎的决心。
值得注意的是,小米2026年Q1财报显示利润出现下滑,但雷军依然选择在AI领域加大投入。这种"利润换未来"的战略选择,与微软当年All in云服务的路径如出一辙。
对制造业数字化的影响:低成本AI将加速产业渗透
大模型价格战对制造业数字化具有直接推动作用。随着API成本大幅降低,制造企业可以在以下场景中低成本部署AI能力:
- 智能质检:利用视觉大模型替代人工质检,降低质量管控成本
- 供应链优化:通过AI预测需求、优化库存、智能排产
- 设备预测性维护:基于设备运行数据的AI分析,提前预警故障
- 知识管理与决策支持:将企业Know-How转化为AI辅助决策系统
一道科技作为杭州专业的AI大模型定制开发服务商,一直致力于帮助企业以最低成本实现AI能力的落地应用。我们提供基于多种开源和商业大模型的定制化服务,帮助企业选择最适合自身业务场景的模型方案,并完成从数据处理、模型微调到系统部署的全流程交付。
一道科技核心优势:国家高新技术企业、40+项软件著作权、服务1000+企业客户的丰富经验。无论您的企业处于数字化转型的哪个阶段,我们都能提供匹配的技术方案。
---