关键要点:
- 小米将MiMo-V2.5 API价格最高永久下调99%
- 输入缓存命中价格降至每百万token仅0.025元人民币
- 此举紧随DeepSeek将其V4-Pro模型降价75%之后
关键要点:

小米集团永久性将旗下MiMo-V2.5系列大语言模型API价格最高下调99%,自周三起全球生效,此举加剧了中国AI供应商之间本已白热化的价格战——此前DeepSeek已将其旗舰模型成本削减75%。
"新定价消除了基于上下文窗口长度的区分,使企业级工作负载的AI推理变得可负担且可规模化,"小米在一份声明中表示。公司还推出了基于Credits的计费系统,纳入其优化的Token计划,用户使用量较原有水平增长五至八倍也无需额外付费。
目前,MiMo-V2.5 Pro版本的输入缓存命中价格仅为每百万token 0.025元人民币,较此前定价降低99%;标准版MiMo-V2.5则降至每百万token 0.02元人民币,降幅达98%。输出价格方面,Pro版降至每百万token 6元人民币(降幅86%),标准版降至每百万token 2元人民币(降幅93%)。上述调整全球适用。
此番降价使小米的推理定价低于DeepSeek近期打折的V4-Pro。后者缓存命中输入价格为每百万token 0.003625美元——按当前汇率大致相当于小米的0.025元人民币——输出价格最高为每百万token 0.87美元。DeepSeek已于5月将其75%的降幅永久化,称这是效率提升的结果,而非促销折扣。"这不是折扣,而是效率提升的传导,"Greyhound Research首席分析师Sanchit Vir Gogia在谈及DeepSeek此举时表示。
据政府支持的行业估算,中国生成式AI市场预计在本十年内将以每年超过35%的速度增长,截至2026年初已有超过300个注册生成式AI服务。这场价格战将小米置于DeepSeek、阿里巴巴通义千问、百度文心一言以及腾讯混元模型的竞争之中,这些公司过去两年均大幅扩展了大语言模型产品线。行业分析师表示,持续的价格下调可能引发类似2010年代重塑中国互联网行业的云计算定价大战。
推理成本的下降也可能推动企业对计算基础设施的需求增长。随着AI大规模部署加速,中国的AI服务器和数据中心市场预计将在本十年内以两位数增速扩张,利好国内硬件供应商,包括华为及寻求替代受限美国技术的中国服务器制造商。国际能源署警告称,随着AI应用加速,到2030年全球数据中心电力消耗可能翻倍以上,达到每年约1万亿千瓦时。
对小米而言,这一激进定价策略有望推动其AI服务在智能手机和物联网生态系统中的采用,但利润率影响尚不明确。周三小米港股下跌1.8%,卖空成交额占比达29.5%。公司未披露此次降价对收入的预期影响,也未透露目前使用其MiMo模型的企业客户数量。
本文仅供参考,不构成投资建议。