小米将AI模型API价格最高下调99%，价格战再度升级

小米集团永久性将旗下MiMo-V2.5系列大语言模型API价格最高下调99%，自周三起全球生效，此举加剧了中国AI供应商之间本已白热化的价格战——此前DeepSeek已将其旗舰模型成本削减75%。

"新定价消除了基于上下文窗口长度的区分，使企业级工作负载的AI推理变得可负担且可规模化，"小米在一份声明中表示。公司还推出了基于Credits的计费系统，纳入其优化的Token计划，用户使用量较原有水平增长五至八倍也无需额外付费。

目前，MiMo-V2.5 Pro版本的输入缓存命中价格仅为每百万token 0.025元人民币，较此前定价降低99%；标准版MiMo-V2.5则降至每百万token 0.02元人民币，降幅达98%。输出价格方面，Pro版降至每百万token 6元人民币（降幅86%），标准版降至每百万token 2元人民币（降幅93%）。上述调整全球适用。

此番降价使小米的推理定价低于DeepSeek近期打折的V4-Pro。后者缓存命中输入价格为每百万token 0.003625美元——按当前汇率大致相当于小米的0.025元人民币——输出价格最高为每百万token 0.87美元。DeepSeek已于5月将其75%的降幅永久化，称这是效率提升的结果，而非促销折扣。"这不是折扣，而是效率提升的传导，"Greyhound Research首席分析师Sanchit Vir Gogia在谈及DeepSeek此举时表示。

据政府支持的行业估算，中国生成式AI市场预计在本十年内将以每年超过35%的速度增长，截至2026年初已有超过300个注册生成式AI服务。这场价格战将小米置于DeepSeek、阿里巴巴通义千问、百度文心一言以及腾讯混元模型的竞争之中，这些公司过去两年均大幅扩展了大语言模型产品线。行业分析师表示，持续的价格下调可能引发类似2010年代重塑中国互联网行业的云计算定价大战。

推理成本的下降也可能推动企业对计算基础设施的需求增长。随着AI大规模部署加速，中国的AI服务器和数据中心市场预计将在本十年内以两位数增速扩张，利好国内硬件供应商，包括华为及寻求替代受限美国技术的中国服务器制造商。国际能源署警告称，随着AI应用加速，到2030年全球数据中心电力消耗可能翻倍以上，达到每年约1万亿千瓦时。

对小米而言，这一激进定价策略有望推动其AI服务在智能手机和物联网生态系统中的采用，但利润率影响尚不明确。周三小米港股下跌1.8%，卖空成交额占比达29.5%。公司未披露此次降价对收入的预期影响，也未透露目前使用其MiMo模型的企业客户数量。

本文仅供参考，不构成投资建议。