中国AIモデル、ルーティングシェア拡大—コストで米国を95%下回る

中国のAIモデルは、APIコストが米国の競合他社の数分の一で推移する中、推論ルーティングトラフィックのシェアを拡大しており、AI市場の経済性を再形成している。

DeepSeek、AlibabaのQwen、ByteDanceによる中国のAIモデルは、開発者が非機密ワークロードを最も安価な推論プロバイダーに振り向けるにつれ、モデルルーティングクエリのシェアを拡大しており、OpenAI、Anthropic、Googleの価格決定力を脅かしている。

このトレンドは、Deirdre Bosaによる6月8日のCNBCのレポートで強調され、業界全体でコスト差が拡大する中、モデルルーティングプラットフォームがどのように中国のプロバイダーへトラフィックを誘導しているかを検証した。

DeepSeekのV3モデルのAPI価格は、100万入力トークンあたり約0.14ドルで、OpenAIのGPT-4o（2.50ドル）と比較して94%の割引となる。AlibabaのQwen 2.5とByteDanceのDoubaoモデルも同様の価格優位性を提供しており、コストを最適化するルーティングプラットフォームにとってデフォルトの選択肢となっている。

このシフトは、プレミアムAPI価格設定にビジネスを構築してきた米国のAIリーダーの収益モデルを脅かしている。OpenAIだけでも今年100億ドル以上の収益が見込まれており、その多くはAPIアクセスによるものだ。ルーティングプラットフォームが中国のプロバイダーへのトラフィックを迂回させ続ければ、米国企業は価格引き下げを余儀なくされ、業界全体のマージンが圧迫される可能性がある。

モデルルーティングが推論市場を再形成する方法

OpenRouterやTogether AIなどのモデルルーティングプラットフォームは、受信クエリを自動的に評価し、能力とコストの最適なバランスを提供するモデルに誘導する。要約、翻訳、基本的なコード生成などのタスク（推論量の大半を占める）では、中国のモデルは価格が数分の一でありながら、同等の品質を提供することが多い。これは、米国の研究所が自社の価格を大幅に引き下げずに対抗することが難しい、中国のプロバイダーにとっての構造的優位性を生み出している。

勝者と敗者

最大の受益者は、AWS、Google Cloud、Alibaba Cloudなど、マルチモデルルーティングをサポートするクラウドインフラプロバイダーであり、どのモデルがルーティング判断で勝利しても、コンピュート収益を得る。Nvidiaも、総コンピュート需要の増加から恩恵を受ける。すべての推論クエリは依然としてGPUサイクルを必要とし、ルーティングプラットフォームは全体的な利用率を引き上げるからだ。

最大の敗者は、フロンティアモデルのトレーニングに数十億ドルを投資してきたが、今や勝利が難しい価格競争に直面している米国のAI研究所である。OpenAIは200億ドル以上の資金を調達しており、その多くはトレーニング用コンピュートと人材に費やされている。ルーティングプラットフォームが推論をコモディティ化すれば、それらの投資を正当化した経済性は崩壊し始める。

投資家にとっての重要な疑問は、米国のAI企業が価格決定力を維持できるかどうかである。OpenAI、Anthropic、GoogleのDeepMindは、大規模なトレーニング実行に資金を供給するためにプレミアムAPI価格設定に依存してきた。DeepSeekのV3モデルは、コンピュートコストとして約600万ドルでトレーニングされたのに対し、 comparableな米国モデルには数億ドルが費やされている。このコスト構造により、中国のプロバイダーは無期限に米国の価格を下回ることが可能となる。Morgan Stanleyのアナリストは、推論価格をAIインフラ評価における主要リスクとして指摘し、持続的な価格競争が2027年までに計画されている2000億ドルのAIデータセンター設備投資の期待収益を減少させる可能性があると警告している。

本記事は情報提供のみを目的としており、投資助言を構成するものではありません。