중국 AI 모델이 API 비용을 미국 경쟁사의 극히 일부 수준으로 유지하면서 추론 라우팅 트래픽 점유율을 빠르게 확대하며 AI 시장의 경제 구조를 재편하고 있다.
중국 AI 모델이 API 비용을 미국 경쟁사의 극히 일부 수준으로 유지하면서 추론 라우팅 트래픽 점유율을 빠르게 확대하며 AI 시장의 경제 구조를 재편하고 있다.

중국 AI 모델이 API 비용을 미국 경쟁사의 극히 일부 수준으로 유지하면서 추론 라우팅 트래픽 점유율을 빠르게 확대하며 AI 시장의 경제 구조를 재편하고 있다.
딥시크(DeepSeek), 알리바바의 큐원(Qwen), 바이트댄스(ByteDance)의 중국 AI 모델들이 모델 라우팅 쿼리에서 점유율을 높여가고 있다. 개발자들이 민감하지 않은 워크로드를 가장 저렴한 추론 제공업체로 돌리면서 오픈AI, 앤트로픽, 구글의 가격 결정력을 위협하고 있다.
이러한 추세는 6월 8일 CNBC의 디어드레 보사(Deirdre Bosa) 기자가 보도한 내용에서 부각됐다. 보도에 따르면 모델 라우팅 플랫폼들이 업계 전반의 비용 격차가 확대됨에 따라 점점 더 많은 트래픽을 중국 제공업체로 유도하고 있다.
딥시크의 V3 모델 API 가격은 입력 토큰 100만 개당 약 0.14달러로, 오픈AI의 GPT-4o(2.50달러)와 비교해 94% 할인된 수준이다. 알리바바의 큐원 2.5와 바이트댄스의 더우바오(Doubao) 모델도 유사한 가격 우위를 제공해, 비용 대비 원시 성능을 최적화하는 라우팅 플랫폼의 기본 선택지가 되고 있다.
이러한 변화는 프리미엄 API 가격 책정을 기반으로 사업을 구축한 미국 AI 선두 기업들의 수익 모델을 위협한다. 오픈AI는 올해에만 100억 달러 이상의 매출을 올릴 것으로 예상되며, 이 중 상당 부분이 API 접근에서 발생한다. 라우팅 플랫폼이 지속적으로 트래픽을 중국 제공업체로 돌릴 경우, 미국 기업들은 가격 인하를 강요받아 업계 전반의 마진이 압박받을 수 있다.
모델 라우팅이 추론 시장을 재편하는 방식
오픈라우터(OpenRouter)와 투게더 AI(Together AI) 같은 모델 라우팅 플랫폼은 들어오는 쿼리를 자동으로 평가해 성능과 비용의 최적 균형을 제공하는 모델로 전환한다. 요약, 번역, 기본 코드 생성 등 추론 볼륨의 대부분을 차지하는 작업의 경우, 중국 모델은 종종 극히 낮은 가격에 비교할 만한 품질을 제공한다. 이는 미국 연구소가 자체 가격을 대폭 인하하지 않고서는 쉽게 대응할 수 없는 구조적 우위를 중국 제공업체에 만들어준다.
승자와 패자
가장 큰 수혜자는 AWS, 구글 클라우드, 알리바바 클라우드 등 멀티 모델 라우팅을 지원하는 클라우드 인프라 제공업체다. 이들은 어떤 모델이 라우팅 결정에서 승리하든 컴퓨팅 수익을 얻는다. 엔비디아도 총 컴퓨팅 수요 증가로 혜택을 본다. 모든 추론 쿼리에는 여전히 GPU 사이클이 필요하며, 라우팅 플랫폼은 전반적인 활용도를 높인다.
가장 큰 타격을 입는 곳은 프론티어 모델 훈련에 수십억 달러를 투자했지만 이기기 어려운 가격 전쟁에 직면한 미국 AI 연구소들이다. 오픈AI는 200억 달러 이상의 자금을 조달했으며, 대부분을 훈련용 컴퓨팅과 인재 확보에 사용했다. 라우팅 플랫폼이 추론을 상품화하면, 그러한 투자를 정당화했던 경제 구조가 붕괴되기 시작한다.
투자자들에게 핵심 질문은 미국 AI 기업들이 가격 결정력을 유지할 수 있느냐는 것이다. 오픈AI, 앤트로픽, 구글의 딥마인드는 대규모 훈련 작업 자금을 조달하기 위해 프리미엄 API 가격에 의존해 왔다. 딥시크의 V3 모델은 약 600만 달러의 컴퓨팅 비용으로 훈련된 반면, 이에 필적하는 미국 모델에는 수억 달러가 소요됐다. 이러한 비용 구조 덕분에 중국 제공업체는 무기한으로 미국보다 낮은 가격을 유지할 수 있다. 모건스탠리 애널리스트들은 추론 가격이 AI 인프라 가치 평가의 핵심 위험 요소라고 지적하며, 지속적인 가격 전쟁이 2027년까지 계획된 2000억 달러 규모의 AI 데이터센터 자본 지출(CapEx)에 대한 예상 수익을 낮출 수 있다고 경고했다.
본 문서는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.