Một thị trường trung gian mới cho các API mô hình AI đang trỗi dậy, được thúc đẩy bởi sự gia tăng gấp 1.000 lần khối lượng gọi token hàng ngày của Trung Quốc lên hơn 140 nghìn tỷ, tạo ra một mạng lưới "bán buôn đến bán lẻ" cho trí tuệ nhân tạo.
Một thị trường trung gian mới cho các API mô hình AI đang trỗi dậy, được thúc đẩy bởi sự gia tăng gấp 1.000 lần khối lượng gọi token hàng ngày của Trung Quốc lên hơn 140 nghìn tỷ, tạo ra một mạng lưới "bán buôn đến bán lẻ" cho trí tuệ nhân tạo.

Một thị trường trung gian mới cho các API mô hình AI đang trỗi dậy, được thúc đẩy bởi sự gia tăng gấp 1.000 lần khối lượng gọi token hàng ngày của Trung Quốc lên hơn 140 nghìn tỷ, tạo ra một mạng lưới "bán buôn đến bán lẻ" cho trí tuệ nhân tạo.
Sự thương mại hóa trí tuệ nhân tạo đang tạo ra một lớp trung gian mới, một lớp phân phối nơi các đơn vị cơ bản của trí tuệ máy móc được mua, định tuyến và bán lại như một hàng hóa. Thị trường cho "kinh tế học token" (tokenomics) này đang được thúc đẩy bởi sự bùng nổ hơn 1.000 lần trong các cuộc gọi API mô hình AI hàng ngày của Trung Quốc, tăng từ 100 tỷ vào đầu năm 2024 lên hơn 140 nghìn tỷ vào tháng 3 năm 2026, theo báo cáo từ Huayuan Securities. Lớp mới này kết nối các nhà tạo lập mô hình thượng nguồn như ByteDance và Alibaba với các nhà phát triển và công ty hạ nguồn phân tán, tạo ra cơ sở hạ tầng thanh khoản cho dòng chảy toàn cầu của các token AI.
"Hoạt động Token đang hình thành một thị trường trung gian mới, khám phá mô hình phân phối Token để kết nối các nhà sản xuất mô hình lớn thượng nguồn với các nhà phát triển, doanh nghiệp và cá nhân hạ nguồn. Về bản chất, đây là cơ sở hạ tầng thanh khoản cho mạng lưới bán buôn đến bán lẻ token toàn cầu", nhà phân tích Chen Liangdong của Huayuan Securities cho biết trong báo cáo.
Sự tăng trưởng được thúc đẩy bởi quy mô tiêu thụ AI khổng lồ và khả năng cạnh tranh ngày càng tăng của các mô hình Trung Quốc. Trong quý đầu tiên của năm 2026, các mô hình Trung Quốc đã vượt qua các đối thủ Hoa Kỳ về khối lượng cuộc gọi hàng tuần trên OpenRouter, một nền tảng định tuyến phổ biến, lần đầu tiên. Từ ngày 16 đến ngày 22 tháng 2, các mô hình Trung Quốc chiếm bốn trong số năm mô hình hàng đầu theo khối lượng cuộc gọi, đóng góp 85,7% tổng số. Các nền tảng như OpenRouter, công ty đã chứng kiến doanh thu hàng năm tăng gấp năm lần lên hơn 50 triệu USD kể từ tháng 10 năm 2025, và Silicon Mobility (硅基流动) trong nước đang xây dựng cơ sở hạ tầng cốt lõi cho hoạt động giao dịch này, cung cấp các API thống nhất cho phép các nhà phát triển truy cập hàng trăm mô hình khác nhau thông qua một khóa duy nhất.
Nền kinh tế token mới này phản ánh sự phát triển của các ngăn xếp công nghệ khác, từ điện toán đám mây đến thanh toán tiền điện tử, nơi cơ sở hạ tầng và phân phối cuối cùng chiếm giữ giá trị đáng kể. Khi cuộc đua AI chuyển từ quy trình đào tạo mô hình thâm dụng vốn sang thách thức vận hành để chạy chúng cho hàng tỷ người dùng—một quy trình được gọi là suy luận—rào cản cạnh tranh mới trở thành chi phí cho mỗi câu trả lời. Với các mô hình Trung Quốc như M2.5 của MiniMax cung cấp chi phí đầu vào chỉ 0,30 USD cho mỗi triệu token so với 5 USD cho một mô hình như Claude 4.6, động lực kinh tế để định tuyến khối lượng công việc hiệu quả đang tạo ra cơ hội trị giá hàng tỷ đô la cho các nhà môi giới AI mới này.
Kinh doanh phân phối token không chỉ đơn thuần là bán lại quyền truy cập API với mức chênh lệch giá. Trong khi biên lợi nhuận bán lại cơ bản, như mức phí 5,5% của OpenRouter, cung cấp một mô hình kinh doanh nền tảng, giá trị thực sự đang được tạo ra ở cấp cao hơn. Những người chơi tinh vi nhất đang phát triển các công cụ tăng tốc suy luận độc quyền để giảm chi phí thực tế khi chạy một mô hình. Ví dụ, Silicon Mobility tuyên bố công nghệ SiliconLLM và OneDiff của họ có thể cải thiện tốc độ suy luận của mô hình ngôn ngữ lên gấp 10 lần, cho phép họ cung cấp các cuộc gọi API với mức giá mà họ nói là bằng 1/10 chi phí tiêu chuẩn của ngành.
Sự tập trung vào tính kinh tế của đơn vị suy luận này là rất quan trọng khi ngành công nghiệp chuyển sang "AI tác nhân" (agentic AI)—các hệ thống tự trị, luôn bật có thể tiêu tốn năng lượng gấp 60 đến 130 lần so với các công cụ AI hiện tại, theo nghiên cứu của Goldman Sachs. Các tác nhân này, sẽ xử lý các tác vụ từ quy trình làm việc của doanh nghiệp đến quản lý các thiết bị thông minh, sẽ thúc đẩy tiêu dùng token AI liên tục như một dịch vụ tiện ích. Các nền tảng có thể định tuyến, đo lường và lập hóa đơn cho mức tiêu thụ này một cách đáng tin cậy và giá rẻ đang định vị mình là các tiện ích thiết yếu cho nền kinh tế AI. Điều này song hành với cuộc chiến cơ sở hạ tầng trong tiền điện tử, nơi các công ty như Circle và Coinbase đang cạnh tranh không chỉ về việc phát hành stablecoin mà còn về việc xây dựng các đường ray thanh toán và thanh toán (như Arc và Base) kiểm soát dòng chảy của nó.
Đối với các nhà đầu tư, sự xuất hiện của lớp phân phối token này mở ra những con đường mới ngoài việc chỉ hỗ trợ các nhà xây dựng mô hình nổi tiếng. Báo cáo của Huayuan xác định hai luận điểm đầu tư chính: hỗ trợ các công ty có khả năng mô hình vượt trội như Alibaba, Tencent và ByteDance, và hỗ trợ các công ty có mối quan hệ khách hàng mạnh mẽ và các kịch bản tiêu thụ cao, đặc biệt là trong tiếp thị, trò chơi và thương mại điện tử. Các công ty như yodo (易点天下) và BlueFocus (蓝色光标) được làm nổi bật vì tiềm năng nhúng các dịch vụ AI dựa trên token trực tiếp vào quy trình làm việc hiện có của khách hàng.
Tuy nhiên, mô hình này không phải là không có rủi ro. Rào cản kỹ thuật thấp để gia nhập việc bán lại API cơ bản mời gọi sự cạnh tranh gay gắt, có thể làm giảm biên lợi nhuận. Các nhà phân phối cũng đối mặt với áp lực vốn đáng kể, vì họ thường cần mua trước dung lượng từ các nhà cung cấp mô hình trong khi cung cấp các điều khoản thanh toán linh hoạt hơn cho các khách hàng hạ nguồn, tạo ra rủi ro nợ xấu. Rủi ro đáng kể nhất là sự phụ thuộc vào các nhà cung cấp mô hình thượng nguồn, những người kiểm soát giá cả và quyền truy cập. Một sự thay đổi chính sách đột ngột từ một nhà cung cấp lớn có thể ngay lập tức phá hủy hoạt động kinh doanh của nhà phân phối, khiến đây trở thành một phân khúc tăng trưởng cao nhưng tiềm ẩn nhiều biến động trong chuỗi giá trị AI.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.