DeepSeek V4 nắm giữ lợi thế chi phí gấp 40 lần trong cuộc đua AI tại Trung Quốc

JPMorgan Chase & Co. nhận thấy rằng mô hình ngôn ngữ lớn V4 mới của DeepSeek nắm giữ lợi thế chi phí cấu trúc lên tới 40 lần so với các đối thủ, một khoảng cách thiết lập lại cục diện cạnh tranh cho các nhà lãnh đạo trí tuệ nhân tạo Trung Quốc KNOWLEDGE ATLAS và MINIMAX-W. Khoảng cách hiệu suất bắt nguồn từ việc DeepSeek vận hành mô hình trên cơ sở hạ tầng của chính mình, một lợi thế tự thân (first-party) mà các đối thủ sử dụng kênh đám mây của bên thứ ba không thể sánh kịp.

"Giá khuyến mãi của DeepSeek V4-Pro hiện xác định ranh giới chi phí thấp, trong khi GLM-5.1 đóng vai trò là điểm neo cho sự ưu tiên về chất lượng," một báo cáo của JPMorgan cho biết. "Trọng số mô hình có thể được phân phối tự do, nhưng đường cong chi phí thì không."

Phân tích của ngân hàng về dữ liệu gia tăng kể từ khi ra mắt V4 cho thấy khoảng cách gấp 40 lần về hiệu suất đầu vào truy cập bộ nhớ đệm (cache-hit) giữa API chính thức của DeepSeek và các dịch vụ đám mây của bên thứ ba. Hiệu quả này trong việc tái sử dụng bộ nhớ đệm tiền tố, mật độ lưu lượng và phân bổ tính toán thiết lập một phân khúc chi phí thấp mới trên thị trường. Theo dữ liệu từ OpenRouter, việc sử dụng V4 đang tăng lên, trong khi các mô hình hiện tại từ KNOWLEDGE ATLAS (GLM), MiniMax và thậm chí các phiên bản DeepSeek cũ hơn không thấy sự sụt giảm trên diện rộng, cho thấy thị trường đang mở rộng hơn là hợp nhất.

Báo cáo đưa ra một thách thức chiến lược mới cho hai công ty AI niêm yết công khai chính. Đối với KNOWLEDGE ATLAS, việc kiếm tiền của họ hiện phụ thuộc vào việc mở rộng vị thế dẫn đầu mô hình để chứng minh cho mức giá cao hơn. Đối với MINIMAX-W, lợi thế lịch sử về hiệu suất cơ sở hạ tầng hiện đang bị thách thức trực tiếp. JPMorgan đã xếp hạng Tăng tỷ trọng (Overweight) cho cả hai công ty, với giá mục tiêu là 950 HKD cho KNOWLEDGE ATLAS và 1.100 HKD cho MINIMAX-W, tín hiệu tin tưởng vào khả năng thích ứng của họ nhưng cũng nhấn mạnh áp lực ngày càng tăng.

Chiến lược Cao cấp của KNOWLEDGE ATLAS

KNOWLEDGE ATLAS giờ đây phải nới rộng khoảng cách hiệu suất để bảo vệ mức giá của mình. Mô hình GLM-5.1 của họ hiện đang xếp trên V4 của DeepSeek trong các bài đánh giá, trở thành lựa chọn ưu tiên cho những người dùng nhạy cảm với chất lượng. Để duy trì điều này, JPMorgan cho biết chu kỳ GLM tiếp theo cần mở rộng lợi thế trong các tác vụ phức tạp liên quan đến quy trình làm việc như lập trình dựa trên tác nhân (agent) và suy luận ngữ cảnh dài, nơi chất lượng và độ tin cậy quan trọng hơn chi phí token. Việc không thể nới rộng khoảng cách này có thể buộc họ phải nhường thị trường nhạy cảm về giá cho DeepSeek, giữ lại một mảng kinh doanh nhỏ hơn nhưng có biên lợi nhuận cao hơn.

Thách thức Kinh tế của MINIMAX-W

MINIMAX-W, vốn có lịch sử cạnh tranh về thông lượng và độ trễ, đối mặt với áp lực trực tiếp hơn. API 1 triệu ngữ cảnh, chi phí thấp mới của DeepSeek trên một ngăn xếp cơ sở hạ tầng tự thân hiệu quả cao đã vô hiệu hóa đề xuất giá trị truyền thống dựa trên cơ sở hạ tầng của MiniMax. Theo JPMorgan, thế hệ kế nhiệm mô hình M2.7 của MiniMax sẽ cần chứng minh tính kinh tế hoàn thành tác vụ tốt hơn rõ rệt — ít chu kỳ và lần thử lại hơn dẫn đến tổng chi phí thấp hơn — để duy trì sự khác biệt trước thế hệ kế nhiệm của V4.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.