CEO của Perplexity: Hiệu suất token sẽ quyết định người thắng cuộc trong cuộc đua AI

Một thước đo hiệu suất duy nhất có thể quyết định công ty AI nào đạt định giá cao nhất — và nó không liên quan gì đến doanh thu.

Giám đốc điều hành Perplexity, Aravind Srinivas, cho biết hôm thứ Tư rằng những công ty có thể tối đa hóa "giá trị trên mỗi watt trên mỗi token người dùng" sẽ nổi lên thành những người chiến thắng dài hạn trong trí tuệ nhân tạo, đề xuất một khuôn khổ chuyển trọng tâm của nhà đầu tư từ tăng trưởng doanh thu sang hiệu quả vận hành. Ông cho biết trong một cuộc phỏng vấn với CNBC, thước đo này kết hợp độ chính xác, độ trễ, chi phí, quyền riêng tư và trí thông minh thành một tỷ lệ duy nhất về sản lượng kinh tế trên mỗi đơn vị năng lượng tiêu thụ.

"Bất kỳ ai có thể tối đa hóa điều đó — cân bằng độ chính xác, độ trễ, chi phí, quyền riêng tư và trí thông minh — sẽ là người chiến thắng dài hạn," Srinivas nói. Ông đối lập khuôn khổ của mình với những gì ông mô tả là tăng trưởng doanh thu ngắn hạn được thúc đẩy bởi định giá cao, cho rằng một số nhà cung cấp mô hình "trông như thể họ đang kiếm được nhiều tiền vì mô hình của họ rất đắt," nhưng doanh thu đó có thể không chuyển thành lợi thế cạnh tranh bền vững.

Những bình luận này được đưa ra khi chi phí token AI đã giảm mạnh từ khoảng 20 USD mỗi triệu token vào cuối năm 2022 xuống còn khoảng 0,40 USD mỗi triệu token vào giữa năm 2025, theo dữ liệu từ Epoch AI. Tuy nhiên, tổng chi tiêu AI của doanh nghiệp lại đi theo hướng ngược lại: chi tiêu AI trung bình hàng tháng của doanh nghiệp tăng lên 85.500 USD vào năm 2025 từ 63.000 USD vào năm 2024, và gần một nửa số công ty hiện chi hơn 100.000 USD mỗi tháng cho cơ sở hạ tầng hoặc dịch vụ AI. Sự phân kỳ — token rẻ hơn thúc đẩy tiêu thụ tăng theo cấp số nhân — phản ánh hiệu ứng Jevons paradox mà CEO Mercor, Brendan Foody, gần đây đã mô tả khi ông nói rằng startup của mình hiện chi nhiều hơn cho token AI so với lương nhân viên.

Thước đo hiệu suất có thể định hình lại định giá AI

Khuôn khổ của Srinivas xuất hiện trong bối cảnh ngành công nghiệp AI đang đối mặt với sự mất kết nối ngày càng lớn giữa chi tiêu và lợi nhuận. Nghiên cứu cho thấy 85% công ty gặp khó khăn trong việc chứng minh lợi tức đầu tư rõ ràng từ các triển khai AI, ngay cả khi năng lực mô hình được cải thiện với tốc độ nhanh chóng. Giám đốc điều hành Uber, Andrew Macdonald, gần đây cho biết ông vẫn chưa thấy mối liên hệ tương xứng giữa chi tiêu token AI tăng lên và mức tăng năng suất, nhấn mạnh thách thức trong việc chuyển đổi tiến bộ kỹ thuật thành kết quả kinh doanh có thể đo lường được.

Bản thân Perplexity cũng minh họa cho khoảng cách định giá mà thước đo của Srinivas nhằm giải quyết. Startup tìm kiếm AI này được định giá khoảng 20 tỷ USD, theo các báo cáo — một phần nhỏ so với mức định giá ước tính 1.000 tỷ USD của Anthropic và mức giá trên 850 tỷ USD của OpenAI. Bằng cách đề xuất một khuôn khổ coi trọng hiệu suất hơn quy mô, Srinivas đang đưa ra lập luận rằng cách tiếp cận tinh gọn hơn của Perplexity trong quản lý chi phí suy luận có thể mang lại lợi nhuận trên mỗi đồng vượt trội ngay cả khi không sánh được với ngân sách tính toán thô của các đối thủ lớn hơn.

Công ty đồng thời đang mở rộng dấu ấn sản phẩm của mình. Perplexity Computer, một AI agent có khả năng thực thi các tác vụ đa bước phức tạp trong thời gian dài, hiện đã có sẵn trên Microsoft Windows sau khi ra mắt trên nền tảng Mac của Apple vào tháng 2. Phiên bản Windows có thể truy cập Word, Outlook và các tệp thiết bị cục bộ, mở rộng phạm vi của Perplexity từ tìm kiếm dựa trên đám mây sang năng suất trên thiết bị — một động thái đặt nó vào vị thế cạnh tranh trực tiếp với Copilot của Microsoft và Codex agent của OpenAI, mà Microsoft gần đây đã tích hợp với MXC (Execution Containers) — một sandbox bảo mật mới để triển khai agent an toàn.

Việc mở rộng sang Windows mang lại cho Perplexity quyền truy cập vào hệ điều hành chi phối phần lớn máy tính để bàn doanh nghiệp, nhưng cũng đặt startup này vào thế cạnh tranh với tham vọng AI của chính Microsoft. Project Solara của Microsoft, được công bố tại Build tuần này, hình dung một tương lai nơi các thiết bị chạy AI agent thay vì các ứng dụng truyền thống, trong khi nền tảng MXC của họ cung cấp khả năng bảo mật cấp độ kernel cho các agent tự động — cơ sở hạ tầng mà agent của Perplexity sẽ cần hoạt động trong đó trên các máy Windows.

Đối với các nhà đầu tư, thước đo hiệu suất của Srinivas mang đến một lăng kính mới để đánh giá các công ty AI vào thời điểm ngành công nghiệp đang chi hàng trăm tỷ USD cho cơ sở hạ tầng với khả năng thu hồi vốn không chắc chắn. Các công ty có thể chứng minh chi phí suy luận thấp hơn trên mỗi kết quả thành công — dù thông qua kiến trúc mô hình, tối ưu hóa phần cứng hay thiết kế quy trình làm việc thông minh hơn — có thể đạt được định giá cao ngay cả khi doanh thu tuyệt đối thua kém các đối thủ lớn hơn. Câu hỏi đặt ra là liệu thị trường có chấp nhận một thước đo mà phạt chính quy mô đã thúc đẩy những mức tăng ngoạn mục nhất của ngành AI hay không.

Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.