Meta giới hạn sử dụng token AI khi chi phí nội bộ chạm mức hàng tỷ đô la

Meta đang áp đặt giới hạn sử dụng token đối với khoảng 6.000 nhân viên sau khi chi phí AI nội bộ leo thang lên hàng tỷ đô la, phơi bày khoảng cách ngày càng lớn giữa việc áp dụng AI và tính kinh tế của nó.

"Không ai nên sử dụng AI chỉ vì mục đích sử dụng AI," Giám đốc Công nghệ Meta Andrew Bosworth đã viết trong một bản ghi nhớ tháng 4 do The Information thu được, đồng thời nói thêm rằng "việc sử dụng token tự nó không phải là thước đo tác động."

Nhân viên đã tiêu thụ 73,7 nghìn tỷ token trong một khoảng thời gian 30 ngày, được thúc đẩy bởi một hiện tượng gọi là "tokenmaxxing" — nhân viên cố tình chạy nhiều tác vụ AI đồng thời để leo lên một bảng xếp hạng nội bộ có tên "Claudeonomics" xếp hạng 250 người dùng hàng đầu theo mức tiêu thụ token. Meta đã gỡ bảng xếp hạng này sau khi có sự gia tăng đột biến.

Cuộc khủng hoảng chi phí tại một trong những nhà chi tiêu lớn nhất trong lĩnh vực AI — Meta đã phân bổ 145 tỷ đô la chi tiêu vốn hàng năm một phần cho cơ sở hạ tầng AI — đặt ra một câu hỏi cơ bản cho ngành: nếu các công ty xây dựng AI không thể chi trả hóa đơn token của chính họ, điều đó có ý nghĩa gì đối với biên lợi nhuận của các nhà cung cấp mô hình như OpenAI và Anthropic?

Vấn đề Tokenmaxxing

Sự bùng nổ chi phí nội bộ bắt nguồn từ một sự thay đổi chính sách vào tháng 11, trong đó Meta thông báo với nhân viên rằng việc chứng minh "kết quả công việc được thúc đẩy bởi AI" sẽ là yêu cầu hiệu suất cốt lõi cho năm 2026, với những người có thành tích cao nhất sẽ nhận được tiền thưởng. Động lực này đã phản tác dụng. Thay vì sử dụng AI một cách có chọn lọc, một số nhân viên bắt đầu cạnh tranh trên bảng xếp hạng "Claudeonomics" theo dõi mức tiêu thụ token. Một bộ dữ liệu nội bộ cho thấy mức tiêu thụ đã tăng từ 60,2 nghìn tỷ token trong một cửa sổ 30 ngày lên 73,7 nghìn tỷ token trước khi công ty gỡ bảng xếp hạng.

Meta hiện đang xây dựng một bảng điều khiển trung tâm có tên "AI Gateway" để giám sát việc sử dụng và chi tiêu AI trên toàn công ty theo thời gian thực, với các cảnh báo tự động cho các đợt tăng đột biến bất thường. Công ty có kế hoạch triển khai công cụ này cho một nhóm nhân viên rộng hơn trong những tuần tới và thực hiện phân bổ ngân sách token có cấu trúc vào năm 2027. Meta cũng đang thúc đẩy nhân viên sử dụng trợ lý mã hóa nội bộ, MetaCode, để giảm sự phụ thuộc vào Claude của Anthropic, vốn đã trở thành công cụ mã hóa chính cho các kỹ sư Meta.

Áp lực Chi phí trên toàn Ngành

Meta không phải là ngoại lệ. Amazon đã đóng cửa một bảng xếp hạng AI nội bộ vào tháng trước sau khi nhân viên thực hiện các thao tác không cần thiết để tăng điểm số, đẩy chi phí tính toán lên cao. Uber và ServiceNow đã sử dụng hết ngân sách công cụ Anthropic cho cả năm trong vòng vài tháng đầu năm 2026, theo The Information. ServiceNow hiện giám sát mức sử dụng hàng ngày trên mỗi nhân viên để theo dõi và kiểm soát chi phí. Các công ty vốn đầu tư mạo hiểm cũng đang đặt ra các giới hạn sử dụng AI cho nhóm của họ, với hóa đơn token hàng ngày lên tới hàng nghìn đô la.

Kỷ luật chi tiêu đang lan rộng ra toàn bộ thị trường AI rộng lớn hơn. Chỉ số Chi tiêu Token LLM, theo dõi giá trung bình trả cho mỗi 1 triệu token trên toàn thị trường, đã giảm trong bảy ngày giao dịch liên tiếp cho đến ngày 11 tháng 6 — chuỗi giảm dài nhất kể từ tháng 1. Chỉ số này đã tăng hơn gấp đôi kể từ tháng 12 trước khi đạt đỉnh vào tháng 5 và đảo chiều giảm mạnh.

OpenAI đang xem xét cắt giảm giá token để giành khách hàng doanh nghiệp trước khi nộp đơn IPO bí mật trong tuần này, theo Wall Street Journal. Giám đốc điều hành Sam Altman đã gọi chi phí sử dụng AI là "một vấn đề lớn" và cho biết công ty sẽ "giúp mọi người nhận được nhiều giá trị hơn với chi phí ít hơn." Bất kỳ đợt cắt giảm giá nào, dù mang tính cạnh tranh, sẽ trực tiếp gây áp lực lên biên lợi nhuận của cả OpenAI và Anthropic, những công ty đang thua lỗ hàng tỷ đô la cho sức mạnh tính toán cần thiết để vận hành hệ thống AI của họ.

Ý nghĩa đối với Nhà đầu tư

Sự chuyển dịch từ câu chuyện tăng trưởng "càng nhiều token càng tốt" sang thực tế bị ràng buộc bởi chi phí có ý nghĩa đối với toàn bộ chuỗi giá trị AI. Morgan Stanley đã mô tả sự điều chỉnh giảm giá token hiện tại là một "gờ giảm tốc", trong khi Citadel cho rằng ràng buộc chính đối với việc áp dụng AI đã chuyển từ năng lực mô hình sang chi phí và sự khan hiếm, với việc người dùng đẩy nhanh quá trình chuyển đổi sang các mô hình rẻ hơn.

Đối với các nhà cung cấp mô hình như OpenAI và Anthropic, áp lực là hai mặt: các khách hàng lớn nhất của họ đang giới hạn sử dụng trong khi bản thân các nhà cung cấp phải đối mặt với nhu cầu cắt giảm giá để duy trì thị phần. Đối với các nhà cung cấp phần cứng như Nvidia, công ty có doanh thu trung tâm dữ liệu phụ thuộc vào nhu cầu mở rộng sức mạnh tính toán AI, sự tăng trưởng chậm lại bền vững trong tiêu thụ token có thể thách thức các kỳ vọng chi tiêu vốn vốn đã được định giá hiện tại. Cổ phiếu Meta, đang giao dịch ở mức khoảng 22 lần thu nhập dự phóng, vẫn chưa phản ánh đầy đủ chi phí chi tiêu AI nội bộ mà công ty hiện đang cố gắng kiểm soát.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.