Nước Mỹ doanh nghiệp đã dành cả năm 2025 để thúc đẩy nhân viên sử dụng AI. Giờ đây, các công ty đang phát hiện ra rằng công nghệ này tốn kém hơn cả những lao động mà nó được kỳ vọng sẽ thay thế.
Tesla sẽ giới hạn chi tiêu AI của nhân viên ở mức 200 USD mỗi tuần, bắt đầu từ ngày 6 tháng 7, theo một bản ghi nhớ nội bộ — chỉ vài tháng sau khi ban lãnh đạo khuyến khích tiêu thụ token như một trò chơi để thúc đẩy áp dụng. Đây là một sự đảo ngược phản ánh tình trạng tương tự tại Uber, Microsoft và các công ty khác đang đối mặt với chi phí vượt tầm kiểm soát.
"Khối lượng sử dụng là rất lớn. Giá trị tương ứng lại mờ nhạt hơn nhiều," Giám đốc Vận hành Uber Andrew Macdonald từng phát biểu công khai, sau khi công ty gọi xe này đốt hết toàn bộ ngân sách lập trình AI năm 2026 chỉ trong bốn tháng.
Các kỹ sư phần mềm của Tesla đã tiêu thụ hàng nghìn USD token AI mỗi tuần, theo hai nguồn tin quen thuộc với tình hình sử dụng, dẫn đến việc áp đặt giới hạn 200 USD. Giới hạn này không bao gồm các phiên bản thử nghiệm của sản phẩm xAI — một khoản miễn trừ định hướng những người dùng nặng sang công ty AI của riêng Elon Musk. Uber, nơi 84% kỹ sư áp dụng Claude Code và khoảng 70% mã nguồn được cam kết xuất phát từ AI, đã áp đặt giới hạn 1.500 USD/tháng sau khi cạn kiệt ngân sách hai năm vào tháng 4.
Các đợt siết chặt chi tiêu diễn ra trong bối cảnh Big Tech đã cam kết 740 tỷ USD chi tiêu vốn trong năm nay, tăng 69% so với năm 2025, trong khi hơn 115.000 nhân viên công nghệ đã bị sa thải trong năm 2026. Phép tính đang trở nên nghịch lý: các công ty đang cắt giảm lao động để tài trợ cho trí tuệ nhân tạo — thứ mà đối với nhiều tác vụ vẫn còn đắt đỏ hơn cả những con người mà nó thay thế.
Vấn đề Tokenmaxxing
Amazon đã xây dựng một bảng xếp hạng nội bộ mang tên KiroRank để theo dõi mức sử dụng AI giữa các nhóm kỹ thuật. Bảng này đã âm thầm bị gỡ xuống sau khi nhân viên bắt đầu gian lận — đốt token vào những tác vụ vô nghĩa chỉ để leo hạng. Meta xây dựng một công cụ theo dõi tương tự mang tên Claudeonomics. Amazon khuyến khích nhân viên "tokenmaxx," coi việc tiêu thụ như một chỉ số hiệu suất.
Mô hình này mang tính toàn ngành. Khoảng 95% việc sử dụng AI trong doanh nghiệp vẫn chạy trên các mô hình tiên tiến nhất và đắt đỏ nhất, ngay cả đối với những công việc không đòi hỏi sự phức tạp đó. Microsoft đã chỉ thị cho các kỹ sư trong một bộ phận lớn ngừng sử dụng trợ lý lập trình AI vì hóa đơn trở nên không thể kiểm soát. Một công ty giấu tên đã phải nhận hóa đơn Claude lên tới 500 triệu USD chỉ trong một tháng sau khi ban quản lý quên thiết lập giới hạn sử dụng, theo Axios.
Phó chủ tịch phụ trách học sâu ứng dụng của chính Nvidia, Bryan Catanzaro, thừa nhận rằng chi phí tính toán cho nhóm của ông hiện vượt xa những gì công ty chi cho các nhân viên sử dụng nó. Tuy nhiên, Giám đốc điều hành Nvidia Jensen Huang đã nói rằng một kỹ sư trị giá 500.000 USD nên tiêu thụ ít nhất 250.000 USD token AI hàng năm và công ty đang hướng tới ngân sách token hàng năm 2 tỷ USD cho lực lượng kỹ thuật của mình.
Khoản miễn trừ xAI
Chi tiết hé lộ nhiều nhất trong chính sách của Tesla là những gì giới hạn này bỏ qua. Bằng cách loại trừ các phiên bản thử nghiệm của sản phẩm xAI, công ty đang sử dụng một chính sách chi tiêu để định hướng nhân viên sang Grok và Composer — những công cụ từ công ty AI khởi nghiệp của riêng Musk — trong khi chính các kỹ sư của họ lại âm thầm ưa thích Claude của Anthropic, theo bốn nguồn tin. Musk đã thừa nhận vào năm ngoái rằng xAI "đã không được xây dựng đúng cách," vài tuần sau khi Tesla đầu tư 2 tỷ USD vào công ty này.
SpaceX hiện đang chuẩn bị mua lại công ty mẹ của Cursor là Anysphere với giá 60 tỷ USD trong một thương vụ hoán đổi cổ phiếu dự kiến hoàn tất trong quý này. Các kỹ sư của Tesla đã trở thành những người thử nghiệm sớm các phiên bản chưa phát hành của Grok và Composer, với trưởng nhóm sản phẩm xAI Andrew Milich điều hành các cuộc thảo luận phản hồi trong các kênh Teams nội bộ.
Sự điều chỉnh giá
Mức giá mà các công ty đang trả cho việc sử dụng AI không phải là giá thực. OpenAI, Anthropic, Google và Meta đều đang định giá suy luận (inference) thấp hơn chi phí phục vụ nó, đốt vốn đầu tư mạo hiểm để mua thị phần. OpenAI chi gần 2 USD cho mỗi 1 USD kiếm được từ suy luận và dự báo lỗ 14 tỷ USD trong năm nay, với tổng lỗ lũy kế 44 tỷ USD trước khi có bất kỳ lợi nhuận nào xuất hiện vào năm 2029.
Anthropic đã chuyển khách hàng doanh nghiệp từ gói giá cố định sang thanh toán theo mức sử dụng gắn với chi phí tính toán thực tế vào tháng 4 năm 2026. GitHub vài tuần sau cũng thực hiện thay đổi tương tự với Copilot. Các nhà phân tích dự báo rằng khi giá cả được điều chỉnh để phản ánh chi phí hạ tầng thực tế, hóa đơn AI doanh nghiệp có thể tăng thêm 30 đến 50% so với mức hiện tại.
Thị trường đã nhận thấy sự khác biệt giữa chi tiêu và lợi nhuận vào tháng 6 năm 2026, khi các nhà sản xuất chip mất khoảng 1,3 nghìn tỷ USD giá trị thị trường chỉ trong một phiên giao dịch — mức giảm một ngày sâu nhất đối với chỉ số bán dẫn PHLX kể từ tháng 3 năm 2020. Nvidia, Micron và AMD dẫn đầu các khoản lỗ.
Đối với các nhà đầu tư, câu hỏi đặt ra là liệu AI có thể tự trang trải chi phí trước khi tiền cạn kiệt hay không. Định giá của Tesla dựa trên việc triển khai AI ở quy mô lớn trên mạng lưới Robotaxi và robot hình người Optimus, chứ không phải bán xe — vậy mà công ty không thể quản lý vài nghìn USD chi tiêu token hàng tuần cho mỗi kỹ sư mà không áp đặt giới hạn. Nếu chi phí token đã vượt quá chi phí của những nhân viên mà chúng được kỳ vọng thay thế, thì khoảng cách giữa lời hứa và kinh tế học đang ngày càng nới rộng, chứ không thu hẹp.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.