Baseten huy động 1,5 tỷ USD, đặt cược vào các mô hình AI nguồn mở rẻ hơn

Khoản huy động vốn 1,5 tỷ USD của Baseten cho thấy chi tiêu AI của doanh nghiệp đang chuyển từ các mô hình đóng cao cấp sang các giải pháp thay thế nguồn mở rẻ hơn.

Baseten, một startup AI xây dựng hạ tầng suy luận cho các mô hình nguồn mở, đang chốt một vòng gọi vốn 1,5 tỷ USD với định giá lên tới 13 tỷ USD, đánh dấu cược mới nhất rằng các doanh nghiệp sẽ chuyển chi tiêu AI từ các mô hình đóng cao cấp sang các giải pháp thay thế rẻ hơn.

"Các mô hình nguồn mở đang trở nên rất, rất tốt," Tuhin Srivastava, đồng sáng lập kiêm giám đốc điều hành của Baseten, cho biết. "Và khi nguồn mở ngày càng tốt hơn, chúng tôi đang phát triển cùng với nó."

Vòng gọi vốn này sử dụng cấu trúc hai tầng, với một số nhà đầu tư tham gia ở mức định giá 11 tỷ USD và những nhà đầu tư khác ở mức 13 tỷ USD, theo công ty. Altimeter Capital, Conviction, Spark Capital, Sands Capital và Wellington Management đang đồng dẫn dắt khoản đầu tư — đây là lần đầu tiên Wellington tham gia vào lĩnh vực suy luận AI. Lớp phần mềm của Baseten nằm trên năng lực điện toán được thuê từ 20 nhà cung cấp đám mây, mang đến cho khách hàng hạ tầng để vận hành, tối ưu hóa và huấn luyện các mô hình nguồn mở mà không cần quản lý phần cứng.

Cược này phản ánh một sự chuyển dịch thị trường rộng lớn hơn. Khoảng cách chất lượng giữa các mô hình nguồn mở và nguồn đóng đã thu hẹp từ hai năm vào năm 2023 xuống chỉ còn vài tuần trên các chuẩn mực kỹ thuật chủ chốt hiện nay, theo các thử nghiệm độc lập. DeepSeek-V4, một mô hình nguồn mở với 1,6 nghìn tỷ tham số, có chi phí khoảng 0,87 USD trên một triệu token đầu ra — gần bằng 1/30 so với mức giá tiên phong từ OpenAI và Anthropic. Nếu các doanh nghiệp chuyển dù chỉ một phần nhỏ chi tiêu AI sang các giải pháp thay thế nguồn mở, các dự báo doanh thu làm nền tảng cho việc xây dựng trung tâm dữ liệu trị giá hơn 200 tỷ USD có thể đối mặt với áp lực nghiêm trọng.

Lớp Suy Luận Trở Thành Một Ngành Kinh Doanh

Baseten là một phần của hệ sinh thái đang phát triển gồm các startup tận dụng sự bùng nổ suy luận — quá trình mà các mô hình AI sử dụng sức mạnh điện toán để phản hồi các truy vấn. Cerebras, công ty thiết kế chip chuyên dụng cho suy luận, đã lên sàn chứng khoán vào tháng 5 và hiện có vốn hóa thị trường gần 50 tỷ USD. Fireworks AI đã huy động vốn vào tháng 10 với mức định giá 4 tỷ USD, và Factory, một startup xây dựng các tác tử lập trình tự động, đạt mức 1,5 tỷ USD vào tháng 4.

Các yếu tố kinh tế đang thúc đẩy việc áp dụng. Một khách hàng của Baseten nói với Srivastava rằng họ đã thực hiện một tác vụ cụ thể với chi phí chỉ bằng 30% so với mô hình nguồn đóng. Hầu hết khách hàng của Baseten sử dụng kết hợp cả mô hình nguồn mở và nguồn đóng, chỉ sử dụng các hệ thống tiên phong cho các tác vụ yêu cầu hiệu suất tốt nhất tuyệt đối trong khi chuyển các khối lượng công việc thông thường sang các giải pháp thay thế rẻ hơn.

"Các mô hình nguồn mở luôn đi sau các mô hình tiên phong vài tháng, nhưng chúng có thể phục vụ nhiều trường hợp sử dụng trong khi tiết kiệm một phần lượng token cho những mô hình tốt nhất tuyệt đối," Oz Nur, một nhà đầu tư tại Wellington Management, cho biết.

Cuộc Tấn Công Nguồn Mở Của Trung Quốc

Các mô hình nguồn mở phổ biến nhất hiện nay đến từ các phòng thí nghiệm Trung Quốc. Dòng V4 của DeepSeek và GLM-5.2 của Z.ai đã ghi nhận điểm chuẩn ngang bằng hoặc vượt các mô hình hàng đầu của Mỹ trong các tác vụ kỹ thuật. GLM-5.2 đạt 81,0 điểm trên Terminal-Bench 2.1, tăng từ 62 điểm của phiên bản trước đó được phát hành vài tuần trước. Mô hình này có cửa sổ ngữ cảnh một triệu token và chi phí khoảng 1/6 so với các mô hình đóng hàng đầu của Mỹ trên mỗi token.

Các công ty Mỹ đang cố gắng bắt kịp. Nvidia gần đây đã ra mắt Nemotron, một dòng mô hình nguồn mở, trong khi Meta tiếp tục phát triển dòng Llama. Nhưng các phòng thí nghiệm Trung Quốc đang lặp nhanh hơn — GLM đã chuyển từ phiên bản 5.0 lên 5.2 trong bốn tháng, với mỗi bản phát hành được huấn luyện trên chip nội địa.

Bài Toán Cho Nhà Đầu Tư

Đối với các nhà đầu tư, bài toán rất đơn giản. Chi phí cho một đầu ra lớp GPT-4 đã giảm từ khoảng 20 USD trên một triệu token vào cuối năm 2022 xuống còn khoảng 0,40 USD ngày nay — mức giảm gần một nghìn lần. Sự giảm phát này đã tạm dừng trong năm nay do tình trạng thiếu hụt bộ nhớ, nhưng năng lực sản xuất chip mới sắp đi vào hoạt động có thể nối lại xu hướng. Trong khi đó, DGX Spark của Nvidia, một máy tính để bàn giá 4.700 USD với 128 gigabyte bộ nhớ hợp nhất, hiện có thể chạy các mô hình lên tới 200 tỷ tham số ở cục bộ.

Nếu các mô hình nguồn mở đạt trình độ tiên phong có thể chạy trên phần cứng cục bộ giá phải chăng, nhu cầu suy luận tập trung — vốn biện minh cho lịch khấu hao 5 năm trên các GPU trung tâm dữ liệu — có thể tăng trưởng chậm hơn dự kiến. Michael Burry đã chỉ ra khoảng 176 tỷ USD khấu hao bị đánh giá thấp trên toàn ngành cho đến năm 2028, và khoảng một nửa số dự án trung tâm dữ liệu tại Mỹ dự kiến cho năm 2026 đã phải đối mặt với việc trì hoãn hoặc hủy bỏ.

Khách hàng của Baseten bao gồm Cursor, Mercor và OpenEvidence. The Information trước đó đã đưa tin về vòng gọi vốn này.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.