Nvidia Vera Rubin chính thức sản xuất hàng loạt, tăng gấp 10 lần thông lượng AI tác nhân

Nền tảng AI thế hệ thứ ba của Nvidia hứa hẹn thông lượng tác nhân gấp 10 lần thế hệ trước, biến năm rack thành một siêu máy tính duy nhất cho kỷ nguyên tác nhân AI.

Nền tảng Vera Rubin của Nvidia đang được đẩy mạnh sản xuất hàng loạt, với hơn 150 đối tác trong chuỗi cung ứng Đài Loan sản xuất các hệ thống mang lại thông lượng AI tác nhân gấp 10 lần thế hệ Grace Blackwell, công ty cho biết hôm Chủ nhật.

"AI tác nhân là một dạng khối lượng công việc hoàn toàn mới. Một lời nhắc có thể khởi động một hành trình lý luận, truy xuất, sử dụng công cụ và tạo phản hồi gồm hàng nghìn bước," Jensen Huang, nhà sáng lập kiêm giám đốc điều hành của Nvidia, cho biết. "Vera Rubin được xây dựng cho thời khắc này — một cỗ máy AI factory mang lại trí thông minh ở quy mô lớn."

Nền tảng này tích hợp năm rack được thiết kế riêng — hệ thống Vera Rubin NVL72, CPU Vera, GPU Groq 3 LPX, lưu trữ BlueField-4 STX và Ethernet Spectrum-6 SPX — hoạt động như một siêu máy tính AI hợp nhất. Nó giới thiệu Spectrum-X Ethernet Photonics, bộ chuyển mạch quang học đóng gói chung đầu tiên trong ngành với SerDes 200 gigabit mỗi giây, hiện đang được sản xuất. Nvidia tuyên bố mạng dựa trên quang học mang lại hiệu suất năng lượng tốt hơn 5 lần và thời gian hoạt động AI dài hơn 5 lần so với bộ thu phát truyền thống, một lợi thế quan trọng khi các nhà máy AI mở rộng quy mô lên các cụm triệu GPU.

Các lô hàng sản xuất sẽ bắt đầu vào mùa thu này, với Dell Technologies, Hewlett Packard Enterprise, Lenovo và Supermicro là những nhà sản xuất hệ thống đã bắt đầu sản xuất các hệ thống dựa trên Vera Rubin. Việc tăng tốc này diễn ra khi Nvidia dự báo 1 nghìn tỷ USD doanh thu tích lũy từ các thế hệ chip Blackwell và Rubin đến năm 2027, và khi Huang nói với khán giả Đài Bắc vào tuần trước rằng công ty "sẽ còn có giá trị hơn nữa trong ba đến năm năm tới." Cổ phiếu Nvidia đang giao dịch ở mức 32 lần thu nhập trước đó, gần bằng một nửa mức trung vị 61 của năm năm.

Việc tăng tốc sản xuất Vera Rubin đánh dấu thế hệ thứ ba trong thiết kế rack-scale MGX của Nvidia, một bản thiết kế mã nguồn mở cho phép hàng trăm đối tác tại 350 nhà máy ở 30 quốc gia sản xuất các hệ thống này. Mỗi hệ thống Vera Rubin chứa gần 2 triệu linh kiện và có sự tham gia của khoảng 150 đối tác trong chuỗi cung ứng Đài Loan, bao gồm đóng gói tiên tiến, nguồn điện và quản lý nhiệt.

Nền tảng này được thiết kế riêng cho các quy trình AI tác nhân, vốn khác biệt cơ bản so với huấn luyện mô hình truyền thống. Trong khi một lời nhắc duy nhất trong mô hình ngôn ngữ lớn thông thường có thể kích hoạt một lần suy luận, các hệ thống tác nhân có thể tạo ra hàng trăm hoặc hàng nghìn bước lý luận tuần tự, mỗi bước yêu cầu truy xuất, gọi công cụ và tạo phản hồi. Mức tăng thông lượng gấp 10 lần của Vera Rubin giải quyết trực tiếp sự bùng nổ tính toán này.

Chuỗi cung ứng gia tăng chiều sâu tại Đài Loan

Cam kết của Nvidia với Đài Loan đang ngày càng sâu sắc cùng với việc tăng tốc sản xuất Vera Rubin. Huang cho biết tuần trước công ty có kế hoạch chi khoảng 150 tỷ USD mỗi năm tại quốc gia này, tăng từ mức 10 tỷ đến 15 tỷ USD của bốn đến năm năm trước. Một trụ sở chính mới tại Đài Bắc, dự kiến khởi công vào giữa năm 2027 và sử dụng 4.000 nhân viên, củng cố vai trò của hòn đảo này mà Huang gọi là "trung tâm của cuộc cách mạng AI."

Sự tập trung này tiềm ẩn rủi ro. Taiwan Semiconductor Manufacturing Co., xưởng đúc duy nhất của Nvidia cho các chip tiên tiến, hoạt động tại một khu vực mà Trung Quốc tuyên bố chủ quyền. Mỹ đã áp đặt các biện pháp kiểm soát xuất khẩu hạn chế khả năng tiếp cận của Trung Quốc đối với các bộ xử lý AI tiên tiến nhất của Nvidia, mặc dù Huang cho biết cơ hội thị trường CPU trị giá 200 tỷ USD mà ông đã nêu trong cuộc gọi thu nhập của công ty bao gồm cả Trung Quốc. Mỹ đã cấp phép bán chip H200 cho khoảng 10 công ty Trung Quốc, nhưng các quan chức Trung Quốc vẫn chưa phê duyệt các lô hàng đó.

Bảo mật ở quy mô rack

Vera Rubin cũng giới thiệu điện toán bảo mật toàn diện ở cấp độ pod, mã hóa dữ liệu qua các kết nối tốc độ cao và cung cấp khả năng xác thực ở cấp độ phần cứng để đảm bảo các hệ thống không thể bị can thiệp. Nền tảng phần mềm Nvidia DOCA thực thi các chính sách zero-trust, phát hiện mối đe dọa thời gian thực và cách ly đa đối tượng thuê ở tốc độ lên tới 800 gigabit mỗi giây mà không làm hao tốn tài nguyên CPU máy chủ. Các nhà cung cấp đám mây bao gồm CoreWeave, Microsoft Azure, IBM Cloud và Lambda đang áp dụng khung bảo mật này.

Đối với các nhà đầu tư, việc tăng tốc sản xuất Vera Rubin đại diện cho chu kỳ nhu cầu tiếp theo đối với chuỗi cung ứng rộng lớn của Nvidia. Doanh thu trung tâm dữ liệu của công ty đạt 75,2 tỷ USD trong năm tài chính gần nhất, tăng 85% so với cùng kỳ năm trước, và ban lãnh đạo đưa ra dự báo khoảng 91 tỷ USD trong quý hiện tại. Bank of America đưa ra mục tiêu giá 320 USD cho Nvidia, ngụ ý mức tăng khoảng 45% so với mức hiện tại, trong khi Joseph Moore của Morgan Stanley gọi định giá hiện tại là "một điểm vào lệnh tốt đáng ngạc nhiên" trong một báo cáo gần đây gửi khách hàng.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.