Một báo cáo mới của Goldman Sachs cho rằng ngành công nghiệp robot nhân hình đang chuyển trọng tâm từ các bản demo ấn tượng sang thực tế khốc liệt của việc triển khai thương mại, trong đó dữ liệu chất lượng cao nổi lên như một điểm nghẽn chính.
Một báo cáo mới của Goldman Sachs cho rằng ngành công nghiệp robot nhân hình đang chuyển trọng tâm từ các bản demo ấn tượng sang thực tế khốc liệt của việc triển khai thương mại, trong đó dữ liệu chất lượng cao nổi lên như một điểm nghẽn chính.

Một báo cáo mới từ Goldman Sachs đã dội một gáo nước lạnh vào sự cường điệu ngắn hạn đối với robot nhân hình, dự báo rằng việc thương mại hóa quy mô lớn cho 14 công ty hàng đầu Trung Quốc khó có thể bắt đầu trước năm 2027 và phụ thuộc rất lớn vào việc giải quyết điểm nghẽn dữ liệu khổng lồ. Trọng tâm của ngành đã chuyển dịch từ các mô hình Thị giác-Ngôn ngữ-Hành động (VLA) đơn giản sang các ngăn xếp AI phức tạp hơn, hướng tới thực thi, kết hợp VLA với các mô hình thế giới.
"Các cuộc thảo luận trong ngành đã vượt ra ngoài khuôn khổ VLA đơn lẻ, hướng tới một ngăn xếp AI đa phương thức tập trung vào thực thi," Jacqueline Du, một nhà phân tích tại Goldman Sachs, cho biết trong báo cáo được công bố sau khi đến thăm 14 công ty robot Trung Quốc. Báo cáo lưu ý rằng để các mô hình mới này có thể triển khai được, chúng phải được đào tạo trên hàng chục triệu giờ dữ liệu thực tế chất lượng cao, một thách thức mà ngành hiện đang phải đối mặt.
Sự đồng thuận về kỹ thuật đang nhanh chóng hội tụ vào kiến trúc hỗn hợp mới này, nơi một mô hình thế giới đóng vai trò như một lớp chức năng để dự đoán kết quả và xác minh hành động trước khi thực thi, giúp tăng cường tính mạnh mẽ trong thế giới thực. Để cung cấp năng lượng cho điều này, số lượng tham số mô hình đang tăng từ con số hàng tỷ đơn lẻ lên phạm vi 40 tỷ đến 80 tỷ. Bất chấp những tiến bộ kỹ thuật, báo cáo cho biết hầu hết các dự án vẫn ở giai đoạn thử nghiệm khái niệm (PoC), với sự tập trung rõ ràng vào các ứng dụng công nghiệp và hậu cần.
Đối với các nhà đầu tư, báo cáo làm dịu đi những kỳ vọng tức thời trong khi củng cố sự lạc quan dài hạn, gợi ý rằng cột mốc quan trọng là sự chuyển đổi từ các dự án thí điểm khái niệm sang việc triển khai có khả năng mở rộng và mang lại lợi nhuận. Quy trình phức tạp để đảm bảo chất lượng trong khi giảm chi phí sẽ là thách thức trung tâm trong ba đến năm năm tới, cuối cùng quyết định xem công ty nào trong số 14 công ty sẽ dẫn đầu thị trường.
## Từ Công thức Mô hình đến Kiến trúc Dữ liệu
Thách thức cốt lõi đối với các nhà sản xuất robot Trung Quốc không còn chỉ là "công thức" cho các mô hình AI, mà là xây dựng cơ sở hạ tầng để nuôi dưỡng chúng. Theo báo cáo của Goldman, trọng tâm của ngành đã chuyển sang xây dựng các kiến trúc có khả năng mở rộng để có thể tạo ra dữ liệu đa chiều, chất lượng cao từ các tương tác trong thế giới thực một cách đáng tin cậy. Điều này đánh dấu một bước ngoặt đáng kể so với việc chỉ tranh luận về ưu điểm của các loại mô hình khác nhau. Như Tiến sĩ Yao Maoqing, chủ tịch đơn vị AI hiện thân của Agibot, đã lưu ý trong một cuộc phỏng vấn gần đây, có một "khoảng cách lớn giữa các bản demo trong phòng thí nghiệm và triển khai trong thế giới thực", và việc thu thập dữ liệu vật lý về chuyển động, thao tác và thất bại là "cực kỳ tốn kém".
Thách thức thu thập dữ liệu này đang tạo ra hai chiến lược riêng biệt. Một số công ty, như PaXini, đang xây dựng các "nhà máy dữ liệu" tập trung, do chính phủ hỗ trợ, với năm cơ sở như vậy đã đi vào hoạt động trên khắp Trung Quốc. Những công ty khác, bao gồm Galaxea và Spirit AI, đang theo đuổi cách tiếp cận phi tập trung, thu thập dữ liệu từ các hệ thống đã được triển khai và các mô phỏng VR. Bản thân dữ liệu đang trở thành một tài sản quý giá, với các công ty như UBTech kỳ vọng nhu cầu của chính phủ đối với các nhà máy dữ liệu sẽ trở thành động lực doanh thu đáng kể vào năm 2026.
## Con đường Thương mại hóa Thực dụng Bắt đầu vào Năm 2027
Con đường dẫn đến triển khai hàng loạt, dự kiến bắt đầu từ năm 2027 đến 2029, là hoàn toàn thực dụng và dựa trên thực tế công nghiệp. Các cơ hội ban đầu được Goldman xác định là trong các môi trường tiêu chuẩn hóa hoặc bán cấu trúc như sản xuất công nghiệp và hậu cần, tập trung vào các nhiệm vụ như phân loại, xử lý vật liệu và kiểm tra. Điều này phù hợp với hiểu biết của Tiến sĩ Yao từ Agibot, người đã tuyên bố rằng việc triển khai sẽ bắt đầu trong các kịch bản công nghiệp với "ROI rõ ràng hơn" trước khi tiến vào các hộ gia đình.
Sự tập trung vào tính thực tế này cũng mở rộng sang phần cứng. Thay vì theo đuổi mục tiêu tốn kém và phức tạp là bàn tay năm ngón có hình dạng con người hoàn toàn, nhiều nhà sản xuất đang lựa chọn sự kết hợp hiệu quả về chi phí hơn giữa khung gầm có bánh xe với bộ kẹp hai hoặc ba ngón. Cấu hình này được coi là đủ để giải quyết 70% đến 90% các ứng dụng công nghiệp hiện nay. Quy trình áp dụng mang tính phương pháp, thường bao gồm giai đoạn thử nghiệm khái niệm từ ba đến sáu tháng, sau đó là thử nghiệm quy mô nhỏ với ít hơn 50 đơn vị trong tối đa một năm trước khi triển khai thí điểm lớn hơn từ 50 đến 100 đơn vị cho mỗi khách hàng.
Báo cáo nhấn mạnh một xu hướng rõ ràng: ngành công nghiệp robot nhân hình đang vượt qua giai đoạn "robot có thể làm gì" và bước vào giai đoạn "robot có thể tạo ra năng suất hay không". Đối với các nhà đầu tư, điều này có nghĩa là số liệu quan trọng nhất không còn là sự ấn tượng của một video demo, mà là khả năng chứng minh của một công ty trong việc nắm bắt dữ liệu thực tế và đảm bảo triển khai thí điểm trong các quy trình công nghiệp có giá trị cao.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.