Khung nền tảng X-Mind của XPENG cho phép xe tự hành mô phỏng các kịch bản giao thông tương lai trước khi đưa ra bất kỳ quyết định nào.
XPENG ra mắt X-Mind, một mô hình thế giới dự đoán cho phép xe tự hành mô phỏng các kịch bản giao thông tương lai thông qua suy luận nội bộ, chuyển đổi lái xe tự động từ phản ứng sang ra quyết định chủ động. Khung nền tảng này đã được trình bày tại Hội thảo CVPR 2026 về Triển khai Mô hình Nền tảng cho Trí tuệ Nhập thể tại Quảng Châu.
"X-Mind đại diện cho một sự thay đổi căn bản từ các hệ thống nhận thức-hành động sang trí thông minh dự đoán," Liu Xianming, Trưởng Trung tâm Trí tuệ Tổng hợp của Tập đoàn XPENG, cho biết. "Các phương tiện giờ đây có thể dự đoán các thay đổi giao thông trong tương lai thông qua mô phỏng nội bộ trước khi thực hiện một thao tác."
Khung nền tảng này kết hợp ba công nghệ. Thought Sketch tạo ra một biểu diễn nhận thức hiệu quả kết hợp bố cục góc nhìn từ trên cao và các tiên nghiệm lái xe, bảo tồn cấu trúc đường, chướng ngại vật, đèn giao thông và ý định định vị trong khi giảm độ phức tạp tính toán. Recurrent Block Diffusion cho phép tạo ra các cảnh tương lai chất lượng cao chỉ trong một lần truyền duy nhất, khắc phục các thách thức về độ trễ của các phương pháp khuếch tán thông thường yêu cầu nhiều bước khử nhiễu lặp đi lặp lại — một lợi thế quan trọng cho các quyết định lái xe thời gian thực ở tốc độ đường cao tốc. Visual Chain-of-Thought tiết lộ cách mô hình dự đoán chuyển động của chướng ngại vật, kết nối làn đường và điều kiện giao thông tương lai trước khi đưa ra quyết định lái xe, cải thiện tính minh bạch cho việc xác thực hệ thống.
X-Mind được huấn luyện trên hàng trăm triệu khung hình dữ liệu lái xe thực tế. XPENG cho biết mô hình này thể hiện độ chính xác dự đoán quỹ đạo được cải thiện, hiệu suất nâng cao trong các kịch bản đuôi dài phức tạp và độ trễ suy luận cực thấp phù hợp với các chip cấp ô tô, mặc dù công ty không tiết lộ nền tảng phần cứng cụ thể được sử dụng để thử nghiệm.
X-Mind Khác Biệt Như Thế Nào So Với Các Hệ Thống Lái Tự Động Truyền Thống
Hầu hết các hệ thống lái xe tự hành hoạt động theo quy trình nhận thức-hành động: camera và cảm biến phát hiện môi trường hiện tại, và hệ thống phản ứng. Tesla Full Self-Driving, NIO Pilot và Li Auto AD Max đều tuân theo các biến thể của cách tiếp cận này. X-Mind bổ sung một lớp mô phỏng chạy nhiều kịch bản tương lai trong nội bộ trước khi thực hiện một thao tác, mang lại cho phương tiện một dạng tầm nhìn ngắn hạn.
Thành phần Visual Chain-of-Thought làm cho quá trình suy luận này trở nên minh bạch, hiển thị những chuyển động chướng ngại vật và thay đổi làn đường mà mô hình đã xem xét. Tính năng giải thích này có thể đơn giản hóa việc xác thực theo quy định tại các thị trường nơi cơ quan an toàn yêu cầu bằng chứng về logic ra quyết định — một mối quan tâm ngày càng tăng khi các hệ thống lái xe tự hành phải đối mặt với sự giám sát chặt chẽ hơn trên toàn cầu.
Hoàn Thiện Lộ Trình AI Vật Lý
X-Mind cùng với X-World và X-Foresight hoàn thiện lộ trình mô hình nền tảng AI Vật lý của XPENG. Cả ba khung nền tảng cho phép phương tiện không chỉ hiểu cách hành động, mà còn hiểu thế giới thay đổi như thế nào sau mỗi hành động. Liu mô tả khả năng này là thiết yếu cho lái xe tự hành thế hệ tiếp theo, nơi các phương tiện phải điều hướng các kịch bản khó lường như người đi bộ băng qua đường bất ngờ hoặc xe cộ nhập làn mà không có tín hiệu.
Thông báo này định vị XPENG đối đầu với Tesla, hãng đã theo đuổi cách tiếp cận mạng nơ-ron đầu-cuối với hệ thống FSD V12, và các đối thủ Trung Quốc NIO và Li Auto, cả hai đang chạy đua triển khai hệ thống định vị đô thị tại các thành phố lớn của Trung Quốc. Sự nhấn mạnh của XPENG vào suy luận dự đoán và ra quyết định có thể giải thích thông qua Visual CoT có thể mang lại lợi thế cho hãng tại các thị trường nơi cơ quan quản lý yêu cầu bằng chứng xác thực an toàn trước khi phê duyệt các tính năng tự hành.
Góc Nhìn Đầu Tư
XPENG, niêm yết trên NYSE với mã XPEV và trên HKEX với mã 9868, có giá cổ phiếu nhạy cảm với các cột mốc lái xe tự hành khi các nhà đầu tư cân nhắc sự khác biệt về công nghệ so với khối lượng giao xe. Khung nền tảng X-Mind, nếu được triển khai trên các xe sản xuất thương mại, có thể hỗ trợ giá bán trung bình cao hơn và củng cố vị thế của XPENG tại thị trường xe điện Trung Quốc, nơi có hơn 50 thương hiệu cạnh tranh. Công ty không cung cấp mốc thời gian cho việc triển khai X-Mind trên các xe tiêu dùng.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.