Mô hình Rio 3.5 của IplanRIO bị phát hiện là sự pha trộn 60% Nex-AGI và 40% Qwen

Một mô hình AI do chính phủ Brazil hậu thuẫn, từng được ca ngợi là đột phá mã nguồn mở của châu Mỹ Latinh, đã bị phát hiện chỉ là sự pha trộn trọng số của hai mô hình hiện có, buộc đơn vị phát triển phải đưa ra lời xin lỗi trong vòng 24 giờ.

Mô hình Rio-3.5-Open-397B, được IplanRIO — đơn vị công nghệ thông tin trực thuộc chính quyền thành phố Rio de Janeiro — phát hành vào ngày 15 tháng 6, đã bị phát hiện thực chất là sự pha trộn trọng số theo tỷ lệ khoảng 60:40 giữa Nex-N2-Pro của Nex-AGI và Qwen3.5-397B-A17B của Alibaba, chứ không phải một sản phẩm phát triển nguyên bản. Phát hiện này, được nhóm nghiên cứu AI Nex-AGI công bố trên GitHub, cho thấy 79% phản hồi của mô hình tự nhận dạng là "Nex from Nex-AGI" khi lệnh cố định "You are Rio" bị loại bỏ, và không có phản hồi nào tự nhận là Rio.

"Chúng tôi phát hiện rằng trên tất cả 60 lớp, các tensor trọng số khớp với hỗn hợp 60% Nex-N2-Pro và 40% Qwen ở mức độ tương đồng không thể giải thích bằng quá trình huấn luyện bổ sung thông thường," Nex-AGI cho biết trong báo cáo phân tích của mình. "Không tìm thấy bằng chứng nào về quá trình huấn luyện độc quyền."

IplanRIO ban đầu mô tả Rio 3.5 Open 397B là một mô hình dựa trên Qwen3.5-397B-A17B của Alibaba với quá trình huấn luyện bổ sung, tuyên bố rằng nó vượt trội hơn Qwen gốc trong các bài kiểm tra lập trình và toán học. Mô hình này nhanh chóng thu hút sự chú ý với tư cách là một ứng cử viên AI mã nguồn mở của châu Mỹ Latinh trước khi phân tích trên được công bố. Đáp lại, IplanRIO cho biết họ đã thực hiện "chưng cất theo chính sách" (on-policy distillation) — một quy trình pha trộn các mô hình và huấn luyện trên đầu ra từ một AI mạnh hơn — và rằng tệp được tải lên công khai là một phiên bản tiền chưng cất chưa hoàn chỉnh bị tải nhầm.

Cuộc tranh cãi bùng nổ chưa đầy 24 giờ sau khi mô hình ra mắt trên Hugging Face, khi Nex-AGI công bố phân tích trọng số chi tiết cho thấy cấu trúc nội tại của mô hình gần như không thể phân biệt được với một tổ hợp tuyến tính của hai mô hình tiền nhiệm. Do bản thân Nex-N2-Pro cũng dựa trên dòng Qwen3.5, hai mô hình có kiến trúc đủ tương đồng để cho phép pha trộn trọng số.

Phát triển một mô hình ngôn ngữ lớn từ đầu đòi hỏi lượng dữ liệu huấn luyện khổng lồ và tài nguyên điện toán hiệu năng cao, khiến việc hợp nhất mô hình — một kỹ thuật kết hợp các trọng số đã học theo tỷ lệ cụ thể — trở thành một lối tắt phổ biến. Tuyên bố của IplanRIO về việc thực hiện chưng cất theo chính sách sẽ đại diện cho một lộ trình phát triển hợp pháp nếu được xác minh, nhưng công ty vẫn chưa phát hành phiên bản sau chưng cất như đã hứa.

Sự việc này làm tổn hại đến lòng tin đối với các mô hình mã nguồn mở mới được thổi phồng từ các thị trường AI mới nổi. Đối với các nhà đầu tư theo dõi lĩnh vực LLM mã nguồn mở, sự cố này nhấn mạnh khoảng cách giữa năng lực được tuyên bố và hiệu suất được kiểm chứng — một rủi ro áp dụng cho toàn bộ lĩnh vực dự án AI của chính phủ và tổ chức đang mở rộng nhanh chóng. Qwen của Alibaba, vốn đã là một trong những dòng mô hình mã nguồn mở được áp dụng rộng rãi nhất toàn cầu, nay phải đối mặt với thách thức trong việc kiểm soát việc tái sử dụng thương mại trái phép các trọng số của mình, mặc dù tác động tài chính trực tiếp đến Alibaba Group Holding Ltd. — vốn đang giao dịch ở mức khoảng 11 lần thu nhập dự phóng — có khả năng là rất nhỏ.

Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.