Tóm tắt điều hành
Trong một bước phát triển quan trọng đối với ngành trí tuệ nhân tạo, hai phòng thí nghiệm AI của Mỹ đã phát hành các mô hình ngôn ngữ lớn (LLM) mã nguồn mở mạnh mẽ. Deep Cogito đã ra mắt Cogito v2.1, một mô hình 671 tỷ tham số, trong khi Viện AI Allen (AI2) đã giới thiệu OLMo, một mô hình nổi bật nhờ cam kết về tính minh bạch. Các bản phát hành này thể hiện một nỗ lực chiến lược kép nhằm kích thích đổi mới và cạnh tranh, định vị Hoa Kỳ chống lại các sáng kiến AI do nhà nước điều khiển từ các quốc gia như Trung Quốc.
Chi tiết sự kiện
Việc Deep Cogito phát hành Cogito v2.1 tập trung vào quy mô và hiệu suất. Mô hình, một kiến trúc Hỗn hợp chuyên gia (MoE) 671 tỷ tham số, được người sáng lập Drishan Arora mô tả là "LLM trọng số mở tốt nhất của một công ty Hoa Kỳ." Ở định dạng BF16, các tham số của mô hình tiêu thụ khoảng 1,3 terabyte dung lượng lưu trữ, báo hiệu một yêu cầu tài nguyên tính toán đáng kể để triển khai.
Ngược lại, Viện AI Allen đã áp dụng một cách tiếp cận khác với OLMo. Mặc dù cũng là một LLM mạnh mẽ, điểm khác biệt chính của nó là sự minh bạch triệt để. AI2 đã mở mã nguồn toàn bộ khuôn khổ, cung cấp quyền truy cập đầy đủ vào dữ liệu huấn luyện, mã phát triển và trọng số mô hình của nó. Một tính năng chính là OLMoTrace, một công cụ cho phép người dùng theo dõi các đầu ra của mô hình trở lại dữ liệu huấn luyện cụ thể đã ảnh hưởng đến chúng. Cách tiếp cận "hộp thủy tinh" này được thiết kế để cải thiện niềm tin và trách nhiệm giải trình trong các hệ thống AI.
Tác động thị trường
Việc ra mắt đồng thời hai mô hình này tạo ra một động lực mới cho thị trường AI. Chúng đặt ra một thách thức trực tiếp đối với sự thống trị của các mô hình độc quyền, đóng từ các nhà sản xuất lớn trong ngành. Sự phân kỳ chiến lược đáng chú ý: Deep Cogito đang cạnh tranh trên cơ sở sức mạnh tính toán thô và hiệu suất chuẩn, thu hút những người dùng ưu tiên khả năng. Ngược lại, AI2 đang tạo ra một giá trị mới tập trung vào tính minh bạch, khả năng kiểm toán và niềm tin, điều này có thể thu hút các ngành được quản lý hoặc các tổ chức tập trung vào an toàn và đạo đức AI.
Bình luận của chuyên gia
Cách tiếp cận hoàn toàn mở của AI2, mặc dù được ca ngợi về tính minh bạch, nhưng không phải không có những nhược điểm tiềm ẩn đối với việc áp dụng của doanh nghiệp. Theo Andy Thurai, Phó Chủ tịch và Nhà phân tích chính tại Constellation Research Inc., tính chất hoàn toàn mở của OLMo có thể gây ra sự phức tạp cho các công ty. Ông lưu ý rằng giấy phép mở và quyền truy cập vào dữ liệu huấn luyện "có thể gây đau đầu cho các công ty muốn sử dụng nó", có thể ám chỉ những lo ngại về sở hữu trí tuệ, quyền riêng tư dữ liệu và khả năng lạm dụng.
Bối cảnh rộng hơn
Những bản phát hành này được hiểu rõ nhất là một "canh bạc mã nguồn mở" của Mỹ trong cuộc đua công nghệ địa chính trị rộng lớn hơn. Bằng cách cung cấp rộng rãi các công cụ AI mạnh mẽ, chiến lược này nhằm mục đích thúc đẩy một hệ sinh thái đổi mới rộng lớn và phi tập trung có thể vượt qua các nỗ lực phát triển AI tập trung hơn, do nhà nước kiểm soát. Cách tiếp cận này có thể đẩy nhanh việc áp dụng và khả năng AI trên nhiều ngành công nghiệp của Hoa Kỳ, nhưng thành công cuối cùng của nó sẽ phụ thuộc vào cách các nhà phát triển và doanh nghiệp điều hướng các mô hình AI cạnh tranh về hiệu suất cao và minh bạch cao.