Tóm tắt điều hành
Công ty AI Trung Quốc DeepSeek đã phát hành mô hình ngôn ngữ lớn V3.2 của mình, một động thái chiến lược giới thiệu việc giảm chi phí đáng kể cho các dịch vụ AI và tích hợp hỗ trợ cho phần cứng nội địa. Việc ra mắt trực tiếp giải quyết hai yếu tố thị trường quan trọng: chi phí phát triển AI cao và mục tiêu của Trung Quốc là đạt được sự độc lập về bán dẫn. Bằng cách cắt giảm giá API lên đến 70% và tối ưu hóa mô hình cho chip do Trung Quốc sản xuất, DeepSeek sẵn sàng tăng tốc độ áp dụng AI trên khắp đất nước và điều chỉnh lại chuỗi cung ứng phần cứng khỏi các nhà cung cấp nước ngoài như NVIDIA.
Chi tiết sự kiện
Các tính năng chính của việc ra mắt DeepSeek V3.2 là việc hiệu chỉnh lại kinh tế và kỹ thuật của nó. Công ty đã công bố giảm giá API từ 30% đến 70%, giảm đáng kể rào cản tài chính cho các nhà phát triển và doanh nghiệp. Hơn nữa, chi phí cho suy luận ngữ cảnh dài, một nhiệm vụ tính toán chuyên sâu, đã giảm từ 6 đến 10 lần, cho phép các ứng dụng AI phức tạp và mạnh mẽ hơn với một phần nhỏ chi phí trước đây.
Với mặt kỹ thuật, sự phát triển quan trọng nhất là phiên bản V3.2-Exp, được thiết kế rõ ràng để hỗ trợ các bộ xử lý nội địa Trung Quốc. Điều này bao gồm khả năng tương thích với chip từ Huawei Ascend, Cambricon Technology (688256.SS) và Hygon Information Technology (688041.SS). Sự đồng tối ưu hóa phần cứng-phần mềm này đánh dấu một bước quan trọng trong việc tạo ra một hệ sinh thái AI khả thi, tự cung tự cấp trong Trung Quốc, độc lập với công nghệ của Hoa Kỳ.
Tác động thị trường
Việc ra mắt mang lại những tác động đáng kể cho cả thị trường phần mềm và phần cứng. Đối với các nhà phát triển ở Trung Quốc, chi phí thấp hơn có thể sẽ thúc đẩy một làn sóng đổi mới và thử nghiệm, dẫn đến sự tích hợp rộng rãi hơn của AI vào các ứng dụng thương mại. Điều này phản ánh động lực được thấy với các nền tảng như MongoDB (MDB), nơi khả năng truy cập và khả năng mở rộng thân thiện với nhà phát triển thúc đẩy việc áp dụng.
Đối với ngành bán dẫn, đây là một thách thức trực tiếp đối với sự thống trị lâu dài của NVIDIA (NVDA) với tư cách là nhà cung cấp chip AI mặc định. Bằng cách tạo ra một mô hình mạnh mẽ chạy hiệu quả trên các lựa chọn thay thế nội địa, DeepSeek đang tạo ra sức hút thị trường cho phần cứng Trung Quốc. Điều này dự kiến sẽ thúc đẩy định giá và số lượng đơn đặt hàng của các công ty như Cambricon và Hygon, củng cố sự nhiệt tình của thị trường đối với các câu chuyện "NVIDIA của Trung Quốc", như đã thấy gần đây với IPO của Moore Threads.
Chiến lược kinh doanh và định vị
Chiến lược của DeepSeek dường như là một động thái có tính toán để xây dựng một rào cản phòng thủ dựa trên kiểm soát hệ sinh thái khu vực. Bằng cách tối ưu hóa cho phần cứng nội địa, công ty không chỉ phát hành một sản phẩm mà còn nuôi dưỡng một tiêu chuẩn phần cứng-phần mềm tránh phụ thuộc vào nền tảng CUDA của NVIDIA. Cách tiếp cận này chuyển hướng câu chuyện từ việc cạnh tranh về hiệu suất mô hình đơn thuần sang cạnh tranh về tổng chi phí sở hữu và khả năng phục hồi chuỗi cung ứng.
Chiến lược này gợi nhớ cách MongoDB định vị cơ sở dữ liệu dựa trên tài liệu của mình như là "lớp bộ nhớ" thiết yếu cho dữ liệu AI phi cấu trúc, vượt qua các cơ sở dữ liệu SQL truyền thống. Tương tự, DeepSeek đang định vị các mô hình của mình như là lớp phần mềm thiết yếu cho phần cứng AI nội địa của Trung Quốc, tạo ra một mối quan hệ hiệp đồng có lợi cho cả hai bên.
Bối cảnh rộng hơn
Sự phát triển này phải được xem xét trong bối cảnh địa chính trị rộng lớn hơn của cuộc cạnh tranh công nghệ Mỹ-Trung. Khi Hoa Kỳ thắt chặt các biện chế về xuất khẩu công nghệ, Trung Quốc đã tăng cường nỗ lực tự lực về công nghệ. Việc ra mắt DeepSeek V3.2 là một biểu hiện rõ ràng của chiến lược quốc gia này, thể hiện sự tiến bộ trong việc phát triển một ngành công nghiệp AI tích hợp theo chiều dọc.
Tuy nhiên, sự tiến bộ này đi kèm với sự đánh đổi. Nghiên cứu chỉ ra rằng các mô hình suy luận AI tiên tiến cực kỳ tốn năng lượng. Một nghiên cứu đã lưu ý rằng một phiên bản của mô hình DeepSeek đã tiêu thụ năng lượng nhiều hơn 6.000 lần khi tính năng suy luận của nó được kích hoạt. Mặc dù chi phí tài chính của AI đang giảm, nhưng chi phí cơ sở hạ tầng năng lượng và môi trường vẫn là một mối quan tâm đáng kể và ngày càng tăng, một yếu tố sẽ trở nên trầm trọng hơn khi việc áp dụng tăng tốc.