Tencent Cloud đang mở mã nguồn một phần quan trọng trong công nghệ tác nhân AI của mình, một động thái nhằm cắt giảm chi phí vận hành và giải quyết nút thắt chính trong việc phát triển AI tinh vi hơn.
Tencent Cloud đang mở mã nguồn một phần quan trọng trong công nghệ tác nhân AI của mình, một động thái nhằm cắt giảm chi phí vận hành và giải quyết nút thắt chính trong việc phát triển AI tinh vi hơn.

Việc Tencent Cloud phát hành công nghệ Agent Memory mã nguồn mở, hứa hẹn cắt giảm mức tiêu thụ token lên tới 61%, đánh dấu một bước tiến quan trọng trong cuộc đua làm cho các tác nhân AI phức tạp trở nên khả thi về mặt kinh tế và có khả năng hơn. Động thái này, được công bố vào ngày 14 tháng 5, nhắm vào nhu cầu ngày càng tăng đối với các hệ thống AI có thể duy trì ngữ cảnh và truy xuất thông tin qua các tác vụ dài và phức tạp.
Giải pháp này nhắm mục tiêu vào các tình huống tác vụ dài bằng cách cung cấp cả khả năng nén bộ nhớ ngắn hạn và khả năng ghi nhớ cá nhân hóa dài hạn, theo thông báo của công ty. Trong khi chức năng bộ nhớ dài hạn đã được triển khai cho mục đích sử dụng miễn phí vào tháng 4, bản phát hành mã nguồn mở mới tập trung vào thành phần nén bộ nhớ ngắn hạn.
Trong các thử nghiệm phiên làm việc liên tục đa tác vụ, Tencent báo cáo rằng giải pháp của họ đã giảm mức tiêu thụ token tới 61% đồng thời cải thiện tỷ lệ thành công của tác vụ. Điều này giải quyết một chi phí vận hành lớn cho các nhà phát triển, vì các mô hình ngôn ngữ lớn tính phí dựa trên số lượng token được xử lý và các tác vụ phức tạp với lịch sử trò chuyện dài có thể trở nên đắt đỏ một cách khó chấp nhận.
Động thái này không chỉ là tiết kiệm chi phí; nó còn là việc tạo điều kiện cho thế hệ AI tiếp theo có thể xử lý các tác vụ phức tạp, nhiều bước. Nó định vị Tencent như một nhân tố hỗ trợ chính trong không gian AI, cạnh tranh để giành được sự quan tâm của nhà phát triển trong một thị trường mà bộ nhớ và lưu trữ đang trở thành những nút thắt quan trọng và là lĩnh vực tăng trưởng chính, mang lại lợi ích cho các công ty như Micron Technology (NASDAQ: MU) và SanDisk (NASDAQ: SNDK).
Một rào cản quan trọng đối với việc tạo ra AI tự chủ, hữu ích hơn là vấn đề bộ nhớ. Hầu hết các tác nhân AI thế hệ hiện tại thực tế đều bị 'mất trí nhớ'; chúng dựa vào dữ liệu tức thời và mất ngữ cảnh khi một đối tượng hoặc một phần thông tin không còn nằm trong đầu vào trực tiếp của chúng. Điều này ngăn cản chúng thực hiện các suy luận phức tạp hoặc các tác vụ thời gian dài đòi hỏi phải ghi nhớ các tương tác trước đó hoặc trạng thái môi trường. Như đã được nhấn mạnh bởi sự ra mắt gần đây của tác nhân "Wise KaiWu" từ Trung tâm Đổi mới Robot Hình người Bắc Kinh, ngành công nghiệp đang nỗ lực giải quyết vấn đề này bằng các hệ thống bộ nhớ động. Tác nhân của họ giới thiệu bộ nhớ không gian và cá nhân hóa để giúp robot phát triển từ những người thực thi thụ động thành những trợ lý chủ động có thể nhớ người dùng và sở thích của họ.
Agent Memory của Tencent giải quyết thách thức tương tự này từ góc độ phần mềm. Bằng cách cung cấp một khuôn mẫu cho cả việc truy xuất ngắn hạn (chúng ta vừa nói về cái gì?) và cá nhân hóa dài hạn (người dùng này là ai và họ thích cái gì?), nó cho phép các nhà phát triển xây dựng các ứng dụng liên tục và nhận biết ngữ cảnh hơn. Khả năng này rất quan trọng để đưa AI từ các chatbot đơn giản trở thành các tác nhân tinh vi có thể hoạt động như những trợ lý thực thụ trong bối cảnh gia đình, thương mại hoặc công nghiệp.
Bản phát hành phần mềm của Tencent là một bước đi chiến lược trong một sự bùng nổ phần cứng lớn hơn nhiều tập trung vào cơ sở hạ tầng AI. Sự tăng trưởng bùng nổ của AI đang tạo ra nhu cầu chưa từng có đối với cả bộ nhớ chuyên dụng mà các mô hình chạy trên đó và bộ nhớ lưu trữ khổng lồ mà chúng yêu cầu cho dữ liệu. Thu nhập gần đây của SanDisk cho thấy doanh thu tăng vọt 251% so với cùng kỳ năm ngoái lên 59 tỷ USD, được thúc đẩy bởi nhu cầu về bộ nhớ flash NAND được sử dụng trong các hệ thống suy luận AI, cơ sở dữ liệu vector và khối lượng công việc AI tác nhân. Giám đốc điều hành của công ty lưu ý rằng NAND đang trở thành "giải pháp khả thi duy nhất về mặt kinh tế" để giữ cho các mô hình AI có thể truy cập được cho việc sử dụng thời gian thực ở quy mô lớn.
Nhu cầu phần cứng này mở rộng sang các chip nhớ băng thông cao (HBM), nơi các công ty như Micron Technology đang thấy nhu cầu tăng vọt đối với các sản phẩm của họ, vốn thiết yếu cho các nền tảng AI của Nvidia. SanDisk đã đảm bảo các thỏa thuận cung cấp dài hạn trị giá hơn 42 tỷ USD, báo hiệu rằng các khách hàng lớn đang chốt năng lực lưu trữ cho dài hạn. Nhu cầu mãnh liệt này đối với các khối xây dựng vật lý của AI nhấn mạnh tầm quan trọng của các giải pháp phần mềm như của Tencent, nhằm mục đích sử dụng phần cứng đó hiệu quả hơn. Bằng cách giảm mức tiêu thụ token, Agent Memory trực tiếp hạ thấp cường độ vận hành trên cơ sở hạ tầng nền tảng.
Chiến lược mã nguồn mở của Tencent được thiết kế để nhúng công nghệ của mình vào cộng đồng nhà phát triển, thúc đẩy việc áp dụng hệ sinh thái Tencent Cloud rộng lớn hơn của mình. Mặc dù bản thân công cụ Agent Memory là miễn phí, nhưng việc sử dụng nó có thể dẫn đến việc tiêu thụ tăng lên đối với các dịch vụ đám mây trả phí khác. Động thái này phản ánh một xu hướng rộng lớn hơn của ngành, nơi khả năng quản lý, lưu trữ và truy xuất dữ liệu hiệu quả cho các tác nhân AI là một lợi thế cạnh tranh chính, thúc đẩy hiệu suất cho các công ty trong toàn bộ hệ sinh thái công nghệ, từ các nhà cung cấp dịch vụ đám mây đến các công ty bán dẫn và lưu trữ đang xây dựng nền móng.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.