騰訊開源 Agent Memory 技術，助力 AI 成本降低 61%

騰訊雲發布其開源 Agent Memory 技術，承諾最高可將 Token 消耗降低 61%。這標誌著在使複雜的 AI 智能體具備經濟可行性及更強能力方面邁出了重要一步。該舉措於 5 月 14 日宣布，旨在滿足 AI 系統在處理長期且複雜的任務時維持上下文和回溯資訊日益增長的需求。

根據公司的公告，該解決方案通過提供短期記憶壓縮和長期個性化記憶能力，針對長任務場景進行了優化。雖然長期記憶功能已於 4 月開放免費使用，但此次新的開源發布重點在於短期記憶壓縮組件。

在多任務連續會話實驗中，騰訊報告稱其解決方案在提高任務成功率的同時，將 Token 消耗降低了多達 61%。這解決了開發者面臨的一項重大運營成本，因為大語言模型根據處理的 Token 數量計費，而具有冗長對話歷史的複雜任務可能會導致成本高得令人望而卻步。

此舉不僅關乎節約成本，更在於賦能能夠處理複雜多步驟任務的下一代 AI。它將騰訊定位為 AI 領域的關鍵推動者，在一個記憶體和存儲正成為關鍵瓶頸及主要增長領域的市場中爭奪開發者的關注。這一趨勢也使美光科技 (NASDAQ: MU) 和閃迪 (NASDAQ: SNDK) 等公司受益。

AI 智能體的“失憶症”難題

創建更有用、更自主的 AI 的關鍵障礙在於記憶問題。目前大多數主流 AI 智能體實際上都患有“失憶症”；它們依賴即時數據，一旦某個對象或資訊不再處於直接輸入範圍內，就會丟失上下文。這阻礙了它們執行需要回溯先前交互或環境狀態的複雜推理或長期任務。正如北京人形機器人創新中心近期推出的“開物”（Wise KaiWu）智能體所凸顯的那樣，業界正通過動態記憶系統推動解決這一問題。該智能體引入了空間和個性化記憶，幫助機器人從被動執行者進化為能夠記住用戶及其偏好的主動助手。

騰訊的 Agent Memory 從軟體角度應對了同樣的挑戰。通過提供短期回溯（剛才談了什麼？）和長期個性化（這個用戶是誰，他們偏好什麼？）的框架，它允許開發者構建更連續、更具上下文感知能力的應用程序。這種能力對於將 AI 從簡單的聊天機器人提升為能在家庭、商業或工業設置中擔任真正助手的複雜智能體至關重要。

AI 軍備競賽的新前線

騰訊的軟體發布是圍繞 AI 基礎設施展開的更宏大硬體熱潮中的戰略佈局。AI 的爆發式增長對運行模型所需的專用記憶體以及存儲數據所需的海量存儲產生了前所未有的需求。閃迪最近的財報顯示，其營收同比增長 251%，達到 59 億美元，這主要受用於 AI 推理系統、向量數據庫和智能體 AI 工作負載的 NAND 快閃記憶體需求的推動。該公司 CEO 指出，NAND 正在成為保持 AI 模型在大規模即時使用中具備經濟可行性的“唯一解決方案”。

這種硬體需求延伸到了高頻寬記憶體 (HBM) 晶片，像美光科技這樣的廠商看到其產品需求飆升，這些產品對於輝達的 AI 平台至關重要。閃迪已簽署了價值超過 420 億美元的多年供應協議，這表明大客戶正在鎖定長期存儲容量。這種對 AI 物理構建模組的強烈需求突顯了像騰訊這樣的軟體解決方案的重要性，這些解決方案旨在更高效地利用硬體。通過減少 Token 消耗，Agent Memory 直接降低了底層基礎設施的運營強度。

騰訊的開源策略旨在將其技術植根於開發者社區，帶動其更廣泛的騰訊雲生態系統的採用。雖然 Agent Memory 工具本身是免費的，但其使用可以帶動其他付費雲服務的消費。這一舉措反映了更廣泛的行業趨勢：高效管理、存儲和回溯 AI 智能體數據的能力已成為關鍵的競爭優勢，推動了從雲服務提供商到構建基礎的半導體和存儲公司等整個技術棧企業的績效。

本文僅供資訊參考，不構成投資建議。