執行摘要
在人工智能領域的一項重大進展中,兩家美國人工智能實驗室發布了功能強大的開源大型語言模型 (LLM)。Deep Cogito 推出了 Cogito v2.1,一個擁有 6710 億參數的模型,而 艾倫人工智能研究所 (AI2) 則推出了以其對透明度的承諾而著稱的 OLMo 模型。這些發布代表著雙管齊齊的戰略努力,旨在刺激創新和競爭,使美國能夠與中國等國家的國家驅動型人工智能計畫抗衡。
事件詳情
Deep Cogito 發布 Cogito v2.1 的重點是規模和性能。創始人 Drishan Arora 將這個擁有 6710 億參數的混合專家 (MoE) 架構模型描述為「美國公司開發的最佳開放權重 LLM」。在 BF16 格式下,該模型的參數消耗約 1.3 太位元組的儲存空間,這表明部署需要大量的計算資源。
相比之下,艾倫人工智能研究所 在 OLMo 方面採取了不同的方法。雖然它也是一個功能強大的 LLM,但其主要區別在於徹底的透明度。AI2 已將整個框架開源,提供對其訓練數據、開發程式碼和模型權重的完全存取權限。一個關鍵特性是 OLMoTrace,它允許用戶將模型的輸出追溯到影響它們的特定訓練數據。這種「玻璃盒」方法旨在提高 AI 系統的信任度和問責制。
市場影響
這兩個模型的同步發布為 AI 市場帶來了新的動態。它們對主要行業參與者的封閉式、專有模型的統治地位構成了直接挑戰。戰略分歧值得注意:Deep Cogito 正在基於原始計算能力和基準性能進行競爭,吸引那些優先考慮能力的使用者。相反,AI2 正在創建一種以透明度、可審計性和信任為中心的新價值主張,這可能會吸引受監管行業或專注於 AI 安全和倫理的組織。
專家評論
AI2 的完全開放方法,雖然因其透明度而受到讚揚,但對於企業採用而言並非沒有潛在的缺點。根據 Constellation Research Inc. 副總裁兼首席分析師 Andy Thurai 的說法,OLMo 的完全開放性質可能會給公司帶來複雜性。他指出,開放許可和對訓練數據的存取「可能會給想要使用的公司帶來麻煩」,這可能暗示了對智慧財產權、數據隱私和濫用可能性的擔憂。
更廣泛的背景
這些發布最好被理解為美國在更廣泛的地緣政治技術競賽中的「開源策略」。通過廣泛提供強大的人工智能工具,該策略旨在培育一個廣泛且去中心化的創新生態系統,該生態系統可以超越更集中、國家控制的人工智能開發工作。這種方法可以加速美國各行各業的人工智能採用和能力,但其最終成功將取決於開發人員和企業如何駕馭高性能與高透明度人工智能的競爭模型。