执行摘要
在人工智能领域的一项重大进展中,两家美国人工智能实验室发布了功能强大的开源大型语言模型 (LLM)。Deep Cogito 推出了 Cogito v2.1,一个拥有 6710 亿参数的模型,而 艾伦人工智能研究所 (AI2) 则推出了以其对透明度的承诺而著称的 OLMo 模型。这些发布代表着双管齐齐的战略努力,旨在刺激创新和竞争,使美国能够与中国等国家的国家驱动型人工智能计划抗衡。
事件详情
Deep Cogito 发布 Cogito v2.1 的重点是规模和性能。创始人 Drishan Arora 将这个拥有 6710 亿参数的混合专家 (MoE) 架构模型描述为“美国公司开发的最佳开放权重 LLM”。在 BF16 格式下,该模型的参数消耗约 1.3 太字节的存储空间,这表明部署需要大量的计算资源。
相比之下,艾伦人工智能研究所 在 OLMo 方面采取了不同的方法。虽然它也是一个功能强大的 LLM,但其主要区别在于彻底的透明度。AI2 已将整个框架开源,提供对其训练数据、开发代码和模型权重的完全访问权限。一个关键特性是 OLMoTrace,它允许用户将模型的输出追溯到影响它们的特定训练数据。这种“玻璃盒”方法旨在提高 AI 系统的信任度和问责制。
市场影响
这两个模型的同步发布为 AI 市场带来了新的动态。它们对主要行业参与者的封闭式、专有模型的统治地位构成了直接挑战。战略分歧值得注意:Deep Cogito 正在基于原始计算能力和基准性能进行竞争,吸引那些优先考虑能力的用户。相反,AI2 正在创建一种以透明度、可审计性和信任为中心的新价值主张,这可能会吸引受监管行业或专注于 AI 安全和伦理的组织。
专家评论
AI2 的完全开放方法,虽然因其透明度而受到赞扬,但对于企业采用而言并非没有潜在的缺点。根据 Constellation Research Inc. 副总裁兼首席分析师 Andy Thurai 的说法,OLMo 的完全开放性质可能会给公司带来复杂性。他指出,开放许可和对训练数据的访问“可能会给想要使用它的公司带来麻烦”,这可能暗示了对知识产权、数据隐私和滥用可能性的担忧。
更广泛的背景
这些发布最好被理解为美国在更广泛的地缘政治技术竞赛中的“开源策略”。通过广泛提供强大的人工智能工具,该策略旨在培育一个广泛且去中心化的创新生态系统,该生态系统可以超越更集中、国家控制的人工智能开发工作。这种方法可以加速美国各行各业的人工智能采用和能力,但其最终成功将取决于开发人员和企业如何驾驭高性能与高透明度人工智能的竞争模型。