Anthropic警告：AI进步每四个月翻一番，正向自我改进迈进

Anthropic表示，人工智能系统正接近无需人类参与即可自行设计和构建继任者的能力，并呼吁在技术超越社会管理能力之前采取协调一致的保障措施。

Anthropic警告称，AI开发速度正以超出预期的步伐加快，其Claude模型目前已在公司生产代码库中贡献了超过80%的合并代码——这一里程碑指向递归式自我改进，即AI系统能够自主推进自身发展。

"我们一直发现，最好的做法是将这一概念社会化，让人们大致了解即将发生的事情，"Anthropic联合创始人杰克·克拉克（Jack Clark）在接受采访时表示。"这里的大新闻是，我们所看到的迹象表明，与某些流行观点相反，AI进步在未来几年将加速，而不是保持不变或减弱。"

根据Anthropic研究所负责人玛丽娜·法瓦罗（Marina Favaro）与克拉克周四发布的一篇博文，这一转变使得每位工程师每季度交付的代码量较公司2021-2025年基线增长了8倍。在缺少明确规范的复杂工程问题上，Claude的成功率在2026年5月攀升至76%——六个月内跃升了50个百分点。该公司内部的Mythos Preview模型在AI模型训练代码优化方面实现了52倍加速，而一名熟练人类开发者在四到八小时的手动重构中通常只能实现4倍改进。

Anthropic表示，"递归式自我改进"可能比大多数机构准备的时间点来得更早。该公司呼吁在前沿AI实验室之间建立协调机制，以便在风险升级时放缓或暂停开发，并警告称，单一公司的单边行动只会转移领导地位，而不会改善全球安全。"如果没有全球协调机制，公司和政府将不得不在竞争和地缘政治压力下，就安全问题做出艰难的决定，"法瓦罗和克拉克写道。

编码瓶颈从编写转向审查

Anthropic的内部数据显示，AI模型的改进大约每四个月翻一番，而非此前观察到的每七个月。人类在每个环节中的角色正在收窄。一旦人类与AI编写的代码质量达到持平——Anthropic预计这将在年内实现——人类将完全停止编写代码，转而仅负责审查。但如果审查者无法跟上Claude的生成速度，人工审查就会成为新的瓶颈。

为应对这一挑战，Anthropic在其开发流程中部署了一个自动化的Claude审查器，用于分析每一个拉取请求（pull request）中的架构缺陷、安全漏洞和回归错误。回顾性分析显示，该自动化层捕捉到了约三分之一的、曾导致claude.ai网站历史性宕机的生产环境错误。

在2026年4月的一个案例中，一名Anthropic工程师部署Claude来解决一类持续存在的API错误。该模型自主运行，交付了超过800个独立的修复方案，将错误率降低了1000倍。负责监督的工程师估计，人类开发者需要花费四年时间才能完成同样的工作。

治理鸿沟与未来走向

OpenAI也发布了其关于递归式自我改进的研究成果，在2025年12月的一篇博文中将其描述为一种潜在的危险现象——如果研究人员不共享相关信息的话。该公司正在为其安全研究团队招聘一名负责递归式自我改进准备工作的研究员。

Anthropic计划在未来几个月内召集政策制定者、研究人员、民间社会团体及其他AI公司展开讨论，探讨如何管理风险并改进协调机制。其研究部门Anthropic研究所将研究支持潜在放缓所需的相关体系。

其影响远不止于AI实验室。Anthropic在周一完成一轮融资后秘密提交了美国首次公开募股申请，该轮融资对其估值为9650亿美元。该公司表示，完全的递归式自我改进"可能会增加人类失去对AI系统控制的风险"。对于投资者而言，这种加速引发了关于竞争护城河的问题：如果AI能够构建更好的AI，那么优势将从专有训练数据和人类工程人才转向算力获取和对齐研究——而Anthropic、OpenAI和Google等资本雄厚的玩家在这些领域拥有结构性优势。

本文仅供参考，不构成投资建议。