Anthropic 同日双响炮：AI 自我进化路线图 + 开源漏洞框架

Anthropic 同日公开 AI 自进化内部数据（80% 代码由 Claude 编写）+ 开源全自动漏洞框架 Defending Code Reference Harness，AI 开发 AI 的时代已到来。

核心结论

2026 年 6 月 6 日，Anthropic 在同一天发布了两篇重量级文章——一篇来自 Anthropic Institute 的研究报告《When AI Builds Itself》，首次公开了 AI 在自我进化道路上的内部数据；另一篇是开源项目《Defending Code Reference Harness》，一个基于 Claude 的全自动漏洞发现和修复框架。两篇文章虽方向不同，但指向同一个信号：AI 开发 AI 的时代已经到来，且在工程和安全两个维度同时推进。

正文

故事一：AI 自进化路线图——当 AI 开始写自己的代码

Anthropic Institute 最新发布的报告首次披露了公司内部的惊人数据：截至 2026 年 5 月，Anthropic 合并的代码中超过 80% 由 Claude 编写。而在 2025 年 2 月 Claude Code 研究预览版发布前，这个数字还是个位数。

Anthropic AI 自我进化路线图

报告的核心结论可以用几个数据概括：

工程效率：Anthropic 工程师每季度提交的代码量是 2021-2025 年平均水平的 8 倍
自主能力：Claude 在不指定方法的情况下解决开放式任务的成功率从 2025 年 11 月的 50% 提升到 2026 年 5 月的 76%，仅半年提升 26 个百分点
研究能力：在 CORE-Bench（复现研究成果的基准测试）上，AI 系统从 2024 年底的不到 5% 成功率提升到 2026 年 5 月的 57%
AI 独立完成任务的时长：每约 4 个月翻倍，从 2024 年 3 月的约 1 分钟增长到 2026 年 5 月的约 30 分钟

报告中最引人注目的是"自主研究能力"的进步。2026 年 4 月，Anthropic 首次展示了 Claude 端到端运行开放式研究项目的演示——Claude 被赋予一个 AI 安全领域的开放问题后，自主设计实验、执行代码、分析结果并给出结论。

更有意思的是研究判断力的数据：在 129 个真实 Claude Code 会话中（2026 年 1-3 月），独立审查者认为 Claude 选择的下一步研究方向在 30% 的情况下比人类更好，只有 25% 的情况明显不如人类。这在一年前几乎不可想象。

但报告也坦诚指出了局限：Claude 编写的代码在可读性和可维护性上仍略逊于人类编写的代码，尽管差距正在快速缩小。Anthropic 内部也在用 Claude 做自动化代码审查——回顾性分析显示，Claude 审查者发现的 bug 中，约 70% 在人类审查时被忽略。

对 AI Agent 从业者来说，最直接的启示是：AI 开发 AI 不是理论推演，而是已经在发生的现实。如果你还在调试"让 AI 写一个完整函数"的能力，Anthropic 已经到"让 AI 自主探索研究问题"的阶段了。

故事二：开源漏洞框架——当 AI 开始找自己的 bug

同一天，Anthropic 开源了 Defending Code Reference Harness——基于 Claude 的自主漏洞发现和修复框架，在 GitHub 上获得 2,573 星。

Anthropic 开源漏洞框架

这个框架的实际意义远大于一个普通开源项目。它是 Anthropic 从 Glasswing（Claude Mythos 系统的安全评估项目）中总结的最佳实践集合，包含：

Claude Code 技能集：/quickstart、/threat-model、/vuln-scan、/triage、/patch、/customize——从威胁建模到漏洞扫描再到自动补丁，全流程交互式操作
自动化管线（harness/）：基于 Docker 和 ASAN 的 C/C++ 内存漏洞自动发现管线，支持自主扫描、验证、报告和修复
gVisor 沙箱安全：自动化管线运行被沙箱隔离，防止恶意代码对系统造成影响

框架的四天上手计划也很务实：

Day 1：构建威胁模型 + 首轮静态扫描 + 分类
Day 2：在 C/C++ 库上运行参考管线
Days 3-5：根据目标自定义管线
Week 2：启动自主扫描、分类和修复

这与 Anthropic 在产品层面的布局一致——除了开源框架，还提供托管产品 Claude Security（企业版，多项目源码漏洞发现和修复）。

两件事放在一起看

一方面，Anthropic 告诉世界"AI 正在自己写自己 80% 的代码，甚至开始有自己的研究判断力"；另一方面，Anthropic 也开源了"让 AI 自己找自己代码里 bug"的完整框架。

这是一个闭环：AI 写代码 → AI 审查代码 → AI 找漏洞 → AI 打补丁。而人类在这个循环中的角色，正在从"执行者"变成"方向制定者"——这正是 Anthropic Institute 报告的核心论点。

工具词条

这个组合新闻涉及多个关键工具和框架。Claude Code 是 Anthropic 推出的 AI 编码 Agent，也是驱动上述所有能力的核心引擎。Defending Code Reference Harness 开源框架使用 Python 编写，基于 Docker 沙箱运行。Claude Security 是企业级托管产品，适用于需要跨项目管理漏洞的团队。这些工具和技术栈对构建 AI Agent 自动化工作流的开发者具有直接参考价值。

社区反应

HN 上两篇文章合计获得 980+ 分和 160+ 条评论。最热门的评论对 Anthropic 的时机持怀疑态度——"考虑到公司正在准备 IPO，这份报告更像是路演材料"。但也有开发者指出，无论动机如何，80% 代码由 AI 编写这一事实本身就说明了一切。

下一步行动

如果你在搭建 AI Agent 工作流，可以立即做三件事：

阅读 Anthropic Institute 报告原文，重点关注其"自主研究判断力"的数据——这决定了你的 Agent 架构是否应该扩权
尝试 Defending Code Reference Harness 的 /quickstart 技能——30 秒即可在 Claude Code 中体验完整的安全扫描闭环
思考你的项目在"AI 写代码→AI 审查→AI 安全"这条闭环中的位置——你很可能正在经历类似的过程，只是规模不同