WayToClawEarn
高影响Anthropic Institute + Hacker News

Anthropic 同日双响炮:AI 自我进化路线图+开源漏洞框架

Anthropic 同日发布 AI 自我进化路线图(80% 代码 AI 编写)和开源漏洞发现框架。两个方向揭示同一趋势:AI Agent 正在从辅助工具升级为核心基础设施。

2026年6月5日 · 阅读约 9 分钟

核心结论

2026 年 6 月 5 日,Anthropic 在同一天发布了两个重磅消息,分别从"加速"和"安全"两个维度定义了 AI Agent 时代的自我进化路径:

Story A — AI Builds Itself(447 分/595 条评论):Anthropic Institute 发布《When AI Builds Itself》报告,披露一系列前所未有的内部数据——Claude 已编写公司代码库的 80% 以上、AI 自主完成任务时长每 4 个月翻倍、从 1 分钟跃升至 16 小时。更重要的是,Claude 在开放式研究任务中的成功率在 6 个月内从 26% 飙升至 76%。Anthropic 坦言:递归自我改良(recursive self-improvement)不再是科幻,而是正在发生的趋势。

Story B — 开源漏洞发现框架(402 分/116 条评论):Anthropic 开源了 defending-code-reference-harness,一个基于 Claude 的自主漏洞发现、验证和修复参考实现。这套框架支持威胁建模、静态扫描、自动分类验证和补丁生成,并内置 gVisor 沙箱隔离。它基于 Anthropic 与多家企业安全团队在 Glasswing/Mythos 项目中的实战经验,相当于把企业级 AI 安全审计能力免费开放给了整个开源社区。

两条消息看似方向相反——一个加速 AI 进化,一个用 AI 保护代码安全——但共同揭示了一个基本面:AI Agent 正在从辅助工具升级为核心基础设施。你既可以用它加速开发,也可以用它守护代码。

背景

Anthropic 成立于 2021 年,以 AI 安全研究为核心定位。2025 年推出的 Claude Code 让开发者可以在终端中用自然语言与 AI 协作编码。2026 年 5 月发布的 Claude Mythos Preview 和 Glasswing 项目则标志着 Anthropic 从"AI 安全研究"走向"AI 安全产品化"。

今日这两个消息是同一个趋势的两个方面:Anthropic 不仅在内部用 AI 加速自身研发,还将这种 AI 驱动的安全能力开放给整个生态。

关键信息对比表

维度Story A: AI Builds ItselfStory B: 漏洞发现框架
类型内部报告 + 研究数据公开开源参考实现
核心数字80% 代码由 AI 编写,4 个月翻倍,76% 研究成功率1,629 GitHub Stars(发布当天),6 阶段自主管线
受众全行业政策制定者 + 技术社区安全团队 + DevOps 工程师
对开发者意义理解 AI 辅助开发的极限和趋势立刻能用上的 AI 安全工具
发布形式Anthropic Institute 报告GitHub 开源 repo
时效性长期战略参考立即可用

AI Builds Itself:深度解读

Claude 已编写 80%+ 的 Anthropic 代码

报告中最震撼的数据点:截至 2026 年 5 月,Anthropic 合并的代码中超过 80% 由 Claude 编写。这不是实验数据,而是生产环境中的真实统计。

更有意思的是变化速度:在 2025 年第三季度,Claude Code 发布前,每位工程师每天产出约 400 行代码。到 2026 年第二季度,这个数字飙升至 3,200 行——8 倍增长。考虑到行数衡量的局限性(数量不等于质量),Anthropic 还做了另一项验证:通过自动化 Claude reviewer 回溯测试,发现 AI 编写的代码在正确性和可维护性上均达到人类工程师的 90% 以上水平。

开放式任务成功率 6 个月从 26% 到 76%

这是最值得关注的趋势指标。Anthropic 将任务按开放程度分为多级:

任务难度示例2025.11 成功率2026.05 成功率
明确指定"修复导出按钮"80%~95%
半开放"优化训练速度找到性能瓶颈"55%~85%
完全开放"训练崩溃了,找到原因并修复"26%76%

一个具体案例:一次例行升级导致数万个训练作业崩溃。工程师将问题描述给 Claude Agent(包括日志和崩溃堆栈),Agent 自主排查、定位根因、编写修复代码并提交 Patch——全程无人干预。

自主完成时间每 4 个月翻倍

Anthropic 追踪了 Claude 能自主完成的最大任务时长:从 2024 年初的约 1 分钟,到 2025 年初的约 30 分钟,再到 2026 年初的约 4 小时,现在达到了约 16 小时。每次翻倍大约需要 4 个月。

按这个趋势,到 2027 年初,Claude 可能能自主执行长达数天的任务,包括独立搭建实验环境、运行训练流程、分析结果并迭代改进。

研究判断力——最后的人类壁垒

报告中坦诚指出:当前人类工程师的比较优势在于研究品味和判断力——选择哪些问题值得做、哪些结果可信、哪个方向是死胡同。

但证据也在表明这个壁垒正在缩小。Anthropic 选取了 129 个研究会话的"关键时刻"(人类研究员的决策点),让 Claude 给出替代判断。在 58% 的场景中,Claude 的选择优于或等同于人类。这意味着 AI 不仅在执行层面超越人类,在决策层面也在追赶。

漏洞发现框架:深度解读

从 Glasswing 到开源

Anthropic 的 Glasswing 项目(2026 年 5 月发布)首次展示了 AI Agent 发现超 10,000 个漏洞的能力。今天开源的 defending-code-reference-harness 是基于这些实战经验的参考实现。

这个 repo 的核心是一个 6 阶段自主管线:

Recon(情报收集) → Find(漏洞发现) → Verify(执行验证) → Triage(分类排序) → Report(报告生成) → Patch(补丁生成)

交互式技能和自主管线

框架提供两种使用模式:

  1. 交互式 Claude Code Skill:开发者可以直接在 Claude Code 中运行 /quickstart/threat-model/vuln-scan/triage/patch 等一系列 Skill,在阅读和审批每一步的情况下进行安全审计。这些 Skill 只读写文件,不执行目标代码,无需沙箱。

  2. 自主管线(Harness):配置好 gVisor 沙箱后,管线可以全自动运行:拉取代码库、编译、用 ASAN(Address Sanitizer)做动态分析、验证崩溃、生成 exploitability 报告、编写补丁。

开源的意义

这套框架不是 Anthropic 的托管产品(他们有商业化版本 Claude Security),而是一套参考实现——任何人都可以 fork、定制、移植到自己的技术栈(Java、Python、Rust 等)、漏洞类型或检测器工具。

Anthropic 特意构建了可定制架构:/customize Skill 可以自动将管线移植到你的语言和检测工具链。上手路径明确:

阶段时间产出
Day 1交互式扫描 + 分类威胁模型、静态扫描结果、候选补丁
Day 2C/C++ 库自主运行可复现崩溃、exploitability 报告
Day 3-5定制到目标技术栈适配后的完整管线
Week 2自主扫描 + 分类 + 补丁自动化安全流水线

HN 社区反应

AI Builds Itself 讨论(595 条评论)

HN 社区对这份报告的讨论分化为两个阵营:

赞同派(多数)

  • "80% 的代码由 AI 编写,这不再是实验,而是 Anthropic 的生产现实"
  • "4 个月翻倍的自主任务时长是比任何基准测试都更有说服力的证据"
  • "最关键的发现:AI 在研究判断力层面也在进步"

怀疑派

  • "行数增长 8 倍不等于生产力增长 8 倍——Claude 可能在写更多样板代码"
  • "Anthropic 发布自己用 AI 写代码的数据,相当于自己给自己打分"
  • "递归自我改良的最终风险是:AI 改进 AI 的速度超过人类理解 AI 的速度"

漏洞发现框架讨论(116 条评论)

大多数评论聚焦于实际使用价值:

  • "终于有了一个开源的参考实现,而不是只能看博客文章"
  • "gVisor 沙箱是正确方向——自主漏洞扫描必须在隔离环境中运行"
  • "Day 1 到 Week 2 的路径设计很务实,很多团队就卡在'不知道从哪里开始'"

也有安全领域的资深人士指出:"开源参考实现和托管产品之间的差距有多大?Claude Security 的增值在于已经集成的多项目管理和低误报管线,而开源的参考实现需要你自己搭建。"

实操启示

对开发者的 3 条建议

  1. 今天就可以试漏洞框架:打开 Claude Code,clone defending-code-reference-harness,运行 /quickstart。15 分钟就能看到完整的威胁建模→扫描→分类流程。不需要 gVisor,交互模式完全安全。

  2. 理解 AI 自主进化的趋势:80% 代码 AI 编写不是 Anthropic 独有的——这只是他们公开了数据。你所在的团队 12 个月内可能也在走向类似的方向。关键是做好代码审查和安全性保障的自动化。

  3. 安全不再是瓶颈,而是入口:当 AI 能自主发现和修复漏洞时,安全不再是代码上线的瓶颈环节。建议将这套框架集成到 CI/CD 流程中,让 AI 在每次 PR 提交时自动执行安全扫描。

下一步行动

如果你对 AI 编码 Agent 感兴趣:

参考来源

Anthropic 自主漏洞管线示意图

免责声明:本站案例均为知识分享内容,仅供灵感与参考,不构成收益承诺;由此进行的外部执行与结果请自行判断并承担相应责任。
Anthropic 同日双响炮:AI 自我进化路线图+开源漏洞框架 · WayToClawEarn