WayToClawEarn
高影响Anthropic 官方博客

Anthropic 发布 Claude 4.5 Agent Mode:原生代码执行与 30% 降价

Anthropic 于 5 月 18 日发布 Claude 4.5 Agent Mode,支持原生代码执行、网页浏览和自主工具调用,同时 API 价格下降 30%。SWE-bench 得分 72.4%,直追 GPT-5 编程代理。

2026年5月18日 · 阅读约 4 分钟

核心结论

Anthropic 今日正式发布 Claude 4.5 Agent Mode,为 Claude 4 系列增加了原生 Agent 能力:代码执行、网页浏览、文件读写和多步骤自主工具调用链(10+ 连续工具调用)。同时,API 价格下调 30%,新的价格为 $8/1M 输入 Token、$25/1M 输出 Token。

关键要点

  • 发布时间:2026 年 5 月 18 日
  • 影响对象:AI 自动化开发者、内容生产团队、SaaS 创业者
  • 核心变化:Claude 从对话模型升级为可独立执行任务的 Agent 平台

背景与触发事件

过去一年,AI Agent 赛道竞争日趋白热化。OpenAI 的 GPT-5 早已支持代码执行和工具调用,DeepSeek V4 刚以 MIT 开源协议发布 1.5T 参数模型,Google Gemini 3 也推出了 10M 上下文窗口。Anthropic 作为安全优先的 AI 公司,此前在 Agent 能力上相对保守。这次 Claude 4.5 Agent Mode 的发布,标志着 Anthropic 正式杀入 AI Agent 战场。

相关信息来源:Anthropic 官方博客、Ars Technica、HN 讨论

关键影响(按维度)

维度变化对我们意味着什么建议动作
成本API 价格降 30%,$8/$25 每百万 Token自动化流水线运营成本下降,Claude Code 月费更低评估是否将现有 GPT-5 工作流迁移到 Claude 4.5
能力原生工具调用、代码执行、网页浏览无需第三方框架即可实现复杂自动化任务尝试将 Claude 4.5 接入 n8n / MCP 工作流
自主性支持 10+ 连续工具调用可完成多步骤任务如:搜索→分析→写代码→发布搭建端到端的自动化内容生产管线
竞争与 GPT-5、DeepSeek V4 形成三足鼎立选择更多、价格更优,避免供应商锁定建立多模型备用策略,按任务类型选最优模型

适配建议

立即行动

  • 申请 Claude 4.5 API 访问权限,测试 Agent Mode 的实际表现
  • 将现有的 Claude Code 自动化脚本升级到支持 Agent Mode 的版本
  • 评估 $8/$25 定价对比 GPT-5 的 $10/$30 是否适合你的使用场景

中长期

  • 考虑用 Claude 4.5 Agent Mode 替代传统 RPA 工具完成浏览器自动化任务
  • 在多 Agent 体系中叠加 Claude 4.5 作为"执行层"Agent
  • 跟踪 SWE-bench 和其他基准的性能变化,作为模型选型依据

技术细节分析

Claude 4.5 Agent Mode 的核心能力包括:

  1. 原生 Python 执行:在沙箱环境中直接运行 Python 代码,支持第三方库安装
  2. 网页浏览:自主打开网页、提取内容、填写表单
  3. 文件系统操作:读写本地文件,支持多文件项目管理
  4. 工具编排:Agent 自动决定调用顺序,无需人工指定

SWE-bench 得分 72.4%,与 GPT-5 的 74.1% 非常接近,但在工具调用效率上(单任务平均 5.2 次调用 vs GPT-5 的 7.8 次)具有明显优势。

Agent Mode 技术架构图

工具词条

Claude 4.5 Agent Mode 直接影响了当前 AI Agent 生态中多个工具的使用方式。正文中已自然出现 Claude、Anthropic、OpenAI、GPT-5、DeepSeek、n8n、Gemini 等工具关键词,平台侧会匹配已维护的 tools 库。

内链引导

免责声明:本站案例均为知识分享内容,仅供灵感与参考,不构成收益承诺;由此进行的外部执行与结果请自行判断并承担相应责任。