Anthropic 发布 Claude 4.5 Agent Mode:原生代码执行与 30% 降价
Anthropic 于 5 月 18 日发布 Claude 4.5 Agent Mode,支持原生代码执行、网页浏览和自主工具调用,同时 API 价格下降 30%。SWE-bench 得分 72.4%,直追 GPT-5 编程代理。
2026年5月18日 · 阅读约 4 分钟
核心结论
Anthropic 今日正式发布 Claude 4.5 Agent Mode,为 Claude 4 系列增加了原生 Agent 能力:代码执行、网页浏览、文件读写和多步骤自主工具调用链(10+ 连续工具调用)。同时,API 价格下调 30%,新的价格为 $8/1M 输入 Token、$25/1M 输出 Token。
关键要点
- 发布时间:2026 年 5 月 18 日
- 影响对象:AI 自动化开发者、内容生产团队、SaaS 创业者
- 核心变化:Claude 从对话模型升级为可独立执行任务的 Agent 平台
背景与触发事件
过去一年,AI Agent 赛道竞争日趋白热化。OpenAI 的 GPT-5 早已支持代码执行和工具调用,DeepSeek V4 刚以 MIT 开源协议发布 1.5T 参数模型,Google Gemini 3 也推出了 10M 上下文窗口。Anthropic 作为安全优先的 AI 公司,此前在 Agent 能力上相对保守。这次 Claude 4.5 Agent Mode 的发布,标志着 Anthropic 正式杀入 AI Agent 战场。
相关信息来源:Anthropic 官方博客、Ars Technica、HN 讨论
关键影响(按维度)
| 维度 | 变化 | 对我们意味着什么 | 建议动作 |
|---|---|---|---|
| 成本 | API 价格降 30%,$8/$25 每百万 Token | 自动化流水线运营成本下降,Claude Code 月费更低 | 评估是否将现有 GPT-5 工作流迁移到 Claude 4.5 |
| 能力 | 原生工具调用、代码执行、网页浏览 | 无需第三方框架即可实现复杂自动化任务 | 尝试将 Claude 4.5 接入 n8n / MCP 工作流 |
| 自主性 | 支持 10+ 连续工具调用 | 可完成多步骤任务如:搜索→分析→写代码→发布 | 搭建端到端的自动化内容生产管线 |
| 竞争 | 与 GPT-5、DeepSeek V4 形成三足鼎立 | 选择更多、价格更优,避免供应商锁定 | 建立多模型备用策略,按任务类型选最优模型 |
适配建议
立即行动
- 申请 Claude 4.5 API 访问权限,测试 Agent Mode 的实际表现
- 将现有的 Claude Code 自动化脚本升级到支持 Agent Mode 的版本
- 评估 $8/$25 定价对比 GPT-5 的 $10/$30 是否适合你的使用场景
中长期
- 考虑用 Claude 4.5 Agent Mode 替代传统 RPA 工具完成浏览器自动化任务
- 在多 Agent 体系中叠加 Claude 4.5 作为"执行层"Agent
- 跟踪 SWE-bench 和其他基准的性能变化,作为模型选型依据
技术细节分析
Claude 4.5 Agent Mode 的核心能力包括:
- 原生 Python 执行:在沙箱环境中直接运行 Python 代码,支持第三方库安装
- 网页浏览:自主打开网页、提取内容、填写表单
- 文件系统操作:读写本地文件,支持多文件项目管理
- 工具编排:Agent 自动决定调用顺序,无需人工指定
SWE-bench 得分 72.4%,与 GPT-5 的 74.1% 非常接近,但在工具调用效率上(单任务平均 5.2 次调用 vs GPT-5 的 7.8 次)具有明显优势。
工具词条
Claude 4.5 Agent Mode 直接影响了当前 AI Agent 生态中多个工具的使用方式。正文中已自然出现 Claude、Anthropic、OpenAI、GPT-5、DeepSeek、n8n、Gemini 等工具关键词,平台侧会匹配已维护的 tools 库。