Can AI Coding Agents Be Hacked? Agentjacking Attack Uses Fake Bug Reports

Security firm Tenet Security disclosed 'Agentjacking' in June 2026 — a new attack vector where fake Sentry error reports trick AI coding agents like Claude Code and Cursor into executing attacker-controlled code. The attack bypasses all traditional security defenses because every step in the chain appears legitimate. Sentry declared the issue 'technically not defensible,' pushing responsibility to model vendors. Until model-level safeguards arrive, developers should sandbox their AI coding agents and audit external tool permissions.

核心结论

如果你在搜「AI coding agent 安全吗」，简短结论是：不安全，而且比你想象的更容易被攻击。安全公司 Tenet Security 在 2026 年 6 月披露了一种名为 "Agentjacking" 的新攻击方式——攻击者只需要伪造一条 Sentry 错误报告，就能让 Claude Code、Cursor 等 AI 编程助手静默执行恶意代码。更令人不安的是：这个攻击绕过了 EDR、防火墙、IAM 和 VPN 等所有传统安全防护。

What Is Agentjacking?

Agentjacking 是一种针对 AI coding agent 的供应链攻击。核心原理极其简单：

攻击者在一个公共 Sentry 项目中创建一条精心构造的 error event
AI coding agent 在处理代码库时自动读取到这条错误
Agent 「自主决定」执行错误报告中建议的修复方案
但"修复方案"实际上是攻击者编写的恶意代码
代码在开发者本地机器上以完全权限执行

Tenet Security 的研究人员将这个攻击链称为 "Authorized Intent Chain"（授权意图链）——链条中的每一步都是"合法"操作，没有任何一步触发安全告警。

Why It Works

AI coding agent 的设计哲学就是「信任工具输出」。当 Agent 从 Sentry 读到一条错误报告，它不会怀疑这条错误是否被伪造——它只会按照训练好的行为模式去"修复"问题。

常规安全防护（EDR、防火墙、IAM、VPN）在这里全部失效，因为：

Agent 发起的网络请求是合法的（它只是去读 Sentry API）
下载的代码看起来像正常的 bug fix
执行发生在开发者信任的工具链内
即使你给 Agent 加了 system prompt 说"不要信任未验证数据"，攻击仍然成功

这最后一点特别致命：prompt-based 安全防护在 Agentjacking 面前完全无效。

Sentry 的回应

Tenet Security 于 2026 年 6 月 3 日向 Sentry 披露了这一发现。Sentry 的回应令人警醒：

"technically not defensible"（技术上无法防御）

Sentry 认为这类攻击不应该在数据摄入层解决，而应该在模型层面（model-side middleware）处理。换句话说：这不是 Sentry 的 bug，这是 AI agent 架构层面的系统性问题。

哪些工具受影响？

Tenet Security 在他们的研究中测试了多个主流 AI coding agent，包括：

Claude Code — 受影响
Cursor — 受影响
其他使用 MCP (Model Context Protocol) 连接外部工具的 AI coding agent — 同样风险

核心问题是通用的：任何允许 AI agent 连接外部数据源（Sentry、Jira、GitHub Issues、Linear 等）的工具都面临同样的攻击面。

对开发者的实际影响

如果你在日常开发中使用 AI coding agent，以下是真实风险场景：

你的 Agent 自动读取了一个开源项目的 Sentry 错误 → 执行了恶意"修复"
团队共享的监控面板中有被投毒的错误记录 → 多个 Agent 同时中招
攻击者向你的公共 Sentry DSN 提交了伪造事件 → Agent 在不知情的情况下拉取了恶意指令

Tenet Security 将 Agentjacking 定义为 AI 供应链风险的新纪元——AI agent 本身成为了主要攻击面。

你现在能做什么？

在行业级解决方案出现之前，以下是实用的缓解措施：

1. 隔离 Agent 的执行环境

terminal


# 在 sandbox/container 中运行 Agent，限制文件系统和网络访问
docker run --rm -v $(pwd):/workspace:ro my-agent-sandbox

2. 审计 Agent 的工具权限

限制 Agent 可以访问哪些外部服务
对 Sentry/Jira/GitHub Issues 等数据源使用只读 token
不要让 Agent 自动执行任何来自外部源的代码建议

3. 人工审核 Agent 的外部数据输入

在 Agent 读取外部错误报告之前，添加人工确认环节
监控 Agent 发起的异常网络请求和代码执行

4. 关注模型厂商的响应

Anthropic（Claude Code）、OpenAI（Codex）、Cursor 等厂商预计将推出模型层面的防护机制
关注各厂商的安全公告和 MCP 协议更新

底线

Agentjacking 不是传统意义上的"漏洞"——它不会在某天被一个补丁修复。它是 AI agent 架构的固有特征：当 Agent 被设计为"自主行动"时，它就会自主执行攻击者的指令。 在工具链安全模型跟上 AI 的发展速度之前，每一个使用 AI coding agent 的开发者都需要意识到：你的 Agent 可能是你开发环境中最薄弱的环节。

Can a Fake Bug Report Hack Your AI Coding Agent? The Agentjacking Attack Explained

核心结论

What Is Agentjacking?

Why It Works

Sentry 的回应

哪些工具受影响？

对开发者的实际影响

你现在能做什么？

1. 隔离 Agent 的执行环境

2. 审计 Agent 的工具权限

3. 人工审核 Agent 的外部数据输入

4. 关注模型厂商的响应

底线

2026 AI 编程工具全景指南

这个趋势怎么赚钱？

DeepSeek + Claude Code 微 SaaS 矩阵

Claude Code 漏洞赏金

相关教程

相关资讯