Statewright 开源发布：状态机护栏让 AI Agent 从 2/10 失败到 10/10 成功

Statewright 是一个用 Rust 写的开源 AI Agent 状态机护栏框架。在 SWE-bench 测试中，13.8GB 本地模型从 2/10 失败率跃升到 10/10 全过。支持 Claude Code、Codex、Cursor 等主流 AI 编程工具，让 Agent 工作流可约束、可追溯、可审计。

核心结论

2026 年 5 月 17 日，开源项目 Statewright 凭借 124 分登上 Hacker News 首页。这是一个用 Rust 写的 AI Agent 状态机护栏工具，核心理念极其简单但效果惊人：「把工作流的每一步用状态机锁死，Agent 在规划阶段只能读、不能写，在实现阶段才能编辑代码」。

实验数据显示：在 5 个 SWE-bench 任务上，13.8GB 和 19.9GB 的本地模型从2/10 的通过率跃升到 10/10——同样的硬件、同样的任务，加了 Statewright 就全过。

关键要点

发布时间：2026-05-17（HN 首页，124 分）
项目定位：开源 Rust 编写的 AI Agent 状态机护栏框架
核心指标：314 GitHub Stars，MIT 协议，免费可用
最大亮点：让本地小模型（13B+）达到前沿模型的 Agent 可靠性水平

背景与触发事件

AI Agent 的可靠性问题一直是行业顽疾。给 Claude Code 或 Codex 一个开放问题+40 个工具，Agent 往往会陷入"读文件→思考→再读→再想"的死循环（read-loop death spiral），或者在错误时机调用错误工具。

过去解决这个问题的思路是：换更大的模型、写更长的 prompt。Statewright 的作者提出了一种完全相反的方法：「别让模型变强，让问题变小」。用状态机把 Agent 的可操作空间限制在当前阶段需要的工具子集内，而非一次性开放全部。

SEO：Statewright、AI Agent 状态机、Agent 护栏、AI 编程工具可靠性 GEO：TL;DR 式开头，精确数字（2/10→10/10、314 Stars、124 HN 分）

Statewright 核心原理

维度	传统方式	Statewright 方式
思路	让模型更强（更大参数、更长 prompt）	让问题更小（状态机约束工具空间）
规划阶段	Agent 可以随时调用任何工具	❌ 只开放读权限（read-only）
实现阶段	Agent 可自由读写	✅ 解锁编辑权限，限制破坏性操作
测试阶段	Agent 可能跳过测试直接"完工"	✅ 只允许指定测试命令
失败模式	读文件死循环、工具调用混乱	❌ 被状态机拒绝并提示可用操作

效果对比

模型	大小	Bug Fix (26行)	SWE-bench (5任务)
Gemma 3	3.3GB	❌ 失败	❌ 失败
Gemma 4:e2b	7.2GB	✅ 通过*	❌ 失败
GPT-oss:20b	13.8GB	✅ 通过	✅ 通过（5/5）
Gemma 4:31b	19.9GB	✅ 通过	✅ 通过（5/5）
Llama 3.3	42.5GB	✅ 通过	✅ 通过（2/2）

*带专用编辑适配

为什么这对 AI 自动化工作者很重要

Statewright 的意义不仅在于技术细节，更在于它证明了："Agent 不可靠"不一定需要更大模型来解决。

对于使用 Claude Code、OpenAI Codex、Cursor、opencode 的开发者来说：

本地模型成本骤降：以前认为本地模型不够可靠、只能上 GPT-5/Claude 的任务，现在 13.8GB 模型就能搞定
工作流标准化：把 AI Agent 的工作流定义成状态机——从规划到实现到测试到完成，每一步可追溯、可约束、可审计
产出更可控：Agent 不再能"自作主张"调用危险命令，破坏性写操作被状态机天然拦截

正文示例图 — State machine agent control flow diagram

快速上手体验

Statewright 在 Claude Code 中安装只需要三行命令：

code

/plugin marketplace add statewright/statewright
/plugin install statewright
/reload-plugins

然后运行一个 Bug 修复工作流：

code

❯ start the bugfix workflow — fix the failing tests in calc.py
◆ 当前阶段: planning — 先读取代码，只读权限
◆ 代码阅读完毕 → 过渡到 implementing 阶段
◆ 编辑 calc.py: 修改 1 行
◆ 过渡到 testing 阶段
◆ 运行 pytest -x — 7 个测试全部通过
◆ 过渡到 completed — 工作流完成，耗时 46 秒

Statewright 也支持通过 /statewright start bugfix 快捷命令直接启动。免费版可上 statewright.ai 获取 API Key。

工具词条

本篇文章涉及以下 AI 工具：Claude Code、OpenAI Codex、Cursor、Gemma、Llama、Rust、SWE-bench。正文中已自然包含这些工具名称，平台侧会自动匹配已维护的 tools 库并生成工具悬浮卡。

内链引导

想让 AI 工作流更可靠？看教程：AI 自动化工作流质量门：从输出到可信赖结果的实操指南
有人已经在用 AI Agent 赚钱了：Claude Code 48 小时创业，3 个月做到月入 $9,000
不想被 AI Agent 不可靠问题困扰？试试这套自动化方法：n8n + OpenAI 搭建 AI 销售开发系统教程