数据反击:185分HN爆帖用实证证明Claude搞坏rsync是一场数据驱动的乌龙
一场从零证据到死亡威胁的反AI暴怒,被2000条bug报告的实证分析彻底瓦解。rsync历史上最差的发布发生在Claude之前,而两个Claude版本在严重度加权bug率上处于历史中段——没有任何统计异常。
2026年6月6日 · 阅读约 7 分钟
数据反击:185分HN爆帖用实证证明"Claude搞坏rsync"是一场数据驱动的乌龙
核心结论
上周一则"Mastodon帖子+GitHub Issue"引爆了开源社区:有人声称rsync项目使用Claude后bug激增,要求维护者"别再Vibe Coding搞坏这个软件"。GitHub Issue 350+评论,HN 80条回帖,死亡威胁和暴力幻想接踵而至。但有人真的去查数据了——开发者Alexis Purslane爬取了rsync所有历史版本的bug报告、Git提交记录和邮件列表,做了完整的统计分析。结果出乎所有人意料:Claude辅助的版本(v3.4.2和v3.4.3)在严重度加权bug率上位于历史分布的中段,没有任何统计异常。
背景:一场从零证据到死亡威胁的"反AI暴怒
2026年5月底,一则Mastodon帖子引爆了开源社区。帖子声称rsync升级后出现了回归问题,且该版本包含Claude辅助的commit。尽管没有任何技术证据,这篇帖子获得了数千次点赞和转发,传播到HN后引发81条评论。事情在5月30日达到顶点——有人直接在rsync仓库开了一个Issue,标题叫"Please Do Not Vibe Fuck Up This Software"。
这个Issue本身没有提交任何bug报告、没有任何技术内容,只是附了一张Mastodon帖子的截图。但它在短时间内积累了350+评论,评论内容从"合理的担忧"一路升级到暴力幻想——有用户发了My Little Pony风格的漫画,画的是自己掐住"项目清洁工"(暗指推动Claude commit的维护者)的脖子。大部分最极端的评论后来已被删除。
rsync项目的主维护者Tridge事后回应说:"这些所谓的'互联网专家'的评论让我想直接去航海,而不是处理这些垃圾。"

分析核心:最坏的一次发布——早在Claude之前
Alexis Purslane建立了一套完整的分析框架:
- 数据源:GitHub Issue + Bugzilla + rsync邮件列表,约2000条bug报告
- 严重度评分:用Qwen 3 35B(零温度)对每条bug按0-100分评级
- 单位:severity-weighted bugs per 10 commits(sev/10c)
- 时间线:按committer date排序,每个release的commit范围精确对应
最关键的发现:rsync历史上最差的一次发布——严重度加权bug率最高的版本——完全是Claude引入之前的产物。那个版本bug频出,但没有AI可以骂,所以没有350条Issue评论,没有死亡威胁,也没有人威胁fork。维护者默默修好,一切如常。
| 统计检验 | p值 | 结论 |
|---|---|---|
| 精确排列检验(Permutation Test) | 0.45 | 随机选两个release有45%概率比Claude组更差 |
| Fisher精确检验 | 不显著 | Claude release不更倾向于落在历史中位数之上 |
| 极端值分析 | 无异常 | Claude release恰好分布在历史IQR左右两侧(一个略低于、一个略高于) |
混淆因素:Rustdesk来了,不是你Claude的错
很多人感觉到rsync变差并非空穴来风,但原因可能完全不是他们想的那样。HN用户zos_kia一语中的:
"粗略一看,这看起来是一个CVE安全修复暴露了自2007年以来就存在的编码错误。看到人们为了这个发疯,简直太滑稽了。"
Lobsters用户jbert更清晰地指出了因果链:
LLMs → 更多已知安全问题 → 需要比平时更多变更 → 比平时更多回归
Tridge本人在回应中也确认了这一点:大量AI生成的CVE报告迫使rsync进行大量快速的攻击面修复。这不是Claude写代码的问题,而是AI安全工具发现了太多漏洞、被迫加速修复的问题。任何大规模的代码变更都会引入回归,这在软件工程中是常识。
实际上,Claude release的commit数量并不多——v3.4.2只有121个commit,v3.4.3只有30个。对比rsync历史上从未被批评过的其他release(如v3.2.6有241个commit),Claude release反而是commit较少的。
但代码变更量(lines of code changed)确实大幅增加了。Claude release修改了更多行代码,但bug数量没有相应增加。翻译成人话:更多代码,同样bug——这不是变差了,这可能是变好了。
为什么人们感觉被骗了?
作者给出了一个尖锐但诚实的答案:不是因为rsync真的变差了,而是因为人们已经决定了要恨AI。
| 认知偏差 | 表现 |
|---|---|
| 确认偏误 | 看到"Claude"标签后就认定bug多了,不再看实际数据 |
| 可归因性偏差 | 版本出现问题→唯一的"明显变化"就是Claude→归因 |
| 叙述谬误 | Mastodon帖子的叙事力量远强于2000条bug报告的数据 |
| 群体极化 | 350+评论的Issue形成回音室,越说越极端 |
Tridge在回应中给出了一个值得深思的总结:
"对于那些说'我是某某大学博士,我告诉你LLM只是随机的统计工具、世界会因此崩溃'的人,我来告诉你:你们的信息已经过时了。软件工程的世界在过去几个月里发生了翻天覆地的变化。IT安全和面对海量漏洞报告的世界在过去几周内已经完全改变。去年学到的东西可能来自另一个星球……底线是,我的确知道LLM大致如何工作,但这并不意味着它们没有用。它确实意味着你需要谨慎——而我在我的能力范围内已经足够谨慎了。"
对AI Agent用户的实操启示
-
数据比感受更可靠。当有人告诉你"AI搞坏了X"时,先问证据在哪里。不是质疑动机,而是要求方法论。没有拿数据的批评,和没有代码的产品宣言一样——都是空气。
-
"更多代码=更多bug"不一定是坏事。如果AI让你能写更多代码解决更多安全问题,bug的绝对数量上升是预期的。真正的指标是缺陷密度(bug/commit或bug/千行代码),不是bug总数。
-
做好"AI羞耻"的心理准备。即使你的AI辅助代码质量不差,你也可能成为下一个被口诛笔伐的目标。提前准备好数据和回应——Tridge有数据支持所以能从容回应,而Mastodon帖子作者只需要一个截图就能掀起风暴。
-
为AI commit添加署名是一把双刃剑。诚实地标注AI辅助commit可以推动透明度,但也给了"反AI猎巫者"现成的弹药。目前的环境下,选择透明标注可能会招致不必要的仇恨。
参考来源
原帖:https://alexispurslane.github.io/rsync-analysis/ HN讨论:https://news.ycombinator.com/item?id=48411635