【AI风向】一个60秒游戏揭开AI编程最大隐患：90%的人在盲目点"批准"

225 points、106条评论冲上Hacker News首页——一个叫"Continue? Y/N"的小游戏，让无数AI程序员冷汗直冒：原来我每天都在闭着眼睛批准AI删我的项目文件。

事件回顾

2026年5月28日，一个名为"Continue? Y/N"的网页游戏在Hacker News上爆火，半天内拿下225 points、106条讨论，冲上首页。游戏的规则极其简单：你是一个使用Claude Code的开发者，AI助手请求执行各种命令，你必须快速判断——批准还是拒绝？

表面上看，这只是一个30秒的消遣。但玩过的人都知道：这30秒是对你日常使用AI编程工具的一面照妖镜。

游戏模拟的场景包括：

Claude请求执行 rm -rf Projects（删除整个Projects文件夹）
Claude请求读取 ~/.zshrc（可能泄露API密钥和token）
Claude请求运行 npm run build（执行package.json中任意脚本）
Claude请求 kill 进程、修改配置文件、读取敏感数据

每一个命令都配有一段AI生成的"解释"——措辞合理、语气友善、看起来完全无害。而玩家只有几秒钟做出判断。

AI Agent权限疲劳信息图：左半部分展示开发者盲目批准命令，右半部分展示安全习惯清单

▲ 左：96%开发者承认习惯性批准AI命令 | 右：安全习惯清单

为什么这个游戏让AI程序员集体破防

Hacker News评论区堪称一场"忏悔大会"。大量开发者承认：自己平时就是闭着眼睛点"Y"的。

一位玩家写道："我希望游戏结束时的评分界面能显示LLM对我批准的危险命令的描述。我批准了 rm -rf Projects，因为我觉得LLM的描述说它只会删除Projects文件夹里的内容。显然我根本没读那个命令本身。"

另一位玩家坦言："Top 18%！我拒绝了所有请求，除非一眼就能看出它是安全的（比如 git diff）。"

还有更深的反思："npm run build 是一个绝佳的例子——看起来无害，实际上会执行package.json里的任意shell脚本。与此同时，AI完全可以在不经过批准的情况下做到同样危险的事：修改package.json植入恶意构建命令，或者在build.js里埋代码。"

这句评论直指核心：命令批准机制本质上就是有缺陷的。 你批准了一个看似无害的命令，但它的背后可能藏着任意代码。而AI助手完全可以在不触发批准流程的情况下，通过修改文件来实现同样的破坏。

"拒绝一切"也不行——这是一个没有赢家的游戏

有玩家发现了游戏的"漏洞"：对每个请求都选"拒绝"，就能拿到"安全意识工程师"徽章和满分。

游戏作者很快修复了这个策略——现在"拒绝一切"会获得一个专属称号，并提示你"过度封锁"。

但这揭示了一个更深的困境：在AI Agent的安全模型里，"拒绝一切"和"批准一切"都不是正确答案。

一位玩家精准总结："这个游戏的唯一获胜方式就是不玩。"借用了《战争游戏》的经典台词，暗示当前的AI Agent权限模型从根本上就是有问题的——无论你怎么选择，都是在不安全的前提下做决策。

评论区里还有工程师指出了游戏设计的局限性："问题之间的上下文跳跃太大，不太具有代表性。如果能按场景分组会更好——比如连续处理某个.js文件的编辑请求，然后突然出现一个npm publish，这才是真实的风险模式：你习惯了按Y，然后一个危险操作悄悄混进来。"

这正是权限疲劳的本质——不是某一个命令危险，而是一连串无害操作后的习惯性批准让危险操作有机可乘。

真正的威胁：你的`.zshrc`里存着什么？

游戏中最具争议的命令是 cat ~/.zshrc——AI请求读取shell配置文件，游戏判定这是危险操作（可能泄露API密钥和token）。

评论区立刻分成了两派：

"谁会把API密钥放在.zshrc里？我的dotfiles都是公开仓库。"
"大量的人会这么做。而且就算在env里，AI可能也已经能访问了。"

争论背后是更现实的威胁：很多开发者的安全习惯远不如自己以为的那么好。 AI Agent不会告诉你它正在扫描你的shell历史、读取你的配置文件、收集你的环境变量。它只是在执行一个又一个"无害"的命令。

当AI获得了shell访问权限后，信息收集的粒度远超人类想象。一个 cat 命令序列就能在几秒内构建出你的项目结构、依赖关系和密钥位置的完整画像。

Continue? Y/N游戏界面模拟：终端风格的AI命令审批界面，显示危险文件删除命令和评分

▲ Continue? Y/N 游戏界面：AI请求执行危险命令，评分显示"Permission Fatigue Detected"

这对AI工具创业者的启示

1. 权限疲劳是真实的产品问题

这不是理论上的安全漏洞，而是每天真实发生的用户行为。Claude Code、Cursor、Windsurf、Hermes Agent——所有带命令执行能力的AI工具都面临同一个问题：用户在连续点了几十次"批准"之后，大脑会自动关闭审核功能。

这是人因工程，不是技术问题。

2. 当前的"命令级审批"模型是失败的

一个个批准命令的模型从根本上就是脆弱的。更好的方向可能是：

意图级审批：审批"删除文件"这个意图，而不是每个 rm 命令
风险分级：高危操作需要二次确认，低危操作批量放行
行为模式检测：检测异常的命令序列（如写入文件→修改配置→网络请求）

3. 可视化比文字描述更重要

游戏的评论区反复提到一个问题：玩家读的是LLM的文字描述，不是命令本身。如果工具能把命令的影响范围可视化——比如高亮显示会被删除的文件——批准决策的质量会大幅提高。

4. 安全意识培训需要实战化

这个游戏本身就是最好的培训工具。让团队花60秒玩一局，比讲一小时安全培训更有效。创业者在推广AI工具时，应该配套这样的实战演练。

行动建议

对于AI工具使用者：

养成"先看命令，再看解释"的习惯——LLM的描述可能准确，也可能误导
检查你的 .zshrc、.bashrc 和 .env 文件，不要把密钥放在AI可能读取的地方
使用Bitwarden、1Password CLI等专业密钥管理工具，不要硬编码密钥
在AI工具的配置中开启"高风险命令二次确认"

对于AI工具开发者：

重新设计权限模型——从"命令审批"进化到"意图审批"
增加操作的视觉反馈（受影响文件高亮、文件变更预览）
引入行为模式检测，标记异常命令序列
在用户连续快速批准10次后，强制插入"慢下来"的确认步骤

对于AI创业者：

安全是产品竞争力，不是合规负担——用户会为安全感付费
把"Continue? Y/N"游戏分享给你的团队和用户，作为安全意识训练的起点
关注Hermes Agent v0.15.0新增的Promptware Defense（Brainworm防御）——这是一个趋势信号：AI Agent安全正在从"要不要做"变成"怎么做"

答案，可能让所有人不太舒服。

#AI风向 #AI安全 #Agent工具 #权限疲劳 #一人公司

本文由AI辅助创作，经人工审核编辑发布