AI风向

【AI风向】MCP真的死了吗?实测数据告诉你:Agent工具协议到底该不该用

一个AI创业团队的实测结果:4台MCP服务器占用了Claude 10.5%的上下文窗口,同样一次Linear查询,MCP比CLI多消耗65倍token。但MCP并非全无价值——在数据库安全和团队协作场景,它依然是不可替代的选择。

事件回顾:MCP争议再起

2026年5月29日,加拿大AI保险科技公司Quandri的后端工程师Chloe Kim发表了一篇引发广泛讨论的文章《MCP Is Dead》,在Hacker News上获得了47个赞和38条评论。

这不是MCP第一次被判"死刑"。早在2026年3月,开发者Charlie Schn就发表过《MCP is dead; long live MCP》,在HN上获得295分的高分。但Chloe Kim的文章之所以引起关注,是因为她带来了真实的生产环境数据,而不是理论推演。

MCP(Model Context Protocol)自2024年底由Anthropic推出以来,被誉为"AI生态系统的USB-C接口"。它让LLM能够连接GitHub、Linear、Notion、Slack等外部工具。几乎每个SaaS产品都在登陆页加上"支持MCP"的标签。

但真正每天在生产环境使用MCP的开发者,开始发出不同的声音。

三个致命问题:来自真实生产环境的数据

问题一:上下文窗口杀手

Chloe的团队连接了4台MCP服务器到Claude Code环境,然后测量了实际的工具定义大小:

MCP服务器工具数预估Token
Linear42~12,807
Notion14~4,039
Slack12~3,792
Postgres9~438
合计77~21,077

在Claude的200K上下文窗口中,仅MCP工具定义就占用了10.5%。如果用GPT-4o的128K窗口,这个比例上升到16.5%。

MCP上下文消耗实测:4台服务器·77个工具·21,077 tokens = 10.5%上下文窗口

▲ MCP上下文消耗实测:4台服务器·77个工具·21,077 tokens

!MCP上下文消耗实测:4台服务器·77个工具·21,077 tokens

最糟糕的是Linear服务器——42个工具定义始终加载,但你日常可能只用到get_issuesave_issue两个。

好消息是:Chloe在文章中也更新了一个重要进展——Claude Code已经推出了"Tool Search with Deferred Loading"(工具搜索与延迟加载),将MCP工具按需加载,上下文占用降低了85%以上。但性能、调试和架构方面的问题依然存在。

问题二:可靠性堪忧

MCP不只是消耗token,它的运行稳定性也不太理想:

  • 初始化失败和重复认证:需要单独启动和维护MCP服务器进程
  • 响应变慢:每次工具调用都要经过外部服务器往返
  • 会话中途崩溃:MCP服务器进程随时可能挂掉
  • 权限不透明:不清楚每个工具到底有什么权限

原作者在对比测试中发现:用MCP查询Jira比直接调REST API慢3倍,首次调用(含初始化)更是慢了9.4倍。这不是Jira特有的问题,而是MCP架构性的开销——每台MCP服务器都在LLM和底层API之间增加了一个进程层。

问题三:与CLI/API高度重叠

Chloe做了一个震撼的对比——查询同一个Linear Issue:

  • CLI方式:curl命令约50 token + 响应约150 token = ~200 token
  • MCP方式:工具定义(始终加载)约12,807 token + 工具调用约150 token = ~12,957 token

!CLI vs MCP:同一查询65倍token消耗差异

CLI vs MCP:同一查询65倍token消耗差异

▲ CLI vs MCP:同一查询65倍token消耗差异

65倍的token消耗差异。 而且CLI方式可以使用pipe、jq、grep自由组合,调试时直接在终端复现;MCP方式只能在对话上下文中排错。

MCP的价值:什么时候它还是对的

尽管文章标题是"MCP Is Dead",但Chloe的结论其实非常务实——MCP并没有完全死掉,它在以下场景依然有价值:

1. 没有CLI的服务 纯Web端的SaaS产品,MCP可能是唯一的连接方式。

2. 非开发者用户 对于不使用终端的团队成员,MCP提供了更友好的工具访问方式。

3. 数据库安全场景 这是MCP最强的护城河。CLI方式下LLM可以执行DROP TABLE,而MCP服务器可以在服务端强制只读模式、拦截危险查询。对于生产数据库和共享团队库,MCP的安全防护是不可替代的。

4. 实时双向通信 超出简单请求-响应模式的场景,MCP的协议设计更有优势。

Quandri的真实方案:三种方式并行

最有价值的部分是Chloe分享的实际使用策略——不要强迫只用一种方式:

场景方案原因
日常CLI工具(gh, psql, aws)Bash + CLI零上下文成本,终端直接调试
可重复的多步骤工作流Skills按需加载,嵌入CLI使用说明
无强CLI的服务(Slack, Linear, Notion)MCP唯一连接方式,团队权限管理
生产数据库MCP安全防护,权限控制

关键洞察:教得好比连得多更重要。 如果你已经有一个好用的CLI工具,把它包装成Skill(在里面嵌入CLI命令和认证方式),比架设MCP服务器更加高效。

对AI创业者的启示

这场争论对我们的读者——AI创业者——意味着什么?

1. 不要被"MCP支持"的营销话术迷惑

现在每个SaaS都在宣称"支持MCP",但这不等于它的MCP服务器真的好用。Chloe的文章提醒我们:真正接上线之后,可能会面对初始化失败、会话崩溃和天文数字般的token消耗。

2. CLI优先是最务实的策略

如果你在构建AI Agent工作流,从CLI开始是最安全的选择。LLM已经从man pages和StackOverflow学会了CLI的使用方式,不需要额外的工具定义。等业务验证成功后,再评估是否需要MCP来做安全加固。

3. Skills模式是你应该学习的

Skills介于CLI和MCP之间——把CLI使用说明嵌入一个Skill文件,LLM只在调用时才加载。这种方式兼具了CLI的低成本和MCP的结构化,是当前性价比最高的方案。Hermes Agent和OpenClaw都原生支持Skills模式。

4. 关注上下文预算

不管你选什么工具连接方式,记住一个核心指标:上下文预算。 Chloe的团队替换MCP为Skills后,释放了约21K token的上下文空间——这意味着AI能记住更长的对话历史,做出更准确的决策。在Agent开发中,节约上下文就是提升智力。

行动建议

  • 本周就做:检查你的Agent工作流中哪些MCP服务器是你真正用到的,哪些工具定义是从未被调用过的。把低频使用的服务迁移到CLI+Skill方案。
  • 评估标准:如果一个服务有成熟的CLI且你团队中有人能用终端,优先CLI方案。如果服务只有Web界面或团队中有非技术用户,MCP仍有价值。
  • 关注进展:Anthropic的延迟加载功能正在改善MCP的上下文问题,关注Claude Code的更新日志,MCP可能在2026年下半年迎来真正的成熟。

本文由AI辅助创作,经人工审核编辑发布。参考来源:Quandri Engineering Blog《MCP Is Dead》(2026年5月29日),Hacker News讨论(47 points, 38 comments)。

本文由AI辅助创作,经人工审核编辑发布