2026年6月2日,Anthropic 为 Claude Code 发布了 Dynamic Workflows(动态工作流)功能。5天后,Jarred Sumner 用它把 Bun 运行时从 Zig 完整重写到 Rust——75万行代码、99.8%测试通过率、仅11天。这不是"AI辅助编程",这是一个人+AI Agent舰队完成了一支工程团队的工作量。这篇文章拆解 Dynamic Workflows 的核心机制、实战用法、以及如何用它让你的一人公司承接规模翻倍的项目。
前言:当 AI Agent 从"工具"变成"工坊"
过去一年,我们见证了 AI 编程工具从补全代码到理解整个项目的跃迁。Claude Code、Hermes Agent、OpenClaw 这些工具让一个开发者能做的事越来越接近一个小团队。
但有一个边界始终没被突破:规模。
一个 Agent 一次能处理的上下文是有限的,能协调的任务数也是有限的。当一个项目需要同时做安全审计、代码审查、文档生成、跨模块重构——这些任务互相独立但又有依赖关系——单个 Agent 要么串行排队(慢),要么丢上下文(乱)。
Dynamic Workflows 解决的正是这个问题。它让 Claude 从"遵循指令的工具使用者"升级为"即时设计工作流架构的工具制造者"。
核心概念:什么是 Dynamic Workflows?
三句话理解
- Claude 自己写编排脚本:你不写流程,Claude 分析任务后即时生成一个"Harness"(编排框架)
- 自动拆解并分配子 Agent:大任务被拆成多个子任务,每个子 Agent 独立执行,结果交叉验证
- 并行执行+结果汇总:多个 Agent 同时工作,Claude 作为 Orchestrator 汇总结果
和已有的 Agent 模式有什么区别?
| 模式 | 工作方式 | 适用场景 | Token 消耗 |
|---|---|---|---|
| 单 Agent 对话 | 一个会话串行执行 | 小型修复、单文件重构 | 低 |
| Sub-Agent | 主动 spawn 子 Agent 处理独立任务 | 多模块并行开发 | 中 |
| /goal 命令 | 给目标,Agent 自主规划执行 | 中规模、结构化任务 | 中-高 |
| Dynamic Workflows | Claude 动态生成编排脚本,大规模并行 | 大型重构、跨语言迁移、安全审计 | 高 |
关键区别:Sub-Agent 是你告诉 Claude "去检查安全漏洞",然后等结果。Dynamic Workflows 是你给一个目标,Claude 自己决定需要哪些 Agent、怎么分工、怎么验证——然后写一个"编排脚本"来执行。
工作机制(拆解)
当你触发 Dynamic Workflows 时,Claude 内部执行以下步骤:
杀手级案例:Bun 从 Zig 到 Rust 的完整重写
这是目前公开报道中 Dynamic Workflows 最令人震撼的应用案例。
数据一览
| 指标 | 数值 |
|---|---|
| 原始语言 | Zig |
| 目标语言 | Rust |
| 生成代码量 | ~750,000 行 |
| 开发时间 | 11天(一说6天即可运行) |
| 测试通过率 | 99.8% |
| 开发者 | Jarred Sumner(1人) |
| 使用工具 | Claude Code + Dynamic Workflows + Opus 4.8 |
为什么这个案例是"分水岭"级别的?
在一个月前,如果有人告诉你"一个人用AI 11天把 JavaScript 运行时从 Zig 重写到 Rust",你会觉得这是科幻。现在它是真实发生的事。
Jarred Sumner 自己在 X 上证实:"Dynamic workflows and adversarial code review was part of what made it possible to rewrite Bun in Rust in 6 days."
几个关键点值得深思:
- Adversarial Code Review(对抗式代码审查):不是简单翻译,而是让多个 Agent 互相审查对方的输出——一个写代码、一个审代码、一个跑测试。三个 Agent 形成的"对抗三角"大幅降低了错误率。
- 99.8%测试通过率:这意味着不是"生成一堆代码碰巧能跑",而是系统性的质量保证。在 75万行的体量下,0.2%的未通过率意味着仅有约1,500行存在问题——这已经超过很多人类团队的交付质量。
- 11天 vs 6天:Jarred 的两种说法(11天首次提交到合并 vs 6天可运行)暗示了Dynamic Workflows 在"快速原型"和"生产交付"两个阶段都发挥了作用。
实战入门:5分钟上手 Dynamic Workflows
前提条件
- Claude Code 已安装(通过 Anthropic 官方安装器或 npm)
- Claude Pro/Max 订阅 或 API Key
- Claude Opus 4.5+ 模型(Opus 4.8 为最佳选择)
步骤1:触发 Dynamic Workflow
最简单的触发方式——在你的 Claude Code 会话中,使用 workflow 关键词:
Claude 会识别到 workflow 关键词,自动进入动态编排模式。
步骤2:创建自定义 Workflow 命令
在项目的 .claude/commands/ 目录下创建 Markdown 文件:
创建 .claude/commands/code-review.md:
然后通过 /code-review 命令调用。
步骤3:理解 Token 成本
Dynamic Workflows 最大的代价是 Token 消耗。一个 HN 用户评论说:"我用了 Dynamic Workflows 做代码审查,90个 Agent 同时跑,第一次用完 Claude Max 额度。"
成本估算(实际场景):
| 任务规模 | 并行 Agent 数 | 预计 Token 消耗 | 预估费用(API) |
|---|---|---|---|
| 小型审查(<5K行) | 3-5 | ~50K | ~$0.75 |
| 中型重构(10-50K行) | 5-15 | ~200K | ~$3 |
| 大型迁移(100K+行) | 20-50 | ~1M+ | ~$15+ |
省钱技巧:
- 能用 Sub-Agent 解决的不要用 Dynamic Workflows
- 先用单 Agent 跑一遍初步分析,确认无误后再用 Workflow 并行
- 对确定性任务用
/goal命令代替(结构化更省 Token)
实战场景:一人公司如何用 Dynamic Workflows 接大项目
场景1:代码审计服务
旧模式:你花2天人工审查代码 → 写报告 → 客户评审 → 修改,单项目5-7天
新模式:
可以同时接2-3个项目,因为你的"实际投入时间"从35小时降到2小时/项目。
场景2:遗留系统迁移
旧模式:不敢接跨语言/跨框架的大规模迁移项目
新模式(参考 Bun 案例):
场景3:多平台同步开发
如果你在同时维护 Web App + iOS + Android,Dynamic Workflows 可以:
常见问题与踩坑指南
Q1:Dynamic Workflows 和 Sub-Agent 到底该用哪个?
判断标准:
- 任务可以清晰拆解为独立子任务 → Sub-Agent(省钱)
- 任务需要"边做边决定"→ Dynamic Workflows(灵活但贵)
- 确定性流程(如CI/CD)→ /goal 命令(最省)
Q2:Token 消耗超出预期怎么办?
一个实际用户的经验:
在
.claude/settings.json中设置maxBudgetUSD上限,比如"maxBudgetUSD": 5。这样即使 Workflow 跑飞了也不会刷爆额度。
另一个技巧:先用单 Agent 做一次"范围评估",确认任务不需要 Dynamic Workflows 的全部能力后再降级为 Sub-Agent 模式。
Q3:如何防止 Adversarial Review 变成"两个Agent互相确认对方的错误"?
从Bun案例学到的:
- 给两个审查 Agent 设置不同的审查标准(一个用OWASP,一个用CWE)
- 让 Orchestrator 在发现分歧时启动第三个"仲裁"Agent
- 关键:两个 Agent 的 prompt 中写入"你的搭档可能犯错,你要找到它忽略的问题"
Q4:Dynamic Workflows 生成的代码质量比单 Agent 高吗?
根据社区反馈:
- 逻辑正确性:高(交叉验证减少了幻觉)
- 代码风格一致性:略低(多Agent可能写出不同风格的代码,需要汇总时统一)
- 边缘情况覆盖:显著更高(并行探索覆盖了更多路径)
建议:用 Dynamic Workflows 生成 + 用单 Agent 做终审(风格统一 + 最终检查)。
Q5:中文项目能用 Dynamic Workflows 吗?
完全可以。Claude Code 对中文代码库的支持良好,但有一个注意事项:
中文代码注释的处理:如果你的代码库有大量中文注释,建议在 Workflow prompt 中指定"保持中文注释不变,只处理代码逻辑"。否则 Agent 可能在代码分析过程中把中文注释翻译成英文。
风险提示
- Token 消耗不可预测:Dynamic Workflows 的自主性意味着每次执行的 Token 消耗可能差异很大,建议设置预算上限
- 不适合小任务:一行代码的 bug 修复不值得启动 5 个 Agent 做交叉验证
- 需要人工最终审查:99.8% 的测试通过率意味着还有 0.2% 的问题——在 75 万行的体量下这是 1500 行,在 5000 行的项目里只有 10 行,但都需要人工确认
- 对代码库理解不如长期维护者:Agent 不了解项目的业务逻辑和历史决策,需要在 prompt 中提供足够的上下文
总结:一个人的工程团队时代已经到来
Dynamic Workflows 不是"更快写代码的工具"——它是工作方式的范式转移。
一个月前,一个独立开发者说自己要"把 JavaScript 运行时从 Zig 重写到 Rust",所有人都会觉得这是天方夜谭。现在这不是科幻,是 Jarred Sumner 和 Claude Code 一起完成的事实。
对 AI 创业者而言,这意味着三个变化:
- 可承接项目的规模上限提高了 10 倍。以前只有 10 人团队才能接的工程合同,现在一个人+AI 可以胜任。
- 项目交付周期的压缩。代码审计从 7 天变 1 天,重构从 3 个月变 2 周。
- "AI 操作能力"成为核心竞争力的分水岭。会用 Dynamic Workflows 的开发者 vs 只会用 AI 补全代码的开发者,差距会越来越大。
行动建议:今天就用一个真实项目试一次 Dynamic Workflows。哪怕只是一个 500 行的小项目,体验一下"让 AI 写编排脚本"是什么样的感受——然后你会理解为什么 Bun 能在 11 天完成重写。
*本文基于 Anthropic 官方博客(2026年6月2日)、HN 讨论(199pts/37cmts)、Jarred Sumner 的 X 证实、MindStudio 技术分析、DevOps.com 报道综合撰写。所有技术细节和命令用法均来自 Claude Code 官方文档和社区验证。*
*本文由AI辅助创作,经人工审核编辑发布。*
本文由AI辅助创作,经人工审核编辑发布
