一个 Claude Code 会话只能做一件事?Sub-Agent 让你同时跑 16 个并行任务,每个用不同模型、不同权限、不同上下文——这才是 2026 年 AI 编程的正确打开方式。
▲ Sub-Agent 架构图:Orchestrator-Worker模式,主Agent分派4个并行子Agent,每个独立上下文+权限
为什么你需要关心 Sub-Agent
如果你是 AI 创业者或者一人公司开发者,大概率已经用 Claude Code 做日常开发了。但你可能也遇到过这些场景:
- 改一个功能,Claude 要读 30 个文件,上下文窗口撑到 80%,响应越来越慢
- 想同时做代码审查和写单元测试,但 Claude 一次只能做一件事
- 简单任务(比如格式化代码)也要用昂贵的 Opus 模型跑,API 账单心在滴血
- 重构一个模块,Claude 迷失在庞大的代码库里,改到一半开始胡说八道
这些问题的根因都一样:你把所有工作都塞进了一个会话。
Claude Code 的 Sub-Agent 系统就是为解这个问题而生的。它让一个"主教练"Agent 把任务拆解、分派给多个"专业选手",每个专业选手在自己的独立上下文里工作,互不干扰,还能并行跑。
Anthropic 在 2026 年 4 月对 Sub-Agent 系统做了一次重大升级,随后在 6 月又发布了 Dynamic Workflows(动态工作流),让主 Agent 可以在单次会话中规划并派发数十甚至上百个并行子任务。
Sub-Agent 到底是什么
一句话:Sub-Agent 是 Claude Code 主会话创建的独立 Claude 实例。
每个 Sub-Agent 拥有:
- 独立的上下文窗口:不会污染主会话的上下文
- 独立的工具权限:可以限制只读、禁止写文件、禁止执行命令
- 独立的模型选择:简单的活用便宜的 Haiku,复杂的活才用 Opus
- 独立的生命周期:干活→返回结果→销毁,不留痕迹
从架构上看,它是典型的 orchestrator-worker 模式:
四个 Sub-Agent 同时运行,而不是排队依次执行。主 Agent 收集所有结果,整合后继续工作。
实战一:使用内置 Sub-Agent
Claude Code 自带两个内置 Sub-Agent,开箱即用。
Explore Agent(代码库探索)
这是最常用的内置 Sub-Agent。它用 Haiku 模型,只有只读权限(Read、Grep、Glob、Bash),专门用来快速搜索和理解代码库。
触发方式:在 Claude Code 对话中直接说:
Claude 会自动调用 Task 工具,生成一个 Explore Sub-Agent 去做这件事。Sub-Agent 会在自己的上下文里读取所有相关文件,然后返回结构化的总结——主会话的上下文完全不受影响。
什么时候用 Explore Agent:
- 刚进入一个新项目,需要理解代码结构
- 重构前需要找到所有受影响的调用点
- 排查 bug 需要追踪数据流
- 任何"读大量文件但不需要修改"的场景
Code Reviewer Agent(代码审查)
第二个内置 Sub-Agent,用 Sonnet 模型,同样只读权限,专门做代码审查。
触发方式:
Reviewer Agent 会读取修改的文件,按安全性和健壮性标准审查,返回结构化的审查报告。
实战二:创建自定义 Sub-Agent
内置 Agent 虽好,但真正的威力在于自定义 Sub-Agent。通过 CLAUDE.md 配置文件,你可以创建专为你的项目定制的"专业选手"。
配置文件位置
在项目根目录创建 .claude/agents/ 目录,每个 Sub-Agent 一个 .md 文件:
实战示例:单元测试生成器
创建 .claude/agents/test-writer.md:
使用方式:在 Claude Code 对话中说:
Claude 会自动找到 test-writer 配置,生成一个 Sub-Agent,用 Sonnet 模型,在自己的上下文里完成所有工作——读源文件、写测试、跑测试、修复失败、返回结果。
实战示例:安全审计员
注意 disallowedTools 字段——这明确禁止了 Write、Edit、Bash,确保审查 Agent 绝对不会改代码。
▲ 模型分层成本对比:Haiku搜索 /usr/bin/bash.25 vs Sonnet审查 vs Opus架构 5,分层可省75-85%
实战三:并行执行——真正的效率倍增器
Sub-Agent 的真正威力在于并行执行。一个主会话可以同时派发多个 Sub-Agent,它们同时工作,互不等待。
场景:功能开发前的全面准备
假设你要给一个电商系统添加"优惠券"功能。在动手写代码前,你需要了解:
Claude Code 会同时生成 4 个 Sub-Agent,每个在自己的上下文里工作:
- Agent 1 (Haiku, 只读):Grep 搜索 "discount|promo|coupon|price",遍历 15 个相关文件
- Agent 2 (Haiku, 只读):查阅 Git 历史中的相关 PR
- Agent 3 (Haiku, 只读):读取 schema 文件
- Agent 4 (Haiku, 只读):搜索 TODO/FIXME
四个 Agent 同时在跑,而不是一个接一个。4 个任务串行要 8 分钟,并行只需 2 分钟。
硬限制
Claude Code 对并行 Sub-Agent 有以下限制(2026 年 6 月数据):
- 最大并发数:16 个 Sub-Agent 同时运行
- 单次会话上限:最多 1,000 个 Sub-Agent
对于绝大多数一人公司场景,16 个并发足够了。
实战四:模型分层——省钱的核心技巧
这是最容易被忽视但最省钱的功能:不同任务用不同模型。
来看看成本差异(参考 Anthropic 2026 年 6 月 API 定价):
| 模型 | 输入 $/M tokens | 输出 $/M tokens | 适用场景 |
|---|---|---|---|
| Opus 4.5 | $15 | $75 | 复杂架构设计、核心逻辑 |
| Sonnet 4 | $3 | $15 | 代码生成、审查、重构 |
| Haiku 3.5 | $0.25 | $1.25 | 搜索、格式化、简单任务 |
分层策略实战
实际省钱效果:
假设一个典型的功能开发流程:
- 主 Agent 用 Opus:10K input + 2K output = $0.30
- 4 个 Sonnet Sub-Agent:各 8K input + 1K output = 4 × $0.039 = $0.156
- 4 个 Haiku Sub-Agent:各 5K input + 0.5K output = 4 × $0.0019 = $0.008
总计约 $0.46/功能。如果全部用 Opus 串行完成同样工作,大约需要 $2-3。省了 75-85%。
对于一天开发 10 个功能的一人团队,一个月能省 $500-800 的 API 费用。
完整工作流实战:从需求到 PR 的全自动流水线
下面是一个真实的一人公司开发工作流,把 Sub-Agent 串成完整的自动化流水线:
步骤 1:需求分析(主 Agent, Opus)
步骤 2:并行调研(4 个 Haiku Sub-Agent)
主 Agent 同时发起 4 个调研:
步骤 3:并行开发(3 个 Sonnet Sub-Agent)
调研完成后,主 Agent 同时发起 3 个开发任务:
▲ 全自动开发流水线:5步骤从需求到PR,人只需一句话,并行5-8分钟完成
步骤 4:质量把关(3 个 Sonnet Sub-Agent 并行)
步骤 5:主 Agent 整合(Opus)
所有 Sub-Agent 返回结果后,主 Agent:
- 合并所有代码变更
- 解决冲突
- 最终审查
- 生成 PR 描述
整个流程,人的参与只有第一步的一句话。其余完全由 Agent 编排完成。耗时:约 5-8 分钟(并行执行),串行则需要 25-35 分钟。
关键踩坑与最佳实践
坑 1:上下文传递不够
Sub-Agent 不知道主 Agent 知道什么——除非你明确告诉它。
错误做法:
Sub-Agent 不知道要测哪个文件、什么框架、什么风格。正确做法:
坑 2:把所有 Sub-Agent 都设成最高权限
如果每个 Sub-Agent 都有 Write 和 Bash 权限,一个 Sub-Agent 的 bug 可能破坏整个项目。
最佳实践:
- 只读任务(搜索、审查)→ 只用 Read、Grep、Glob
- 生成任务(写测试、写文档)→ 加 Write
- 执行任务(跑测试、跑构建)→ 加 Bash
- 永远不要给审查 Agent 写权限
坑 3:在 Sub-Agent 上用昂贵的模型做简单任务
Haiku 做代码搜索足够好,不要习惯性全用 Sonnet。
快速判断法则:
- 需要深度推理(架构设计、复杂算法)→ Opus
- 需要专业判断(代码审查、安全审计)→ Sonnet
- 需要快速扫描(搜索、格式化、简单生成)→ Haiku
坑 4:一次派发太多 Sub-Agent 导致混乱
同时跑 20 个 Sub-Agent 看起来很酷,但主 Agent 可能无法有效整合所有结果。建议每次并行 3-5 个,分阶段执行。
坑 5:忽略 Dynamic Workflows 的新能力
2026 年 6 月发布的 Dynamic Workflows(动态工作流)是 Sub-Agent 的重大升级。它允许主 Agent 在运行时动态规划任务图——不需要预先定义所有 Sub-Agent,而是根据中间结果决定下一步。如果你的 Claude Code 已经更新,在 .claude/settings.json 中启用:
总结
Claude Code 的 Sub-Agent 系统把"一个人就是一个团队"从口号变成了现实。核心要点:
- 用 Explore Agent 做代码探索——别让主会话的上下文被搜索任务撑爆
- 创建自定义 Sub-Agent——把重复的工作模式固化为可复用的 Agent
- 并行执行——调研、开发、审查同时进行,不排队
- 模型分层——简单的活给 Haiku,复杂的给 Sonnet,核心的给 Opus
- 限制权限——审查 Agent 不给写权限,代码生成 Agent 不给 Bash
对一人公司而言,Sub-Agent 不只是提效工具——它是一种新的工作方式。你不是在用 AI 辅助编程,你是在编排一个 AI 开发团队。
现在就打开 Claude Code,试试你的第一个 Sub-Agent。
*本文基于 Anthropic Claude Code 官方文档、Totalum 2026 生产实践指南、Developers Digest 实测数据撰写。Sub-Agent 功能和限制以 2026 年 6 月最新版本为准。API 定价参考 Anthropic 官方定价页面。*
#AI创业 #Agent工坊 #ClaudeCode #一人公司 #AI编程
本文由AI辅助创作,经人工审核编辑发布
