【Agent工坊】Claude Code /workflows 命令实战：用多Agent流水线把一人公司跑起来

Anthropic在2026年6月的Code with Claude大会上正式发布了多Agent工作流编排能力——你现在可以让多个Claude子Agent并行处理代码审查、安全扫描和测试生成，而只需一条 /workflows 命令。本文手把手带你从零搭建一套可复用的一人公司自动化流水线。

▲ ▲ 多Agent编排架构：一个Orchestrator协调四个子Agent并行执行代码审查、安全扫描、测试检查和文档生成

背景：为什么一人公司需要多Agent

2026年的AI编程工具已经不再是"帮你写一个函数"的水平了。Claude Code作为Anthropic的终端级Agent编程助手，在2026年6月的Code with Claude大会上推出了三个重磅能力：Managed Agents（托管Agent）、Proactive Workflows（主动工作流）和Capability Curve（能力曲线）。其中最值得一人公司创业者关注的，就是 /workflows 命令背后的多Agent编排系统。

一人公司面临的核心矛盾是什么？一个人要干五个人的活，但每天只有24小时。 你不只要写代码，还要做代码审查、安全扫描、测试覆盖、文档生成——这些环节任何一个被跳过，产品质量就会打折。传统做法是雇人或外包，但成本动辄每月数万。

多Agent工作流的答案是：把重复性的技术工作拆成独立子任务，让多个AI Agent并行执行，你只做最终决策。 这其实就是把"一人公司"变成"一人+AI团队"。

核心概念：Claude Code的Agent架构

在深入 /workflows 之前，先理解Claude Code的Agent模型：

Orchestrator（编排者）与 Subagent（子Agent）

Claude Code中，Agent有两种角色：

Orchestrator（编排者）：你的主会话Claude。它接收你的指令，拆解任务，分派给子Agent，最后汇总结果。
Subagent（子Agent）：独立执行具体任务的Claude实例。每个子Agent有自己的上下文窗口和工具权限，互不干扰。

你（一人公司创始人）

└─ Orchestrator（主Claude）

├─ Subagent 1：代码逻辑审查

├─ Subagent 2：安全漏洞扫描

├─ Subagent 3：测试覆盖检查

└─ Subagent 4：文档生成

自定义Slash命令

Claude Code的斜杠命令有两种来源：

项目级命令：放在 .claude/commands/ 目录下，只在当前项目中可用。

全局命令：放在 ~/.claude/commands/ 目录下，所有项目通用。

命令文件就是普通的Markdown文件（.md），文件名即命令名。例如：

.claude/commands/workflows.md → /workflows

.claude/commands/deploy.md → /deploy

.claude/commands/review.md → /review

当你输入 /workflows 时，Claude会把 workflows.md 的完整内容注入上下文，作为行为指令执行。

实战一：代码审查三合一流水线

这是最经典的多Agent场景。你提交了一个PR，需要同时做三件事：逻辑审查、安全扫描、测试覆盖检查。三者互不依赖，天然适合并行。

步骤1：创建工作流文件

在你的项目根目录创建 .claude/commands/review.md：

你正在执行多步骤的代码审查工作流。

步骤1：使用一个子Agent分析最近的git diff，检查逻辑错误和边界条件。

步骤2：使用一个独立的子Agent扫描代码中的安全漏洞（SQL注入、XSS、密钥泄露等）。

步骤3：使用第三个子Agent验证改动代码的测试覆盖率是否达标。

步骤4：将三个子Agent的发现汇总为一份结构化审查报告。

步骤1-3应尽可能并行执行。每个子Agent的审查结果单独输出到一个临时文件，

最后由你读取并汇总。

审查范围：最近一次git提交的改动文件。

步骤2：使用 /review 命令

在Claude Code会话中：

/review

Claude会自动：

读取 review.md 的工作流指令
创建3个子Agent，分别执行逻辑审查、安全扫描、测试检查
并行运行3个子Agent
汇总3份输出为最终审查报告

▲ ▲ 代码审查三合一流水线：逻辑审查、安全扫描、测试覆盖三个子Agent并行执行后汇总为结构化报告

步骤3：实际输出示例

📋 代码审查报告 — 2026-06-10

═══ 逻辑审查 ═══

✅ 订单金额计算：正确处理了优惠券叠加逻辑

⚠️ 边界条件：当 order.amount = 0 时，优惠券仍会应用（建议加守卫）

❌ 第147行：未处理 payment_method 为 null 的情况

═══ 安全扫描 ═══

✅ 无SQL注入风险（使用了参数化查询）

⚠️ 第203行：用户输入直接拼入日志，可能造成日志注入

❌ .env.example 中包含疑似有效API密钥

═══ 测试覆盖 ═══

✅ 核心逻辑文件 test_order.py 覆盖率达92%

⚠️ 新增的 discount_service.py 仅有43%覆盖

❌ 第147行的null路径未被任何测试覆盖

总结：1个阻断问题 + 3个警告 + 3个通过项

实战二：每日自动化运营流水线

一人公司的日常运营有很多重复环节：检查服务健康状态、抓取竞品动态、生成日报。这些完全可以用 /workflows 自动化。

创建 `.claude/commands/daily-ops.md`：

你正在执行每日运营检查工作流。所有步骤并行执行。

步骤1（服务健康检查）：使用子Agent对以下端点发送健康检查请求，

记录响应时间和状态码：

- api.example.com/health

- api.example.com/db-status

- cdn.example.com/ping

步骤2（竞品监控）：使用子Agent抓取3个竞品网站的最新更新，

提取关键词变化和新增功能：

步骤3（数据日报）：使用子Agent从数据库中提取过去24小时的

关键指标（DAU、新增用户、付费转化率、客诉数量），

与过去7天均值对比。

所有子Agent完成后，汇总为一份不超过500字的运营日报。

异常指标用 ⚠️ 标记，严重问题用 🚨 标记。

踩坑提醒

在实测中，有几个容易踩的坑：

子Agent上下文限制：每个子Agent有独立的上下文窗口。如果你的代码库很大，子Agent可能看不到完整上下文。解决方案是在工作流指令中明确指定子Agent需要扫描的文件范围。
并行执行的工具冲突：如果多个子Agent同时读写同一个文件，会产生竞态条件。解决方案：让每个子Agent输出到独立的临时文件（如 /tmp/review_logic.txt、/tmp/review_security.txt），Orchestrator最后汇总。
子Agent权限控制：子Agent默认继承Orchestrator的工具权限。如果你不希望子Agent执行某些操作（如git push），在工作流指令中明确约束。

实战三：部署前的全量检查流水线

发布到生产环境之前，你的checklist可能有十几项。用一条命令搞定它们：

创建 `.claude/commands/pre-deploy.md`：

你正在执行部署前全量检查工作流。

步骤1：运行完整测试套件 `npm test`，记录全部失败用例。

步骤2：使用子Agent检查所有环境变量是否在 .env.production 中正确配置。

步骤3：使用子Agent扫描依赖项中的已知漏洞（`npm audit`）。

步骤4：使用子Agent验证数据库迁移脚本在staging环境能成功执行。

步骤5：使用子Agent检查API文档是否与最新代码一致。

步骤6：汇总所有检查结果。

步骤1-5并行执行。步骤4需要数据库连接，如果连接失败则跳过并标记。

任一步骤出现FAIL，整个流水线标记为 🚨 不允许部署。

全部PASS才输出 ✅ 可以部署。

工作流设计原则

经过多次实践，总结出以下设计原则：

▲ ▲ 工作流 vs 传统脚本选择指南：理解什么场景该用AI编排，什么场景传统脚本更高效

1. 任务粒度：一个子Agent只做一件事

不要把"代码审查+安全扫描+测试"塞进一个子Agent。保持每个子Agent职责单一，这样出问题时容易定位。

2. 并行优于串行

如果子任务之间无依赖，全部并行。3个串行任务需要3倍时间，3个并行任务只需要最长那个的时间。

3. 输出格式标准化

在workflow指令中明确要求每个子Agent输出结构化格式（如Markdown表格），方便Orchestrator汇总。不要让Orchestrator去"理解"每个子Agent的自由文本。

4. 失败隔离

一个子Agent失败不应该影响其他子Agent。在工作流指令中加入错误处理逻辑：

如果某个子Agent执行失败，记录错误信息但继续执行其他步骤。

最终报告中标注失败的步骤和错误原因。

5. 成本意识

每个子Agent消耗独立的token配额。一个包含5个子Agent的工作流，token消耗大约是单Agent的3-5倍。对于日常高频任务，建议先评估ROI——如果人工做只需5分钟，用工作流反而增加了token成本。

工作流 vs 传统脚本：什么时候该用哪个

场景	推荐方案	原因
固定流程、无例外	Shell脚本	更快、更便宜、可重复
需要理解和判断	Claude Code Workflow	AI能处理脚本无法应对的边界情况
代码审查、安全分析	Workflow	需要语义理解，不是正则匹配
每日数据拉取+格式化	脚本 + AI汇总	拉数据用脚本，分析用AI
一次性复杂任务	Workflow	不值得写脚本，AI直接搞定

常见问题

Q: 子Agent能用不同的模型吗？

目前Claude Code的子Agent统一使用当前会话的模型配置。不能给不同子Agent分配不同模型。

Q: 工作流文件可以有多复杂？

Markdown文件没有长度限制，但建议控制在500行以内。太长的指令会消耗大量上下文窗口，反而降低执行质量。如果工作流真的很复杂，拆成多个子工作流串联。

Q: 子Agent能看到我的代码库吗？

默认能看到当前工作目录的文件，但可以通过工作流指令限制文件访问范围。敏感文件建议显式排除。

Q: 工作流能调用外部API吗？

可以。子Agent可以使用curl、HTTP客户端等工具调用外部API。这对于"竞品监控""服务健康检查"等场景非常有用。

Q: 怎么调试失败的工作流？

目前没有专门的调试工具，建议做法是：

先单独跑每个子任务的指令，确认单步可执行
再组合成工作流
让每个子Agent输出详细日志到临时文件

行动建议

今天就能做：在你的项目里创建 .claude/commands/ 目录，写一个简单的双Agent工作流（比如并行lint+测试），体验编排模式。
本周可以做：把你日常工作中重复性最高的2-3个环节写成工作流文件。建议从"代码审查三合一"开始，因为这个场景最成熟。
本月目标：搭建一套完整的一人公司日常运营工作流——代码审查、部署检查、竞品监控、数据日报——每天早上一句 /daily-ops 完成4件事。

#AI创业 #Agent工坊 #ClaudeCode #一人公司 #多Agent工作流

本文由AI辅助创作，经人工审核编辑发布