1302 commits、747 个合并 PR、16,000 行巨型文件被拆成 14 个模块——Hermes Agent 刚刚发布了今年最大的一次版本更新。
前言
2026 年 5 月 28 日,NousResearch 发布了 Hermes Agent v0.15.0「The Velocity Release」[1]。这不是一个小版本迭代——从 v0.14.0 到 v0.15.0,整整 1,302 次提交,560+ 个 issue 被关闭,321 位社区贡献者参与。
对于用 Hermes Agent 做 AI 创业的一人公司来说,这次更新有几个功能直接关系到效率、安全、成本三个核心指标。本文从实操角度拆解其中最值得关注的 7 个功能,每个都附带配置方法和使用场景。
一、Kanban 多 Agent 平台:一个人的"团队"
▲ 图1:Kanban Swarm 多Agent拓扑架构 — 根节点分发任务,并行Worker协作,Verifier验证质量,Synthesizer合成交付
v0.15.0 把 Kanban 从简单的看板升格为真正的多 Agent 编排平台,104 个 PR 端到端贯穿。
核心能力
- Triage 自动拆解任务:一个复杂任务提交到看板后,Hermes 自动分解成一棵子任务树。比如「写一篇 AI 工具横评文章」→ 自动拆成「调研竞品」「数据收集」「写作」「配图」「排版」5 个子任务。
- Swarm 拓扑:
hermes kanban swarm一条命令创建完整的多 Agent 拓扑——根节点、并行 Worker、门禁验证器、门禁合成器、共享黑板。 - 按任务指定模型:简单的子任务用便宜模型(如 GPT-4o-mini),复杂推理用昂贵模型(如 Claude Opus),不再一刀切。
- Worktree 隔离:每个任务可以有自己的 Git worktree 和分支,不会互相污染。
- 定时调度:任务可以设定开始时间,配合 cron 自动化运行。
实操配置
一人公司场景
假设你的日常是:监控热点 → 写文章 → 配图 → 排版 → 发布。用 Kanban 自动拆解后,每分钟可以轮询看板状态,子任务完成后自动触发下一个。你只需要做最终审核。
实际效果:原本需要 2 小时手动协调的流程,现在 15 分钟审核即可。
二、Skill Bundles:一键加载全套工作流
v0.15.0 引入了 Skill Bundle 概念——把多个 skill 打包成一个命名组,一个斜杠命令全部激活。
核心能力
/一键加载:/writing-day可以同时激活 humanizer + ideation + obsidian + youtube-content 四个 skills。- Skills Hub 健康检查:自动检测已安装 skills 的版本和状态,有过期提醒。
- 三个新 skills:
code-wiki:基于 Karpathy 的 LLM-Wiki 概念,为你的代码库建立持久化索引 wikiopenhands:委托子任务给 OpenHands CLI,支持并行编码 Agentweb-pentest:OWASP 风格的 Web 渗透测试配方
实操配置
一人公司场景
不同工作日需要不同工具集:
/writing-day:写作日,激活内容创作相关 skills/dev-day:开发日,激活 code-wiki + openhands/ops-day:运营日,激活 web-pentest + monitoring
三条命令切换整个工作上下文,不再逐个加载 skill。
三、代码重构:-76%,快如闪电
v0.15.0 做了一件让所有开发者都开心的事:把 Hermes 的核心文件 run_agent.py 从 16,083 行砍到 3,821 行(-76%),拆分到 14 个 agent/ 子模块。
实际影响
- IDE 加载不再卡顿:以前打开
run_agent.py要等 90 秒,现在瞬间打开 - 插件开发者可以读懂代码了:模块化后每个文件职责清晰
- 性能红利:按需导入减少了冷启动时的内存占用
四、Cold-Start 性能:连续第四轮优化
▲ 图2:Hermes v0.15 性能提升数据 — 冷启动-63%,函数调用-47%,会话搜索提速4500倍
实测数据
| 指标 | 优化前 | 优化后 | 提升 |
|---|---|---|---|
hermes --version 冷启动 | 701ms | 258ms | -63% |
| 每次对话的函数调用 | 399K | 213K | -47% |
| Termux 冷启动 | 2.9s | 0.8s | -72% |
| Agent 构建时间 | — | -170~290ms | — |
| 每次工具调用 | — | -195ms | — |
三项关键优化:
- 延迟导入
openai._base_client:每次 CLI 启动省 240ms + 17MB 内存 - 热路径优化:31 轮对话从 399K 函数调用降到 213K(-47%)
- 自适应 subprocess 轮询:每次工具调用省 195ms,每轮对话省 1 秒以上
一人公司场景
如果你的 Hermes cron job 每 15 分钟跑一次,一天跑 96 次。每次节省 1 秒冷启动,一天省 96 秒——一年省 9.7 小时。如果对话轮次节省 47% 的函数调用,API 往返时间大幅缩短,尤其是网络延迟敏感的场景。
五、session_search 重建:免费、即时、4,500 倍提速
旧版 session_search 需要调用辅助 LLM,每次约 $0.30 成本,耗时 ~30 秒,还偶尔幻觉。
新版完全重写:
- 三种模式自动推断:discovery(发现)→ scroll(翻页)→ browse(浏览),无需手动指定
- Discovery 从 ~90 秒降到 ~20ms(4,500 倍)
- Scroll 只需 ~1ms
- 零额外成本:不再调用辅助 LLM
- 零配置:不需要 config knob,不需要 companion skill
实操效果
对于经常需要回顾历史上下文的一人公司运营者,这意味着零成本、即时获取过去的经验教训。
六、Bitwarden Secrets Manager:告别明文字符串密钥
这是本次更新中安全性提升最大的功能。
问题
之前的所有 API Key(OpenAI、Anthropic、GitHub、微信等)都以明文存在 ~/.hermes/.env 中。一旦服务器被入侵,所有密钥一次性泄露。
新方案
一人公司场景
当你管理多个客户项目,每个项目有不同的 API Key 时:
- 在 Bitwarden 中按项目分组管理密钥
- 为每个项目创建独立的 Hermes profile
- 轮换密钥只需在 Bitwarden 操作一次,所有 profile 自动同步
七、Promptware 防御:你的 Agent 不会被"钓鱼"了
▲ 图3:Promptware 三层防御体系 — 威胁模式扫描、记忆注入过滤、工具输出界定符,配合Bitwarden密钥管理
Prompt injection 攻击是 AI Agent 领域的头号安全威胁。v0.15.0 基于最新的 Brainworm 研究论文[2],实现了三层防御:
- 威胁模式库:
tools/threat_patterns.py包含 ~15 个 Brainworm/C2 攻击模式 - 记忆加载扫描:回忆历史对话时自动扫描注入模式
- 工具输出分隔符:恶意文件或远程服务无法伪装成 Hermes 的系统内容
实操
无需配置,默认启用。可以通过新的 security-guidance 插件查看检测日志:
八、Nous 认证 MCP 目录:不再到处找 MCP Server
MCP(Model Context Protocol)生态在快速膨胀,但最大的痛点是发现——你不知道有哪些可靠的 MCP Server 可用。
v0.15.0 推出了 Nous 认证的 MCP 目录,附带交互式选择器:
首发收录的是 n8n MCP manifest,后续会持续扩充。这对一人公司意味着:不需要自己踩坑、自己甄别 MCP Server 质量,Nous 团队帮你做了审核。
九、ntfy 推送通知:第 23 个消息平台
ntfy 是一个无需注册、无需 API Key 的自托管推送服务。Hermes v0.15.0 把它作为第 23 个平台插件接入。
配置
一人公司场景
- Kanban 任务完成 → 手机推送
- Cron job 产出文章 → 桌面通知
- 服务器告警 → Apple Watch 震动
全链路自动化 + 即时通知 = 一个人像一支团队。
十、xAI 深度集成:Grok 用户的六大利好
如果你用的是 xAI/Grok 生态:
- xAI Web Search 插件:复用现有 Grok OAuth,不需要额外 API Key
hermes proxyxAI 上游:用 Grok OAuth 跑本地 OpenAI 兼容端点- 模型退役检测:
grok-3/grok-4-fast等旧模型自动检测 +hermes migrate xai一键迁移 - 自然 TTS 停顿:
auto_speech_tags在段落间插入[pause]标签 base_url锁定:防止 OAuth 凭据泄漏到攻击者服务器- OpenAI 风格执行指引:Grok 现在能正确使用工具调用,不再"声称完成但不执行"
一键升级
升级后推荐配置
与 OpenClaw 2026.6.x 的协同
就在 Hermes v0.15 发布后一周(6 月 3 日),OpenClaw 也发布了 2026.6.x 系列[3],重点改进了插件安装策略(从危险代码扫描转为操作员安装策略)、多平台消息通道安全性加强(Telegram/飞书/Discord/WhatsApp)、以及 Workboard 键盘导航等 UI 改进。
对于同时使用 Hermes 和 OpenClaw 的团队:
- Hermes 做核心 Agent 编排(Kanban 多 Agent + 内容创作)
- OpenClaw 做多平台消息分发(Telegram + 飞书 + Discord 同步)
两者互补,覆盖了 AI Agent 应用的「创作 + 分发」全链路。
常见问题
Q: 升级后现有的配置和自定义 skills 会丢失吗?
A: 不会。~/.hermes/ 下的配置、skills、plugins、cron jobs 都保持兼容。但建议升级前先备份。
Q: Kanban Swarm 功能需要额外配置吗?
A: 不需要。hermes kanban swarm 开箱即用。只需要确保你的模型供应商有足够配额(swarm 会并发调用多个模型)。
Q: Bitwarden Secrets Manager 是必须用的吗?
A: 不是。如果你没有 Bitwarden 账号,~/.hermes/.env 明文方式仍然可用。但建议尽早迁移——安全是积累性问题,不是出了问题再补救的。
Q: session_search 的 4,500 倍提速在所有场景都有效吗? A: 是的。新版完全不依赖 LLM,全程基于 FTS5 索引。Discovery 模式 20ms,Scroll 模式 1ms,无论搜索多少条历史对话。
Q: Hermes v0.15 和 OpenClaw 2026.6.x 应该先升级哪个? A: 两个都建议尽快升级。Hermes 侧重 Agent 内部能力提升,OpenClaw 侧重对外通信安全加固。如果时间有限,优先升级 Hermes——Kanban 多 Agent 和 Skill Bundle 对效率提升最直接。
⚠️ 升级风险提示
- 大版本升级风险:v0.14 → v0.15 涉及核心文件重构(run_agent.py -76%),如果你有自定义插件深度依赖
run_agent内部 API,升级前务必在测试环境验证。 - 模型配额:Kanban Swarm 功能会并发调用多个模型,如果同时运行多个子任务,API 配额消耗速度会显著增加。建议先在单任务模式下运行 1-2 天,监控用量后再启用 Swarm。
- Bitwarden 依赖:启用 Bitwarden Secrets Manager 后,Hermes 启动时依赖
bwsCLI 可用。如果 Bitwarden 服务不可达,Hermes 启动会变慢(超时重试),但不会阻塞——会自动 fallback 到本地.env。 - xAI 用户特别注意:
grok-3和grok-4-fast等旧模型已于 2026 年 5 月 15 日退役。升级后运行hermes migrate xai检查配置,否则可能遇到静默 404。 - Skill Bundle 不兼容旧版:v0.14 创建的 skill 配置在 v0.15 仍然可用,但 bundle 功能是新增的,需要重新创建 bundle 定义。
v0.15.0 是 Hermes Agent 今年最大的一次架构升级。对于一人公司来说,核心收获三点:
- Kanban 多 Agent:一个人操作一支 AI 团队,自动拆解任务、分配模型、隔离工作区
- Skill Bundle:一键切换工作上下文,不同工作日不再手动加载 skills
- 安全+速度:Bitwarden 密钥管理 + 4,500 倍 session search + 47% 函数调用减少
行动建议:今天就升级到 v0.15.0,先配置 Skill Bundle(5 分钟),再试一下 Kanban Swarm(10 分钟),评估是否启用 Bitwarden(按需)。这三个功能用好,你的 AI Agent 运营效率能提升 50% 以上。
#AI创业 #Agent工坊 #HermesAgent #一人公司 #AI工具
本文由AI辅助创作,经人工审核编辑发布
