808 commits、633 merged PRs、545 issues closed——v0.14 被官方称为 Foundation Release,其中最震撼的功能:把你现有的 Claude Pro / ChatGPT Pro / SuperGrok 订阅变成一个本地 OpenAI API,Codex、Aider、Cline 全部免费调用。
一、v0.14 是个什么体量的更新?
Hermes Agent v0.14(代号 v2026.5.16)于 2026 年 5 月 16 日发布,距上一版 v0.13.0 仅 9 天,但包含 808 个 commits、633 个合并 PR、1393 个文件改动、165,061 行新增代码。215 位社区贡献者参与了本次迭代,关闭了 12 个 P0 和 50 个 P1 级别 issue。
官方对这版的定性是 "The Foundation Release"——Hermes 现在可以安装和运行在任何地方,自带你真正需要的东西,卸载你用不到的东西。这是一次基础设施级别的升级。
我把核心更新整理成了一份速览表:
| 功能 | 说明 | 对你有什么用 |
|---|---|---|
| OpenAI 兼容本地代理 | hermes proxy 启动本地端点,将 OAuth 订阅转 OpenAI API | Codex/Aider/Cline 等工具直接调用,零额外 API 费用 |
| xAI Grok + 1M 上下文 | SuperGrok OAuth 登录,grok-4.3 上下文窗口扩大到 100 万 token | 丢整个代码库进去一次分析 |
| pip install hermes-agent | PyPI 正式发布,一行命令安装 | 告别 git clone + shell 脚本 |
| 1 小时跨会话缓存 | Claude prompt cache 跨 /new 会话保留 | 新对话秒回,成本减半 |
| 浏览器 CDP 180x 加速 | 持久连接复用,不再每次新建 DevTools 会话 | 页面交互从秒级变毫秒级 |
| 冷启动减 19 秒 | 延迟加载、并行检查、磁盘缓存 | hermes 命令秒出提示符 |
| Teams / LINE / SimpleX | 新增 3 个消息平台,总数达 22 个 | 任何平台都能接入 Agent |
x_search 内置搜索 | 无 Skill 直接搜 X/Twitter | 实时信息获取能力 |
但最值得单独写一篇教程的,是那个能帮你省钱的功能——本地代理。
二、杀手功能:`hermes proxy`——一份订阅,喂饱所有工具
2.1 这解决了什么痛点?
作为 AI 创业者,你大概率同时用好几个工具:
- Codex CLI 写代码(需要 OpenAI API Key)
- Aider 做 AI 结对编程(需要 Anthropic API Key 或 OpenAI Key)
- Cline 在 VSCode 里改代码(需要 API Key)
- Continue 在编辑器里做补全(需要 API Key)
每个工具都要求你填入 API Key,而 API 按 token 计费,重度使用一个月烧掉几百美金是常态。但你明明已经付了 Claude Pro $20/月 和 ChatGPT Pro $200/月 的订阅费——这些订阅在网页端可以随便用,却不能喂给第三方工具。
Hermes v0.14 的 hermes proxy 彻底解决了这个问题。
2.2 工作原理
┌─────────────┐ ┌──────────────────┐ ┌─────────────────┐
│ Codex CLI │────▶│ │────▶│ Claude Pro │
│ Aider │────▶│ hermes proxy │────▶│ ChatGPT Pro │
│ Cline │────▶│ localhost:PORT │────▶│ SuperGrok │
│ Continue │────▶│ (OpenAI兼容API) │────▶│ (你的订阅) │
└─────────────┘ └──────────────────┘ └─────────────────┘

▲ 图:hermes proxy 架构——三个编程工具通过本地代理复用一份订阅
`hermes proxy` 在你的本机
对于 Codex、Aider、Cline 这些工具来说,它们看到的只是一个 "OpenAI-compatible endpoint",填入 ` 和任意字符串作为 "API Key",就能正常工作了。不需要真实的 API Key,不需要按 token 付费,全部走你已有的订阅。
2.3 实战配置:三步走
第一步:安装 Hermes Agent
pip install hermes-agent
这是 v0.14 的另一个里程碑——Hermes 终于上了 PyPI。不再需要 git clone 整个仓库,一行 pip 命令搞定。
第二步:登录你的订阅账号
# 登录 Claude Pro(通过 Anthropic OAuth)
hermes auth login anthropic
# 或者登录 ChatGPT Pro
hermes auth login openai
# 或者登录 SuperGrok(xAI)
hermes auth login xai
Hermes 会打开浏览器让你完成 OAuth 授权。授权后,你的订阅凭证会安全存储在本地,代理可以直接使用。
第三步:启动代理
hermes proxy --provider anthropic
你会看到类似这样的输出:
🚀 Hermes proxy running at http://localhost:8080
📡 Provider: anthropic (Claude Pro subscription)
🔧 Endpoint: http://localhost:8080/v1
现在,在任何支持 OpenAI 兼容 API 的工具里填入:
- API Base URL: `
- API Key: 随便填(如
hermes、no-key、任意字符串)
以 Codex CLI 为例:
export OPENAI_API_BASE="http://localhost:8080/v1"
export OPENAI_API_KEY="hermes"
codex
以 Aider 为例:
aider --openai-api-base http://localhost:8080/v1 --openai-api-key hermes
以 Cline(VSCode 插件)为例,在设置里:
{
"cline.apiProvider": "openai",
"cline.openAiBaseUrl": "http://localhost:8080/v1",
"cline.openAiApiKey": "hermes"
}
2.4 多 Provider 切换
hermes proxy 支持 --provider 参数指定后端:
# 用 Claude(适合代码生成、长文分析)
hermes proxy --provider anthropic
# 用 ChatGPT Pro(适合创意写作、头脑风暴)
hermes proxy --provider openai
# 用 Grok(适合实时信息、X/Twitter 数据分析)
hermes proxy --provider xai
你甚至可以同时开三个终端,每个指向不同的 provider,不同工具用不同的后端。一份 Claude Pro 订阅 $20/月 加上 ChatGPT Pro $200/月,就能覆盖所有 AI 编程工具的需求,不再需要额外购买 API credits。
三、省钱账本:代理模式 vs API 直接付费

▲ 图:API 按量付费 vs hermes proxy 订阅复用,年省 $1500-2500
假设你是一个重度 AI 编程用户,日常使用 Codex + Aider + Cline 三个工具:
| 使用场景 | 月均 API 消耗(估算) | 按 API token 计费 | hermes proxy 方案 |
|---|---|---|---|
| Codex CLI 日常编码 | ~500 次调用/天 | $80-150/月 | $0(走已有订阅) |
| Aider 代码重构 | ~200 次调用/天 | $40-80/月 | $0(走已有订阅) |
| Cline VSCode 补全 | ~300 次调用/天 | $30-60/月 | $0(走已有订阅) |
| 合计 | $150-290/月 | $20-200/月(订阅本身) |
关键区别:API 按 token 计费是线性的——用得越多付得越多。而订阅是包月的——用得越多越划算。 如果你每天用 AI 辅助编程超过 2 小时,代理方案每年能省下 $1500-2500。
踩坑提醒
代理方案也有局限:
- 速率限制:订阅账号本身有频率限制(比如 Claude Pro 每 5 小时约 45 条消息),代理无法突破这个限制。高并发场景下(同时跑 3 个 Codex 会话),你可能触发限流。
- 模型选择受限:代理只能调用订阅包含的模型(如 Claude Pro 的 Sonnet/Opus),无法访问 API 专有模型(如 gpt-5.5 的部分版本)。
- 不适合生产环境:代理设计用于本地开发,不适合部署到服务器给多人共享。
- 需要本地运行:代理在你本机运行,远程服务器上的工具需要 SSH 隧道才能访问。Hermes 文档提供了 SSH 隧道配置指南。
四、v0.14 其他值得关注的更新
4.1 pip install 一键安装
过去安装 Hermes 要先 git clone 整个仓库,再跑 shell 安装脚本。现在:
pip install hermes-agent
hermes
一行命令,Ink TUI 界面直接启动。PyPI 上的正式发布意味着版本管理、依赖解析、虚拟环境隔离都标准化了。
4.2 1 小时跨会话 Claude Prompt 缓存
这是 v0.14 的性能杀手锏。当你通过 Anthropic/OpenRouter/Nous Portal 使用 Claude 时,系统提示词、Skills、Memory 这些前缀内容会缓存 1 小时。
实际效果:你结束一个 /new 对话后立刻开始另一个 /new,第一次响应几乎秒回,而且不计入 prompt token——因为缓存还是热的。后台的 Memory review 同样受益,不再每次全量计费。
对 AI 创业者的价值:频繁切换上下文时不再等待,工作效率提升明显。
4.3 浏览器 CDP 180 倍加速
Agent 使用浏览器工具 inspect 页面或执行 JavaScript 时,v0.14 改为持久连接复用,不再每次新建 DevTools 会话。
实测从秒级变毫秒级——以前点一个页面元素要等 2 秒,现在 < 20ms 返回。如果你的 Agent 工作流涉及大量网页操作(如数据采集、表单填写、自动化测试),这个提升是跨数量级的。
4.4 冷启动砍掉 19 秒
hermes 命令的启动路径全面优化:重型适配器延迟加载、模型目录优先读磁盘缓存、doctor 检查并行执行、chat -q 跳过欢迎横幅。hermes tools 命令从 14 秒降到 1.5 秒以内。
4.5 x_search 内置 Twitter 搜索
Agent 现在可以直接搜索 X/Twitter,不需要安装额外的 Skill 或配置自定义集成。搜索时间线、找特定帖子、追踪话题——全部在对话中完成。支持 X OAuth 登录或 API Key 两种认证方式。
这个功能对 AI 创业者的价值在于:在做市场调研、竞品分析、热点追踪时,Agent 可以直接从 X 获取一手信息,而不是依赖第三方新闻摘要。
五、v0.14 升级指南
5.1 全新安装
pip install hermes-agent
hermes # 启动 TUI
5.2 从旧版升级
# 如果之前是从 GitHub 安装的
cd hermes-agent
git pull
pip install -e . --upgrade
# 或者切换到 PyPI 版本
pip uninstall hermes-agent
pip install hermes-agent
5.3 检查版本
hermes --version
# 应输出: hermes-agent v2026.5.16
5.4 验证代理功能
# 登录你的订阅
hermes auth login anthropic
# 启动代理
hermes proxy --provider anthropic --port 8080
# 在另一个终端测试
curl http://localhost:8080/v1/models
如果返回模型列表 JSON,说明代理正常工作。
六、实战场景:一人公司的 AI 编程工作流

▲ 图:一人公司全天 AI 编程工作流——上午 Codex、下午 Aider、晚上 Cline
假设你是一个独立开发者,正在用 AI 辅助开发一个 SaaS 产品。你的日常工具链是这样配置的:
上午——Codex CLI 写后端代码:
# 终端1:启动代理(Claude 后端)
hermes proxy --provider anthropic --port 8080
# 终端2:让 Codex 走代理
export OPENAI_API_BASE="http://localhost:8080/v1"
export OPENAI_API_KEY="hermes"
codex "给我写一个 FastAPI 用户认证模块,支持 JWT + OAuth2"
下午——Aider 做代码重构:
# 切换到 ChatGPT Pro(更适合大范围重构)
hermes proxy --provider openai --port 8081
aider --openai-api-base http://localhost:8081/v1 \
--openai-api-key hermes \
--model gpt-5 \
--map-tokens 100000
晚上——Cline 在 VSCode 修复 Bug:
{
"cline.apiProvider": "openai",
"cline.openAiBaseUrl": "http://localhost:8080/v1",
"cline.openAiApiKey": "hermes"
}
三套工具,三个时段,共用一份订阅。一天下来,API 费用是零——因为所有请求都走你已有的 Claude Pro 和 ChatGPT Pro 订阅。
进一步优化:你可以在 ~/.bashrc 或 .zshrc 里配置别名:
# 添加到 shell 配置
alias proxy-claude="hermes proxy --provider anthropic --port 8080"
alias proxy-chatgpt="hermes proxy --provider openai --port 8081"
alias proxy-grok="hermes proxy --provider xai --port 8082"
# Codex 快捷启动
alias codex-claude="OPENAI_API_BASE=http://localhost:8080/v1 OPENAI_API_KEY=hermes codex"
每次开发前跑一行 proxy-claude,然后所有工具自动走代理。
七、常见问题
Q: 代理会违反 Anthropic/OpenAI 的服务条款吗?
A: Hermes 使用的是官方 OAuth 授权流程,你的请求通过你自己的浏览器登录的会话发出——本质上和你手动在网页端使用没有区别。但建议查阅各平台的最新服务条款。截止 2026 年 5 月,Anthropic 和 OpenAI 的 Consumer 订阅条款未明确禁止此类个人使用场景。
Q: 代理支持哪些模型?
A: 取决于你的订阅。Claude Pro 用户可获得 Sonnet 和 Opus 系列;ChatGPT Pro 用户可获得 GPT-5.x 系列;SuperGrok 用户可获得 grok-4.3(1M 上下文窗口)。
Q: 代理可以在远程服务器上运行吗?
A: 可以在服务器上启动代理,然后通过 SSH 隧道转发端口到本地。Hermes 官方文档提供了完整的 SSH 隧道配置指南。也可以直接设置 hermes proxy --host 0.0.0.0 让代理监听所有网络接口(注意安全风险)。
Q: 多个工具同时用代理会冲突吗?
A: 代理本身支持并发请求。但底层订阅有频率限制(如 Claude Pro 约每 5 小时 45 条),多个工具同时高频调用可能触发限流。建议不同工具使用不同 provider 的代理,或错峰使用。实测单工具日常编码不会触发限流。
八、总结
Hermes Agent v0.14 是今年迄今为止最重要的版本。它完成了三个关键转变——每个都直接提升 AI 创业者的效率和钱包:
- 从 "开发者玩具" 到 "基础设施":PyPI 发布、懒加载、冷启动优化——安装和运行体验已接近成熟产品。新用户从零到跑起来不超过 3 分钟。
- 从 "API Key 依赖" 到 "订阅复用":
hermes proxy让 Consumer 订阅的价值最大化——你付的 $20-200/月 不再局限于网页聊天,而是可以喂给整个 AI 工具链。Codex、Aider、Cline、Continue,全部免费调用。
- 从 "单机 Agent" 到 "多平台中枢":22 个消息平台、22 个推理 provider、OAuth 统一认证——Hermes 正在成为 AI 工作流的操作系统,而不是又一个 CLI 工具。
对于 AI 创业者来说,v0.14 的核心价值就一句话:用已有的订阅,启动你的 AI 编程工具矩阵,不再为 API token 付费。
参考来源
- Hermes Agent v0.14.0 Release Notes (GitHub):
- Hermes Agent PyPI 页面:
- Hermes Proxy 文档 (PR #25969):
- Hermes x_search 功能 (PR #26763):
- Claude Prompt Cache 跨会话 (PR #23828):
本文由AI辅助创作,经人工审核编辑发布
