Agent工坊

【Agent工坊】Hermes Agent v0.16「Surface Release」深度拆解:桌面端来了,AI Agent 终成日常工具

874 commits,542 PRs,170 位贡献者,一周内从零搭建原生桌面应用——这个开源 AI Agent 框架,正从极客玩具变成真正的大众产品。

▲ 图1:从CLI到GUI的进化 — Hermes桌面端让AI Agent像聊天App一样自然▲ ▲ 图1:从CLI到GUI的进化 — Hermes桌面端让AI Agent像聊天App一样自然

事件回顾

2026 年 6 月 5 日,Nous Research 发布了 Hermes Agent v0.16.0,代号「The Surface Release」。这不是一个小版本迭代——这是一个里程碑式的发布。在距离 v0.15.2 仅一周的时间里,团队完成了 874 次 commits 和 542 个合并 PRs,修改了近 2000 个文件,新增超过 20 万行代码。

这次发布的核心只有一个:Hermes 不再只是一个命令行工具了

一个全新的原生桌面应用——基于 Electron,覆盖 macOS、Linux、Windows 三大平台——在一周内从零搭建完成。不是终端包装器(terminal wrapper),不是 WebView 套壳,而是一个真正的、带完整 GUI 的桌面应用。一键安装、应用内自动更新、拖拽文件到聊天窗口、状态栏内联模型选择器、并发多 Profile 会话——这些功能在 7 天前都不存在。

与此同时,Web Dashboard 从"看看你的会话"升级为完整的浏览器管理面板:MCP 目录管理、消息渠道配置、凭据管理、Webhook 创建、内存配置,全部可在浏览器中完成。你不再需要 SSH 进服务器编辑 config.yaml 来配置一个新频道。

对于中文用户——桌面端完整支持简体中文,覆盖聊天窗口、侧边栏、设置、命令中心、Cron、消息、Profiles、Skills、Agents 等全部 UI 表面。这是由社区贡献者 @JimLiu 完成的。

这标志着 Hermes Agent 从一个「开发者工具」正式走向「人人可用的 AI Agent 平台」。对于 AI 创业者来说,这意味着什么?我们来拆解。

为什么重要:AI Agent 的「桌面化」是必经之路

从 CLI 到 GUI 的本质转变

过去几个月,AI Agent 工具(Hermes、OpenClaw、Claude Code 等)一直是命令行优先的产品。这对开发者友好,但对非技术用户——包括很多 AI 创业者——是一个巨大的障碍。

"你打开终端,输入 hermes chat,然后..."——这句话本身就劝退了 90% 的潜在用户。

Surface Release 改变了这一点。你现在可以:

  • 下载一个 .dmg/.exe/.AppImage,双击安装
  • 看到一个漂亮的聊天窗口,像使用 ChatGPT 桌面端一样自然
  • 拖拽文件到聊天区域
  • 用 Cmd+K 打开命令面板
  • 在状态栏切换模型

对于 AI 创业者来说,AI Agent 的价值不在于你会不会用终端——而在于它能不能帮你自动化工作。桌面端降低了进入门槛,让更多人能把精力花在「让 Agent 做什么」而不是「怎么让 Agent 跑起来」。

远程 Gateway:笔记本跑界面,服务器跑算力

Surface Release 另一个重要架构变化是远程 Gateway 连接

桌面应用不需要在本地运行完整的 Hermes 后端。你可以:

  • 在笔记本上运行轻量 GUI
  • 连接到远程 Hermes Gateway(你的家庭服务器、云主机、团队共享服务器)
  • 通过 OAuth 或用户名/密码认证
  • 每个 Profile 可以指向不同的远程主机
  • 在一个窗口内并发运行多个 Profile 会话

这对 AI 创业者的实际意义:一台 MacBook Air + 一台远程 GPU 服务器 = 完整的 AI Agent 工作站。不需要在本地塞满 API Key,不用担心笔记本算力不够——所有重活都在服务器上完成,你只需要一个界面。

这和 VS Code Remote SSH 改变了开发方式一样——Hermes Remote Gateway 正在改变 AI Agent 的使用方式。

核心功能拆解:AI 创业者最该关注的 7 个变化

1. 原生桌面应用(不是终端包装器)

这是本次发布的主角。桌面端的技术架构值得了解:

  • 技术栈:Electron 应用,位于 apps/desktop/
  • 平台覆盖:macOS(.dmg)、Linux(.AppImage)、Windows(.exe)
  • 安装方式:下载即用,应用内自动更新
  • 核心交互:聊天窗口(流式输出)、会话列表(可搜索可归档)、拖拽文件上传、剪贴板图片粘贴、Cmd+K 命令面板、状态栏模型选择器

安装 Hermes 桌面端的命令(如果你已有 Hermes CLI):

# 如果你已经有 Hermes CLI,可以直接构建桌面端

hermes desktop

# 或者从 GitHub Releases 下载对应平台的安装包:

# macOS: Hermes-0.16.0-arm64.dmg

# Linux: Hermes-0.16.0.AppImage

# Windows: Hermes-Setup-0.16.0.exe

# 前往 github.com/NousResearch/hermes-agent/releases 获取

首次启动时,你会看到两种设置路径:

  • 快速设置:通过 Nous Portal 登录 → 选择模型 → 立即开始对话
  • 完整设置:详细的配置向导,适合高级用户

2. 远程 Gateway 连接

桌面应用支持连接远程 Hermes Gateway。设置流程:

# 在远程服务器上启动 Hermes Gateway(需先配置 OAuth)

hermes gateway start

# 桌面端配置

# Settings → Gateway → 输入远程主机地址和端口

# 选择认证方式:OAuth 或 用户名/密码

每个 Profile 可以独立配置远程主机。你甚至可以:

  • Profile A 连接自己的开发服务器
  • Profile B 连接团队的共享 Gateway
  • 在一个窗口内通过 @session 链接跨 Profile 引用

这解决了 AI 创业者最头疼的问题之一:API Key 管理。所有 Key 存储在服务器上,桌面端通过加密 WebSocket 连接,不暴露任何凭据。

3. Web Dashboard 变身管理面板

如果你主要使用 Web Dashboard,这次更新让它从一个"查看会话"的页面变成了一个完整的管理控制台

  • Channels 页面:在浏览器中配置 Telegram、Discord、Slack 等所有消息渠道
  • MCP 目录管理:启用/禁用 MCP 服务器,一键安装
  • 凭据管理:管理所有 API Key 和认证信息
  • Webhook 和 Hook 创建:配置自动化触发器
  • 内存配置:管理 Agent 的长期记忆
  • 系统页面:健康检查、更新检查、一键 Debug Share

对于需要管理多个 Agent 实例或多渠道分发的 AI 创业者,这消除了大量 SSH 到服务器手动编辑配置的工作。

▲ 图2:远程Gateway架构 — 笔记本跑界面,服务器跑算力,API Key安全隔离▲ ▲ 图2:远程Gateway架构 — 笔记本跑界面,服务器跑算力,API Key安全隔离

4. 完整简体中文支持

桌面端的聊天界面现在支持完整简体中文。切换方式:

设置 → 外观 → 语言 → 简体中文

覆盖范围包括聊天窗口、侧边栏、设置面板、命令中心、Cron 任务管理、消息平台、Profiles、Skills、Agents 等全部 UI。

需要注意的是,中文支持目前仅限桌面端 GUI——TUI(终端界面)和 CLI 仍为英文。

5. 精简的默认 Skills 集合

Hermes v0.16 对内置 Skills 做了一次"断舍离":

被移除的冗余 Skills(已被其他方式替代):

  • spotify → 由原生 Spotify Plugin 的 7 个 tools 替代
  • linear → 由 hermes mcp install linear 替代
  • kanban-codex-lanedebugging-hermes-tui-commandsdomain 等无实际用途的 Skills

从内置转为可选的 Skills(仍可一键安装):

  • 宝玉创意套装
  • dspy
  • subagent-driven-development
  • minecraft-modpack-server

新增 environments: 相关性门控:特定场景的 Skills(如 kanban、docker/s6)不会在 Skills 索引中对大多数用户显示,只在显式请求时加载。

这对 AI 创业者意味着:默认 Skills 列表更精简、更相关、更少的 prompt 噪音。而且 Skills Hub 现在支持管理内置 Skills 的裁剪——不仅限于 Agent 创建的 Skills。

6. NVIDIA/skills 加入可信 Skills Hub

NVIDIA/skills 现已成为与 OpenAI、Anthropic、HuggingFace 同级的默认可信 tap。这意味着:

# 一键安装 NVIDIA 官方 Skills

hermes skills install nvidia/cuda-x

hermes skills install nvidia/aiq

hermes skills install nvidia/cuopt

对于使用 NVIDIA 技术栈的 AI 创业者,这些 Skills 提供了经过验证的 CUDA-X、AIQ、cuOpt 工作流,直接可用。

7. /undo 命令——终于可以反悔了

这是社区请求已久的特性(Issue #21910)。使用方式:

/undo # 撤销最近一轮对话

/undo 3 # 撤销最近 3 轮对话

执行后:

  • 向前回退 N 个用户 turns
  • 预填你最后的输入,可以编辑后重新发送
  • 软删除中间的 turns

这个命令在 CLI、TUI 和所有消息平台(Telegram、Discord 等)具有完全的 parity。

实操指南:AI 创业者如何用 Hermes Desktop 搭建工作流

场景一:内容创作工作流

假设你是一个 AI 内容创业者,需要管理多平台内容发布。你可以这样配置:

# Profile 1:内容生产 Agent

# 连接到你自己的远程 Gateway

# Skills: ai-neican-hotspot, ai-neican-content-pipeline

# 模型: deepseek-v4-pro

# Profile 2:社交媒体运营 Agent

# 连接同一 Gateway,不同 session

# Skills: wechat-public-account-draft

# 模型: deepseek-v4-flash(更快的响应速度)

在桌面端,你可以同时打开两个 Profile 的标签页,在它们之间切换。通过 @session 链接,你甚至可以让一个 Profile 的 Agent 引用另一个 Profile 的输出。

场景二:远程协作

如果你有一个小团队,可以这样设置:

# 在团队服务器上启动 Gateway(配置 OAuth)

hermes gateway start --port 8080

# 团队成员在自己的桌面端配置连接

# Settings → Gateway → 输入 team-server:8080

# 用各自的账号登录

每个成员在同一个服务器上运行 Agent,但拥有独立的 session 和 Profile。共享 Skills Hub、MCP 服务器配置,但互不干扰。

场景三:Quick Setup 快速上手

如果你是新用户,Surface Release 的快速设置路径让你在几秒内开始使用:

  1. 下载桌面端安装包
  2. 双击启动
  3. 选择「Quick Setup via Nous Portal」
  4. 登录或注册 Nous Portal 账号
  5. 选择一个模型(推荐 deepseek-v4-pro)
  6. 开始对话

不需要配置 API Key,不需要编辑 YAML 文件,不需要理解 Gateway 架构。这和注册一个 SaaS 产品的体验一样简单。

▲ 图3:Surface Release七大核心升级功能一览▲ ▲ 图3:Surface Release七大核心升级功能一览

踩坑提醒

1. 桌面端 ≠ 完整的 Hermes 功能

桌面端目前主要提供聊天交互界面。部分高级功能(如 Cron 任务管理、Plugin 开发)仍需要通过 CLI 或 Web Dashboard 完成。桌面端更适合日常对话和轻量管理,重度配置还是需要终端。

2. 远程 Gateway 需要预先配置

桌面端的远程连接功能要求远程服务器已经正确配置 Hermes Gateway,包括 OAuth 提供商设置。如果你还没有设置 Gateway,需要先在服务器上执行:

hermes gateway setup

hermes gateway start

3. 中文翻译仅限桌面端

简体中文翻译目前仅覆盖桌面应用的 GUI。TUI(终端界面)和 CLI 输出仍为英文。Web Dashboard 目前也以英文为主。

4. 版本兼容性

v0.16.0 桌面端需要配合 v0.16.0+ 的 Hermes Gateway。如果你连接的是旧版 Gateway,部分功能可能不可用。建议同步升级桌面端和服务器端。

5. Node.js 版本要求

构建桌面端需要 Node.js ≥ 20.19 或 ≥ 22.12。如果你从源码构建,确保 Node 版本满足要求。

常见问题(FAQ)

Q:Hermes Desktop 和 Claude Desktop 有什么区别?

A:Hermes Desktop 是一个 Agent 框架的桌面界面,你可以选择接入任何模型(DeepSeek、GPT、Claude 等),配置任意 Skills 和 MCP 工具。Claude Desktop 只能使用 Claude 模型和有限的工具。Hermes 是开放的,Claude 是封闭的。

Q:桌面端会取代 CLI 吗?

A:不会。CLI 和 TUI 仍然是高级用户和自动化场景的核心入口。桌面端是为那些需要 GUI 的用户准备的——两者并存,各取所需。

Q:远程 Gateway 是否安全?

A:桌面端到 Gateway 的连接使用加密 WebSocket,支持 OAuth 和用户名/密码认证。所有 API Key 存储在 Gateway 服务器端,不会传输到桌面客户端。但你需要确保 Gateway 服务器本身的安全性(防火墙、HTTPS、访问控制)。

Q:能否在一个桌面端管理多个 Gateway?

A:可以。每个 Profile 可以指向不同的远程 Gateway 主机。你可以在一个桌面窗口中切换多个 Profile,管理连接多个不同的 Hermes 实例。

Q:Quick Setup 需要付费吗?

A:Nous Portal 本身是免费的。但你需要自己的 API Key(DeepSeek、OpenAI、Anthropic 等)来使用模型。Quick Setup 只是简化了 Hermes 的配置过程,不提供免费模型额度。

总结

Hermes Agent v0.16.0「Surface Release」不是一个功能更新——它是一个定位升级。

从 CLI 到 Desktop,从开发者工具到大众产品,从单机运行到远程 Gateway 架构——这次发布回答了开源 AI Agent 框架最核心的问题:「如何让非技术用户也能用上 AI Agent?」

对于 AI 创业者,这意味着:

  • 更低的使用门槛(桌面端安装即用)
  • 更灵活的工作方式(远程 Gateway + 多 Profile)
  • 更完整的管理能力(Web Dashboard 全功能面板)
  • 更快的上手速度(Quick Setup + 简体中文)

如果你一直在观望 AI Agent 工具,现在是最好的入门时机。


本文由AI辅助创作,经人工审核编辑发布

#AI创业 #HermesAgent #Agent工坊 #AI工具 #一人公司

本文由AI辅助创作,经人工审核编辑发布