OpenClaw 昨天发布的 2026.5.24-beta.2 带来了三个重量级功能:Meeting Notes 自动会议纪要、实时语音打断操控、iMessage 点赞审批。本教程带你从零搭建一个「会议自动记录 + 实时语音指挥」的 AI 助手,并附完整踩坑记录。
为什么你应该关注这版 OpenClaw
OpenClaw 是目前 AI Agent 生态里更新最密集、功能迭代最快的多通道 Agent 框架之一。从 5 月初到现在,它保持了每周 1-2 个版本的发布节奏。2026.5.24 这一版尤其值得关注,因为它补齐了两个「一人公司」的关键场景:
- 会议场景:Meeting Notes 插件可以自动捕获 Discord 语音会议内容,生成结构化纪要——不需要手动记笔记,不需要事后回忆
- 实时操控:在 Agent 执行任务的过程中,你可以通过语音(WebUI 或 Discord)实时打断、纠正、或追加指令——不再需要等任务跑完才发现方向错了
- 移动审批:iMessage 点赞(👍)/ 点踩(👎)即可审批 Agent 的敏感操作——走在路上也能管控 AI
这三个功能组合在一起,OpenClaw 正在从一个「聊天机器人框架」进化为「AI 运营中枢」。
环境准备
安装 OpenClaw
依赖清单
| 依赖 | 用途 | 必需 |
|---|---|---|
| Node.js ≥ 20 | 运行时 | ✅ |
| Discord Bot Token | 语音通道 + 会议纪要 | ✅(会议场景) |
| Anthropic API Key 或 Claude Pro OAuth | LLM 后端 | ✅ |
| macOS(iMessage 功能) | 移动审批 | 可选 |
Discord Bot 配置(关键步骤)
这是最容易卡住的环节。你需要:
- 前往 Discord Developer Portal 创建应用
- 在 Bot 设置中开启
MESSAGE CONTENT INTENT、SERVER MEMBERS INTENT、VOICE STATE INTENT - 生成 Bot Token 并邀请 Bot 加入你的服务器(需要
Send Messages、Connect、Speak权限) - 在 OpenClaw 配置文件中填入 Token:
核心功能一:Meeting Notes — 自动会议纪要
▲ OpenClaw Meeting Notes 工作流程:Discord 语音 → 文字转录 → AI 摘要 → 结构化纪要输出
Meeting Notes 是 2026.5.22 引入、5.24 完善的外部插件。它的工作方式:
- OpenClaw 加入 Discord 语音通道
- 捕获语音转文字(Speech-to-Text)
- 在会议结束后,由 LLM 自动生成结构化纪要
- 支持手动导入文字稿(Transcript)——即使没有语音通道也能用
配置 Meeting Notes
启动会议捕获
会议结束后,Bot 会自动生成如下格式的纪要:
手动导入文字稿
如果没有实时语音捕获条件,可以导入已有的文字稿:
导入后 OpenClaw 会用 LLM 提取关键信息,生成同样的结构化纪要。
核心功能二:实时语音操控 — 打断、纠正、追加
▲ 实时语音操控流程:语音指令 → 中断当前任务 → 调整方向 → 按新指令继续执行
这是 2026.5.24 最亮眼的功能。Agent 正在执行一个长任务(比如写代码、做研究、批量处理数据)时,你不需要等它跑完——直接通过 WebUI 或 Discord 语音说:
- 「停,方向错了,应该先处理用户认证模块」
- 「当前进度?」
- 「把这个结果先保存,然后继续」
Agent 会在当前步骤完成后响应你的指令,调整方向继续执行。
配置实时操控
使用示例
在 Agent 执行任务时,你可以:
语音操控的实际效果
在 Discord 语音通道中的完整交互流程:
这个交互模式的核心价值在于:AI 在执行,人在决策——把重复劳动交给 Agent,把判断和方向留在人类手里。
核心功能三:iMessage 点赞审批(macOS 独占)
▲ iMessage 移动审批流程:敏感操作请求 → iMessage 推送 → 👍/👎 快速审批 → 执行或取消
对于需要 Agent 执行敏感操作(如发消息、改配置、访问付费 API)的场景,OpenClaw 支持通过 iMessage 的 Tapback 反应来审批。
配置 iMessage 审批
工作流程
对于非 macOS 用户,同样的审批流程也支持 WhatsApp(channels.whatsapp)。
实战:搭建一个完整的会议助手
把以上三个功能串起来,搭建一个实用的会议助手。
场景
你是一个独立开发者/创业者,每天有 2-3 个客户或团队会议。你需要:
- 自动记录每个会议的内容
- 生成行动项清单
- 在 Agent 执行会议后续任务时,能实时纠正方向
完整配置文件
启动与使用
会议中的实时交互
踩坑与排障
坑 1:Discord Bot 无法加入语音通道
症状:openclaw meeting-notes start 报错 No voice channel found
原因:Bot 缺少 Connect 和 Speak 权限,或者 VOICE STATE INTENT 未开启
解决:
坑 2:Meeting Notes 不生成纪要
症状:会议结束后没有输出
可能原因:
- 音频捕获为空(检查 Discord 语音通道是否有人在说话)
output.channelId配置错误(Bot 没有该频道的发送权限)- LLM 调用失败(检查 API Key 是否有效)
排查步骤:
坑 3:语音操控延迟高
症状:说出指令后 5-10 秒才响应
原因:
- Agent 正在执行长任务,需要当前步骤完成才能响应
- 网络延迟(特别是国际 LLM API)
优化:
坑 4:iMessage 审批不生效
症状:Agent 发了 iMessage 但点赞没有触发审批
原因:
allowFrom号码格式不对(需要完整的国际格式+86...)- macOS 上 iMessage 未登录同一个 Apple ID
- OpenClaw 没有「完全磁盘访问权限」(macOS 安全设置)
解决:
- 系统设置 → 隐私与安全性 → 完全磁盘访问 → 添加 Terminal/iTerm
- 确认号码格式:
+8613800138000(不是13800138000)
坑 5:Gateway 启动慢
症状:openclaw gateway start 需要 20+ 秒
原因:OpenClaw 需要加载所有插件和通道
5.24 版本的改进:这一版做了大量 Gateway 性能优化:
- 插件元数据缓存(避免重复读取文件系统)
- 懒加载启动空闲插件
- 通道目录缓存
实测启动时间从 ~20s 降到 ~8s。但还是建议用 pm2 或 systemd 管理 Gateway 进程,而不是每次手动启动。
与其他方案的对比
| 功能 | OpenClaw 5.24 | Otter.ai | Fireflies.ai | 自建方案 |
|---|---|---|---|---|
| 会议纪要 | ✅ Discord 语音 | ✅ Zoom/Meet | ✅ Zoom/Meet | 需要集成 STT |
| 实时操控 | ✅ 语音打断+转向 | ❌ | ❌ | ❌ |
| 移动审批 | ✅ iMessage/WApp | ❌ | ❌ | ❌ |
| 开源 | ✅ MIT | ❌ | ❌ | ✅ |
| 自定义程度 | 极高 | 低 | 中 | 极高 |
| 成本 | API 费用 | $10-20/月 | $10-19/月 | 开发成本 |
OpenClaw 的优势在于一体化——你不需要分别买 Otter 做会议纪要、再买一个审批工具、再写脚本串联它们。一个 OpenClaw 实例搞定全部。
常见问题(FAQ)
Q:非 macOS 用户能用 iMessage 审批吗?
A:可以用 WhatsApp 替代。配置 channels.whatsapp 并在 channels.imessage 处替换为 WhatsApp 通道即可。但 WhatsApp 目前不支持 Tapback,只能文字回复 /approve。
Q:Meeting Notes 支持中文吗?
A:支持。底层用的是 Claude/GPT 的语音识别 + LLM 摘要,中文识别效果良好。纪要输出语言取决于你的 Agent persona 配置(写中文 person 就输出中文纪要)。
Q:语音操控一定需要 Discord 吗?
A:WebUI 也支持实时语音操控(Web Speech API)。但不依赖 Discord 的 WebUI 方案需要你自己维护 Web 前端。Discord 是目前最完整的开箱即用方案。
Q:5.24 稳定吗?还是等正式版?
A:beta.2 标签意味着仍在快速迭代中。但 OpenClaw 的 beta 质量通常不错——核心功能(Meeting Notes、Voice Steering)在 5.22 就已经实装,5.24 主要是性能优化和 iMessage 审批的完善。建议先在测试环境试用再上生产。
Q:一个人用 OpenClaw 是不是杀鸡用牛刀?
A:如果你的需求只是「开会时自动记笔记」,Otter.ai 就够了。但如果你需要的是一个能听懂指令、能执行任务、能在多个平台间切换的 AI 助手——比如开完会立刻发纪要、提取行动项、追踪执行、审批敏感操作——OpenClaw 的价值就体现出来了。一人公司的竞争力往往来自工具链的自动化深度,而不是工具数量。
总结
OpenClaw 2026.5.24 的三个核心能力——Meeting Notes、实时语音操控、iMessage 审批——组合在一起,让 AI Agent 从一个「对话玩具」变成了「运营中枢」:
- 会议纪要:解放双手,让 AI 做你的会议秘书
- 实时操控:保持人类在关键决策环内,AI 在快速执行环内
- 移动审批:随时随地管控 AI 行为,不绑定桌面
对于一人公司和独立开发者来说,这意味着可以用更少的「运营人员」覆盖更多的「运营场景」——因为你唯一的「员工」是一个 7×24 的 AI Agent。
下一步建议:
- 先在测试 Discord 服务器跑通 Meeting Notes
- 试用语音操控的打断和转向
- 逐步加入 iMessage/WhatsApp 审批
- 把配置沉淀为可复用的模板
工具的尽头不是更多的工具,而是更少的重复劳动。OpenClaw 正在往这个方向快速迭代。
#AI创业 #Agent工坊 #OpenClaw #一人公司 #会议助手
本文由AI辅助创作,经人工审核编辑发布
