AI风向

【AI风向】AI Agent学会改自己代码了:MOSS论文揭示自进化Agent新时代,Hermes被点名

一篇刚刚登上arXiv的论文宣告:AI Agent不再需要人类手动修bug了——它能自己改写源代码、自动验证、灰度上线。在OpenClaw实测中,单次无人干预的自进化将任务评分从0.25拉升至0.61。

发生了什么

2026年5月下旬,一篇题为《MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems》的论文登上arXiv(编号2605.22794),瞬间在AI Agent开发者社区引发震动。

这篇论文的核心主张非常简单但激进:当前的AI Agent(包括Hermes Agent、OpenClaw、Claude Code等)在部署后都是"静态"的——它们不会从用户交互中学习,反复出现的失败只能等人类开发者下一个版本更新才能修复。

虽然业界已经有"自进化Agent"的尝试,但论文指出它们都困在一个根本性的限制里:只能改写文字层面的配置(skill文件、prompt、记忆schema、工作流图),而Agent的核心"骨架"(路由逻辑、钩子排序、状态不变量、调度分发)都写在代码里,文字层面根本碰不到。

MOSS的答案:让Agent直接改写自己的源代码。

MOSS做了什么

论文展示了一套完整的自进化流水线:

  1. 自动收集失败证据:从生产环境中自动抓取Agent执行失败的任务批次
  2. 代码级改造:调用外部编码Agent CLI(比如Claude Code),直接修改Agent框架的源代码——不是改prompt,是改Python/TypeScript文件
  3. 沙盒验证:在临时worker中重放失败任务批次,验证候选代码是否真的解决了问题
  4. 灰度发布:通过用户同意的容器原地替换上线,带健康探针的自动回滚机制

整个过程完全无人干预

MOSS自进化Agent架构:四阶段流水线

▲ MOSS自进化四阶段流水线:失败收集→代码改造→沙盒验证→灰度上线

数据有多震撼

在OpenClaw平台上的实测结果:

  • 四任务平均评分:从0.25提升至0.61(提升144%)
  • 进化发生在单次循环内:不需要多轮迭代
  • 不退化保证:配套论文《Ratchet》提供了"最低卫生配方",确保Agent不会把自己改写成一个更烂的版本

更值得关注的是论文中的一张能力对比表:

Agent框架 Skill Prompt Memory Harness(核心骨架)

Hermes Agent ✓ × ✓ ×

SkillClaw ✓ × × ×

GenericAgent ✓ × ✓ ×

EvoAgentX ✓ ✓ × ×

MOSS (本文) ✓ ✓ ✓ ✓

Hermes Agent被直接点名:它支持Skill和Memory的自定义,但不支持Prompt层面的进化,更无法触碰Harness(核心骨架代码)。MOSS是第一个四项全开的系统。

AI Agent框架自进化能力对比:MOSS四项全开

▲ 五大Agent框架自进化能力对比:MOSS是唯一Skill/Prompt/Memory/Harness四项全开的系统,评分从0.25提升至0.61

为什么这对AI创业者至关重要

1. Agent维护成本将断崖式下降

今天一个生产环境Agent出问题,流程是:用户反馈 → 开发者排查 → 定位代码问题 → 修改 → 测试 → 发布。这个循环短则几小时,长则几天。MOSS展示的未来是:Agent在执行任务时失败了,自己分析根因,自己改代码修好,自己验证通过,然后通知你"我修了一个bug,要不要上线?"

对于一人公司或小团队创业者,这意味着你维护10个Agent和100个Agent的边际成本趋近于零。

2. Agent从"工具"变成"同事"

当Agent能自我改进时,它不再是一个被你配置的工具,而是一个会成长的数字同事。你今天部署的Agent v1,可能在处理了1000个用户请求后自动进化到v1.7——每一次失败都是它的学习机会,而不是你的待办工单。

3. 技术栈选择将直接影响竞争力

论文明确指出了一个残酷事实:如果你的Agent框架只支持"文字层面"的自定义(prompt调优、skill文件修改),那当竞争对手的Agent能直接改源码自我进化时,你的产品迭代速度会被碾压。选择支持全栈自进化的框架,将成为Agent创业者的战略决策。

同一周,Google发布了"托管Agent"

就在MOSS论文出现的同一周(5月19-23日),Google I/O 2026上也宣布了Gemini API的Managed Agents功能——开发者用一次API调用就能启动一个7×24小时运行的Agent,Google负责服务器端的Agent循环、状态持久化、调度触发。

这两个信号叠加,指向同一个方向:Agent正在从"你自己搭、自己管"变成"平台托管、自主进化"。未来的AI创业者可能不再需要管理服务器,也不需要手动修bug——你的工作变成:定义Agent的目标和工具权限,然后放手让它自己跑、自己学、自己变强。

实操:你现在就能做什么

虽然MOSS尚未开源(论文刚发布),但你可以立即在自己的Agent工作流中应用轻量版自进化模式:

  1. 每次任务后加评估步骤:在Agent执行完任务后,用另一条LLM调用评估输出质量。低于阈值(比如7/10分)→ 触发"自我改进"流程
  2. 用高推理模型做自分析:改进Agent用Claude Opus或o3分析失败原因,生成修改建议(可以是prompt调整或代码patch)
  3. 记录+对比:保存每次改进前后的评分,确保Agent不会退化
  4. 利用MCP协议解耦:把Agent的工具定义放在MCP服务器上,这样切换底层框架时工具能力不丢失

风险提醒

  • MOSS目前是研究阶段,生产部署还需等待开源实现
  • 自修改代码有安全风险——论文中的"用户同意门控"和"自动回滚"机制是必须的
  • Agent自进化可能导致行为漂移,需要持续的可观测性监控
  • 不同Agent框架的自进化能力差距巨大——选择框架时把这个维度纳入评估

本文信息基于arXiv论文2605.22794、StartupHub.ai分析、Requesty技术博客及Google I/O 2026公开资料整理。AI辅助创作,经人工审核编辑发布。


#AI创业 #AIAgent #自进化 #MOSS #一人公司

本文由AI辅助创作,经人工审核编辑发布