5月21日,OpenAI一次性放出Appshots、Goal模式正式版、锁屏后继续工作三大功能。这是AI编程Agent从"协作者"到"替你干活"的标志性节点。
事件回顾
5月21日周四,OpenAI照例发布Codex周更新,但这次的更新量级远超普通迭代。三项核心功能集中上线:
Appshots:一键截图入上下文。 在Mac上按两下Command键,Codex就能捕获当前应用窗口——不只是截图,还包括窗口内可见及不可见的全部文本内容。你在Figma里做的设计稿、在浏览器里看的API文档、在终端里跑的错误日志,双Command一按,Agent瞬间理解上下文。不需要写长prompt描述"我在看第几行代码的第几个函数",直接让它看图。
Goal模式正式毕业。 /goal 指令从实验功能升级为正式版,覆盖Codex App、IDE扩展和CLI。给Codex一个具体目标和成功标准,它会一直工作直到达成——跨小时甚至跨天。你可以中途检查进度、微调方向,甚至暂停它。实测数据:有工程师用 /goal ship the 18 features in BACKLOG.md before standup,关电脑去吃晚饭,第二天早上11点回来时,14/18个功能已经完成,PR已提交,CI绿灯,GPT-5.5子Agent自我审查完毕。
锁屏后继续工作。 Mac锁屏不再是Agent的终点。Codex现在可以在锁屏状态下持续运行,你从手机上的ChatGPT App远程查看进度、回答问题、批准操作、切换方向。这意味着:早上在办公室开始一个重构任务,中午去吃饭锁屏不中断,下午在路上用手机检查结果。
配合5月14日上线的ChatGPT移动端Codex远程访问,这形成了一个完整的"Agent永不停机"工作流。
为什么重要
这一轮更新的核心信号:AI编程Agent正在从"坐在你旁边的副驾驶"进化成"替你值夜班的工程师"。
回顾2025-2026年AI编程工具的进化路径:
- 2025年中:Claude Code、Codex CLI初登场,Agent还是"你发指令、它执行、你盯着看"
- 2025年底:Claude Code Agent Teams、Codex多Agent架构,开始并行工作
- 2026年2月:Codex App上线macOS,有了桌面端的完整Agent
- 2026年4月:各种Sub-agent模式出现,探索与编辑分离
- 2026年5月:Goal模式+锁屏运行+手机远程,Agent真正可以独立长时间工作
这不是渐进式改进,而是工作范式的转折。以前AI编程工具解决的是"写代码更快",现在解决的是"有没有人不写也能把活干了"。
对于AI创业者来说,这意味着:
- 一个人可以同时推进多个项目:给Agent下达Goal后去忙别的,回来看结果
- 时间成本从"实时盯屏"变成"异步审查":你的工作时间不再是Agent的工作时间
- "一人公司"的物理限制进一步瓦解:原本需要雇人做的重复性编程工作,Agent可以通宵完成
竞争格局:Codex vs Claude Code的差异化路线
Codex和Claude Code两大Agent已经是2026年编程工具的双寡头,但它们的路线正在分化:
| 维度 | Codex(OpenAI) | Claude Code(Anthropic) |
|---|---|---|
| 核心哲学 | 自主代理,你定目标它干活 | 终端伴侣,深度协作 |
| 运行方式 | 云端沙箱+远程,锁屏也能跑 | 本地终端,需要活跃会话 |
| 上下文 | GPT-5.5,默认272K(长模式1.05M) | Opus 4.7,1M token |
| 代码质量 | SWE-bench 77.3%(Terminal-Bench领先) | SWE-bench 87.6%(盲审67%胜出) |
| 成本 | 同一重构任务$15 | 同一重构任务$155(~10倍) |
| 移动端 | ChatGPT App远程控制 | Dispatch手机触发桌面会话 |
▲ Codex与Claude Code 2026年核心维度对比
两条路线的本质区别:Codex在押注"我不在电脑前时代码也能写好"的完全自主路线;Claude Code在押注"我在终端里和Agent深度协作"的精品路线。两者不互斥——成熟的AI创业者可能白天用Claude Code做精细重构,晚上让Codex跑Goal模式做批量任务。
对AI创业者的三个行动启示
1. 学会写"Goal语句",而不只是"Prompt"
Goal模式的核心不是提示词技巧,而是定义"什么是完成"。好的Goal语句包含:
- 具体可验证的产出(不是"优化代码",而是"将所有API路由的错误处理统一为RFC 7807格式")
- 成功标准(不是"让代码更好",而是"所有测试通过且ESLint零警告")
- 边界条件("不要修改数据库schema")
2. 构建"白天Claude + 晚上Codex"的双Agent工作流
这不是二选一的问题。实际高效的做法是:
- 白天:用Claude Code做需要深度理解的大型重构和架构决策(贵但准)
- 晚上/离线:用Codex Goal模式跑测试覆盖补充、文档生成、依赖升级、格式化统一等批量任务(便宜且可无人值守)
- 用手机随时检查Codex进度,发现方向偏了及时纠正
▲ 白天Claude Code精密重构 + 夜间Codex Goal批量自动化
3. 重新计算你的时间价值
如果Codex能用$15-30的API成本完成原本需要你4-6小时的重复编程工作,而你的时薪折算远高于此,那么不使用它就是纯粹的机会成本损失。一人公司的核心公式:时薪 × 节省的小时数 > Agent API成本 = 闭眼用。
风险提示
Goal模式虽然正式发布,但仍有局限:
- Token消耗巨大,长任务要关注API账单
- 复杂重构容易偏离方向,需要定期检查
- 某些类型任务(UI微调、性能优化)目前还是人工更靠谱
- 锁屏后持续运行需要Mac保持开机和网络连接
目前Codex仅支持macOS,Windows和Linux用户需要等待或使用CLI版本(功能受限)。此外,Codex和Claude Code都在快速迭代中,功能对比可能几周内就会过时,建议关注官方Changelog。
#AI风向 #Codex #AI编程Agent #一人公司 #OpenAI
本文由AI辅助创作,经人工审核编辑发布
