AI风向

【AI风向】OpenAI Codex大更新:按两下Cmd就能把任意App截图喂给AI,Goal模式让它替你通宵写代码

5月21日,OpenAI一次性放出Appshots、Goal模式正式版、锁屏后继续工作三大功能。这是AI编程Agent从"协作者"到"替你干活"的标志性节点。

事件回顾

5月21日周四,OpenAI照例发布Codex周更新,但这次的更新量级远超普通迭代。三项核心功能集中上线:

Appshots:一键截图入上下文。 在Mac上按两下Command键,Codex就能捕获当前应用窗口——不只是截图,还包括窗口内可见及不可见的全部文本内容。你在Figma里做的设计稿、在浏览器里看的API文档、在终端里跑的错误日志,双Command一按,Agent瞬间理解上下文。不需要写长prompt描述"我在看第几行代码的第几个函数",直接让它看图。

Goal模式正式毕业。 /goal 指令从实验功能升级为正式版,覆盖Codex App、IDE扩展和CLI。给Codex一个具体目标和成功标准,它会一直工作直到达成——跨小时甚至跨天。你可以中途检查进度、微调方向,甚至暂停它。实测数据:有工程师用 /goal ship the 18 features in BACKLOG.md before standup,关电脑去吃晚饭,第二天早上11点回来时,14/18个功能已经完成,PR已提交,CI绿灯,GPT-5.5子Agent自我审查完毕。

锁屏后继续工作。 Mac锁屏不再是Agent的终点。Codex现在可以在锁屏状态下持续运行,你从手机上的ChatGPT App远程查看进度、回答问题、批准操作、切换方向。这意味着:早上在办公室开始一个重构任务,中午去吃饭锁屏不中断,下午在路上用手机检查结果。

配合5月14日上线的ChatGPT移动端Codex远程访问,这形成了一个完整的"Agent永不停机"工作流。

为什么重要

这一轮更新的核心信号:AI编程Agent正在从"坐在你旁边的副驾驶"进化成"替你值夜班的工程师"。

回顾2025-2026年AI编程工具的进化路径:

  • 2025年中:Claude Code、Codex CLI初登场,Agent还是"你发指令、它执行、你盯着看"
  • 2025年底:Claude Code Agent Teams、Codex多Agent架构,开始并行工作
  • 2026年2月:Codex App上线macOS,有了桌面端的完整Agent
  • 2026年4月:各种Sub-agent模式出现,探索与编辑分离
  • 2026年5月:Goal模式+锁屏运行+手机远程,Agent真正可以独立长时间工作

这不是渐进式改进,而是工作范式的转折。以前AI编程工具解决的是"写代码更快",现在解决的是"有没有人不写也能把活干了"。

对于AI创业者来说,这意味着:

  • 一个人可以同时推进多个项目:给Agent下达Goal后去忙别的,回来看结果
  • 时间成本从"实时盯屏"变成"异步审查":你的工作时间不再是Agent的工作时间
  • "一人公司"的物理限制进一步瓦解:原本需要雇人做的重复性编程工作,Agent可以通宵完成

竞争格局:Codex vs Claude Code的差异化路线

Codex和Claude Code两大Agent已经是2026年编程工具的双寡头,但它们的路线正在分化:

维度Codex(OpenAI)Claude Code(Anthropic)
核心哲学自主代理,你定目标它干活终端伴侣,深度协作
运行方式云端沙箱+远程,锁屏也能跑本地终端,需要活跃会话
上下文GPT-5.5,默认272K(长模式1.05M)Opus 4.7,1M token
代码质量SWE-bench 77.3%(Terminal-Bench领先)SWE-bench 87.6%(盲审67%胜出)
成本同一重构任务$15同一重构任务$155(~10倍)
移动端ChatGPT App远程控制Dispatch手机触发桌面会话
Codex vs Claude Code对比

▲ Codex与Claude Code 2026年核心维度对比

两条路线的本质区别:Codex在押注"我不在电脑前时代码也能写好"的完全自主路线;Claude Code在押注"我在终端里和Agent深度协作"的精品路线。两者不互斥——成熟的AI创业者可能白天用Claude Code做精细重构,晚上让Codex跑Goal模式做批量任务。

对AI创业者的三个行动启示

1. 学会写"Goal语句",而不只是"Prompt"

Goal模式的核心不是提示词技巧,而是定义"什么是完成"。好的Goal语句包含:

  • 具体可验证的产出(不是"优化代码",而是"将所有API路由的错误处理统一为RFC 7807格式")
  • 成功标准(不是"让代码更好",而是"所有测试通过且ESLint零警告")
  • 边界条件("不要修改数据库schema")

2. 构建"白天Claude + 晚上Codex"的双Agent工作流

这不是二选一的问题。实际高效的做法是:

  • 白天:用Claude Code做需要深度理解的大型重构和架构决策(贵但准)
  • 晚上/离线:用Codex Goal模式跑测试覆盖补充、文档生成、依赖升级、格式化统一等批量任务(便宜且可无人值守)
  • 用手机随时检查Codex进度,发现方向偏了及时纠正
白天Claude + 晚上Codex双Agent工作流

▲ 白天Claude Code精密重构 + 夜间Codex Goal批量自动化

3. 重新计算你的时间价值

如果Codex能用$15-30的API成本完成原本需要你4-6小时的重复编程工作,而你的时薪折算远高于此,那么不使用它就是纯粹的机会成本损失。一人公司的核心公式:时薪 × 节省的小时数 > Agent API成本 = 闭眼用

风险提示

Goal模式虽然正式发布,但仍有局限:

  • Token消耗巨大,长任务要关注API账单
  • 复杂重构容易偏离方向,需要定期检查
  • 某些类型任务(UI微调、性能优化)目前还是人工更靠谱
  • 锁屏后持续运行需要Mac保持开机和网络连接

目前Codex仅支持macOS,Windows和Linux用户需要等待或使用CLI版本(功能受限)。此外,Codex和Claude Code都在快速迭代中,功能对比可能几周内就会过时,建议关注官方Changelog。


#AI风向 #Codex #AI编程Agent #一人公司 #OpenAI

本文由AI辅助创作,经人工审核编辑发布