2026-04-20

不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品

Claude Code 用户 / PM / 副业人 / 不碰代码的产品人，这篇写给你们。一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发…

Claude Code 用户 / PM / 副业人 / 不碰代码的产品人，这篇写给你们。

一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。

设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发 · 8 个环节、6 个产品，一个人，一个 App 里全跑完。

不是 PPT 演示，不是模拟器截图。是 OpenAI 刚刚发的 Codex Super App 在内部演示里的真实交付。

一句话定位 · Codex App 不是又一个 AI 编程工具，是 OpenAI 把 AI Agent 做成了一套操作系统。

Projects 项目管理 + Automations 定时自动化 + Skill API 自定义能力 + 111 个内置插件 + Local / Worktree / Cloud 三种运行模式。组合起来才是"操作系统"三个字的意思 · 多任务并发、后台任务自己跑、能力可以扩展、环境可以切换。

产品还没对大众开放，ChatGPT Plus / Pro / Business 的开发者用户能下载 Developer Preview。Twitter 上 2.8 万播放、484 点赞、938 个书签 · 正常内容是点赞多于书签 5 倍，这次反过来了。不是"看完点个赞就走"，是"我要回来的"。938 个人等的是"开放第一天照着跑"。

这篇是给这几批人看的 ·

Claude Code 的老用户，01:09:46 那一帧会告诉你，你在接下来的工具分层里应该站哪一层
PM / 副业人 / 独立开发者，4 大功能怎么配 + 6 个产品怎么并发 + 第一个副业 MVP 怎么开工
不碰代码的产品人，AI 从工程师玩具变成操作系统的那个节点已经到了，调度层的工具长这个样

读完你知道两件事 · 这 App 具体能给你干什么,以及你在接下来的 AI 工作流分工里站哪个位置。

配图 · Twitter 原帖截图 · 2.8 万播放 / 938 书签 / 484 点赞的数据条

§ 一先说清楚这是什么 · 别跟 Codex CLI 搞混

OpenAI 叫 Codex 的东西至少有 3 个。

第一个是 2021 年那个 Codex，代码补全模型，给早期的 GitHub Copilot 用，已经退役了。第二个是 Codex CLI，OpenAI 去年放出来的命令行工具，终端里敲命令跟模型交互，偏工程师。

今天视频里演示的是第三个，Codex 桌面 App，一个 GUI 应用。

底层模型 GPT-5.4，默认推理档位 Extra High，右下角界面里能看到。官方口号 Build faster with Codex, A coding agent that helps you build and ship with AI。

已经在用的企业客户，Duolingo、Vanta、Virgin Atlantic、Miro、Rakuten。都是海外头部科技公司，直接进入生产环境的那批。

它跟 Claude Code 不在一个形态上。Claude Code 是终端 CLI，工程师舒服；Codex App 是桌面 GUI，侧边栏 + 面板 + 内置终端 + 插件市场，更像一个"能跑 Agent 的操作系统壳子"，后面几节你会看到具体差别。

为啥 OpenAI 要做 Super App 而不是继续加强 CLI。因为 CLI 这个形态天然圈住了工程师，想要触达"不碰代码的产品人 / PM / 副业人"，必须换形态。GUI 面板 + 111 个开箱插件 + 无代码 Automation，这三件事凑在一起才能把 AI agent 从"程序员的玩具"变成"每个人的操作系统"。

这段先钉死一件事，这不是命令行，是一个 App，接下来 4 个功能都围绕"App 能干什么 CLI 干不了的"展开。

配图 · 时间戳 14:29 · Codex App 主界面功能总览镜头

§ 二功能 ① · Projects 项目管理 · 多项目并行不用多开终端

视频里 04:53 开始演示。

核心价值一句话 · 把"多对话"收进"多项目"，每个项目底下跑多条并行的 Agent 线程，开着 5 个项目不乱。

怎么做 · 按视频顺序

左侧边栏，点 New chat 上面那个 Projects 图标，进入项目列表
右上角 Create Project，填项目名字和描述（比如"闲鱼机器人项目" / "副业周报自动化"）
进 Project 内部，侧边出现 Thread 列表（每个 Thread 就是一条对话线程）
点 New Thread，每条 Thread 独立跑自己的 Agent，互不干扰
右侧 Project sidebar（默认展开，在主面板右边），统一看所有 Thread 状态，谁跑完了谁卡住了一目了然
队列区域里待执行的消息可以拖动重排，想先跑哪个拖到最上面
同一条 Thread 可以从某条消息处 Fork 出新分支（右键消息 → Fork from here），等于"我这个方向试试看，不行回到原路"

14:29 功能总览镜头里还挂着这些

Projects 模块底下的细节能力，视频画面一帧能看到 7 条 ·

多项目（Multiple projects）
并行 Agent 线程（Parallel agent threads）
对话分叉（Conversation forking），刚才第 7 步说的 Fork
Handoff between Local and Worktree，本地跑着跑着切到分支隔离模式继续
Queue message reordering，待执行消息重排
Thread 重命名 / 搜索 / 跳最近
整个 Project 下所有本地 Thread 一键归档

跟 Claude Code 对照着看

Claude Code 走 CLI，多任务靠你手动 tmux 或者多开几个终端窗口。你得自己记住哪个窗口在干哪个项目，session 管理完全靠肌肉记忆，关机重启全丢。Codex App 把这一层做成可视化面板，状态持久化，对"同时推多个副业又不想被配置卡住"的人来说，门槛差了一个台阶。

避坑

Thread Fork 这个功能很容易被忽略，但它解决的问题非常具体 · 你让 Agent 做一个需求，它给了方案 A，你想"要不试试方案 B"，但又不想废掉方案 A 的上下文。这时候 Fork 出去试 B，B 不成再回 A 继续。这是 Claude Code 里要手动备份 session 才能做到的事。

副业人手头 5 个项目（一个 iOS App、一个公众号、一个闲鱼店、一个 Discord bot、一个博客），不用 5 个终端窗口了，一个 App 全装下，项目之间切换不用重新装上下文。

配图 · 时间戳 04:53 · 创建 Project 界面截图，Project sidebar 展开状态

§ 三功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

视频里 18:07 开始演示。

核心价值一句话 · 自然语言指令就能建一个定时触发的 Agent 任务，不写一行代码，不配 cron 表达式。

怎么做 · @rileybrown 演示的完整流程

在 Plugins 面板连上 Google Calendar 和 Gmail（这两个是 Codex App 内置插件，点击 Authorize 授权一次就成）
新开一条对话，输入"列出本周日历事件"
Agent 自动调 Calendar 插件，读本周事件，返回结构化清单
继续输入"把这份周报发邮件给我"
Agent 自动调 Gmail 插件，填主题、填正文、发送
邮件落到收件箱，发件人 riley@notanumber.com，主题 Weekly Calendar Recap: April 13-19, 2026

关键一步 · 固化为 Automation

这是个一次性任务，接下来固化它 ·

在这条对话的右上角，有个 Save as Automation 按钮，点它
弹出配置面板，选触发条件。视频里能看到的触发类型至少 4 种 ·
- 时间触发（每周一 09:00 / 每天 08:00 / 每月 1 日这种）
- 邮件触发（收到来自 XXX 的邮件时）
- 日历触发（新事件创建时 / 事件开始前 15 分钟）
- 文件触发（Google Drive 里某个文件更新时）
填名字（比如"每周日历周报"），保存

这条任务从此自己跑。每周一早上 09:00，Agent 自动读完日历，整理周报，发邮件。你不用再开 App，不用再输入一遍指令。

25:26 Steering vs Queueing · 两种工作模式

视频里专门讲了这个对比 ·

Steering，实时对话引导，你边看它干边插话调整。适合 · 没做过的事、需要监督的任务、会有反复迭代的事。
Queueing，批量排一堆指令，Agent 依次执行。适合 · 已经固化流程的事、重复任务、你不想盯着的事。

判断逻辑 · 这个任务你已经做过 3 次以上而且每次流程几乎一致 → 走 Queueing → 再升级到 Automation 定时跑。没做过的、流程不稳定的 → 走 Steering。

跟 Claude Code 对照着看

Claude Code 要做定时任务，你得自己写 bash 脚本 + macOS launchd 或者 cron entry，再把 claude CLI 包一层。能做，但门槛不低，一般用户不会走到这步。Codex App 把这一层砍平到 UI 按钮，一个 form 填完。

避坑

触发条件的"邮件触发"和"文件触发"这两个虽然灵活，但容易触发过度（每次收到邮件都跑 Agent）。建议起手先用"时间触发"，固定点跑，观察几周确定 Agent 确实在干对的事，再考虑切事件驱动。

一个 PM 每周做的"跨部门周报"、一个独立开发者每周做的"竞品定价巡检"、一个副业人每天做的"评论监控"，以前要么自己搞定时脚本要么手动做，现在一句话配完，第二天开始 Agent 自己跑，邮件 / Slack / 钉钉通知就到了。

938 书签背后的心理其实就一条，不是学功能，是等产品开放之后立刻把自己那几个重复任务配进去，省下来的时间比看这个视频多几十倍。

配图 · 时间戳 18:07 · Calendar 读取 + 邮件发送全流程界面

§ 四功能 ③ · 自定义 Skill API · 把某个 API 变成 Codex 能调的能力

视频 27:35 开始，这是 Part 1 最后一个、也是最有想象空间的功能。

核心价值一句话 · Codex App 内置 111 个插件，不够用，你可以在图形界面里自己写一个 Skill，把任意 API 变成 Agent 能调的能力。

怎么做 · 建一个 YouTube Research Skill

@rileybrown 演示的完整流程 ·

Plugins 面板 → 右上角 Create Skill（或 Custom Skill）
填 Skill 名字（YouTube Research）和描述。描述很关键，Agent 根据这个描述判断"这个场景要不要调这个 Skill"，写清楚"用途是查 YouTube 视频 / 频道数据"
配 API 接口 · 填 endpoint（YouTube Data API v3 的 search endpoint）、auth token（你的 YouTube API Key）、query 参数的 schema
前置条件 · YouTube Data API 需要在 Google Cloud Console 申请 API Key，免费额度每天 10000 单位调用够用。视频里没提这一步，但实际你要先去拿 Key
保存，Skill 生效，在 Plugins 列表里出现

31:34 实际使用

新开对话，输入"找过去 7 天关于 Claude Code 的 YouTube 高赞视频，列出标题 + 观看数 + 发布时间"
Codex Agent 识别这是 YouTube Research Skill 的场景，自动调用
返回结构化结果，格式是表格

33:24 包装成 Automation 定时跑

选这条对话 → Save as Automation
触发器设"每天 09:00"，保存
Skill 从此每天早上自动跑一遍，结果发邮件

跟 Claude Code 的 MCP 对照着看

Claude Code 走 MCP 协议，你要加一个自定义 Server，得写 Node.js 或 Python 的 MCP Server 代码 → 改 ~/.claude/mcp.json 或 claude_desktop_config.json → 重启 → 试错调试。Codex App 把这整套收进图形面板，定义 API 接口这一步在一个 form 里填完，没碰一个配置文件。

哪些人对这个差别最有感触，PM、不想碰配置文件的独立开发者、把 AI 当工具而不是把 AI 当同事的那批人。对工程师来说 MCP 也不是什么门槛，对 PM 来说"配置文件"这三个字就是门。

避坑

Skill 的描述（第 2 步那个）不要写成"调用 YouTube API"这种功能描述，要写成"用途是 XXX"的场景描述。Agent 识别是不是要调这个 Skill，靠的是场景匹配不是功能名字。描述写得越像"我什么时候需要这个能力"，Agent 调用准确率越高。

副业场景代入一下 ·

一个独立开发者接了 YouTube 数据 API，自己建 Skill，每天早上 Agent 自动查"自己产品被哪些 YouTuber 提到了"
一个跨境电商卖家建 Skill 接 1688 API，定时查某个品类的新品
一个内容创作者建 Skill 接自己公众号后台 API，定时拉昨日阅读数据

每个 Skill 都是一次性配完，然后永远在后台跑。

这就是为什么叫 Super App，它不是一个工具，是一个平台。

配图 · 时间戳 27:35 · Plugins 面板创建 Skill 配置界面配图 · 时间戳 33:24 · Skill → Automation 转换界面

§ 五功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

视频 14:29 的功能总览镜头里，运行模式这块写得特别清楚。

核心价值一句话 · 不同任务挑不同执行环境，不用一套方案通吃所有场景，Codex 自己知道该用哪套。

三种主模式

Local 本地执行，Agent 在你电脑上跑，文件读写、命令执行都在本机。适合 · 改现有项目、跑测试、需要读本机环境变量的事、要看本地文件的事。
Worktree 分支隔离，Agent 在独立的 git worktree 里跑，改动不污染主分支。适合 · 大改重构、实验性功能、多人协作怕互踩、一个需求试两套方案对比。
Cloud 云端执行，任务整个扔云端跑，本机关机也在跑。适合 · 长任务（训练、批处理、爬虫）、不占本机资源的事、夜里跑白天看结果的事。

还有一个 Remote SSH（alpha 阶段），能远程连到你自己的服务器上执行，这个还在分批推送。

怎么切换 · 新建 Thread 时的选项

切换模式的操作点在新建 Thread 的那一刻。

点 New Thread
下拉选执行环境 · Local / Worktree / Cloud / Remote SSH（alpha）
选完直接开始对话，Agent 从第一条消息就在那个环境里跑

正在跑的 Thread 也能切，这就是 14:29 镜头里说的 Handoff between Local and Worktree，本地跑着发现改动太大容易污染主分支，点右上角"切到 Worktree"，Agent 把当前上下文和状态搬到独立 worktree 里继续，你的主分支不受影响。

14:29 镜头里还能看到这些配套

内置终端（Integrated terminal），不用切出去开 iTerm
Terminal readback by Codex，Agent 可以自己读 terminal 输出。你不用复制粘贴错误信息给 Agent，它自己看，自己判断是环境变量问题还是依赖问题还是代码问题，自己尝试修
多终端并行（Multiple terminals），一条 Thread 里同时开几个终端
Approval controls / Sandbox controls，每个敏感操作要不要让 Agent 自己批，可以按项目细分
Windows 原生 sandbox / 可选 WSL agent，Windows 用户也能享受隔离执行

跟 Claude Code 对照着看

Claude Code 默认在 local 跑，你启动的那个 shell 就是执行环境。Worktree 你要自己 git worktree add 然后再把 Claude 切过去。Cloud 模式更麻烦，得自己起云机器、SSH 进去、装 Claude、跑任务。Codex App 把三种模式做成 UI 选项，新建 Thread 的时候下拉选一个。

Part 2 的震撼示范

Part 2 里最震撼的部分就是建立在"Agent 能自己读终端 + 三种模式自由切"这两件事上。35:27 开始，@rileybrown 同时开了 6 条 Agent 线程，每条跑不同任务，并发推进 ·

交付物	时间节点	产物类型
iOS App 设计	40:25	Mobile Design Skill 直接出设计稿
iOS App 搭建	41:47	实际代码，不是示意
落地页 + Tally 表单	46:13	能收集用户线索
Remotion 启动视频	54:08	动态视频，不是静态图
投资人 Deck	01:17:20	Claude Opus 4.7 做的
Vercel 部署	01:33:13	真实上线，不是 localhost
TestFlight 上架	01:37:57	真机可分发，不是模拟器

从设计稿一路到 App Store 测试版可分发，6 个产品同时推，一个视频里做完。这不是演示，这是交付。

避坑

Cloud 模式跑长任务，别忘了设置"完成通知"（Settings → Notifications），不然任务跑完你不知道，还以为在排队。Worktree 模式下改动完要合并回主分支，有个 Merge to main 按钮，别手动 git merge，App 里的那个按钮会顺便把 Thread 的上下文也同步过去，手动 merge 会丢上下文。

配图 · 时间戳 35:27 · 6 条 Agent 线程并发画面配图 · 时间戳 01:37:57 · TestFlight 上架截图

§ 六 01:09:46 那一帧 · 在 OpenAI 的 App 里打开了 Claude Code

这一帧是整个视频最值得单独拎出来说的。

视频 1h09m46s，@rileybrown 在 Codex App 的内置 Terminal 里打开了 Claude Code。在 OpenAI 的 App 里，跑的是 Anthropic 的 coding agent。 01:19:09，他用 Claude Opus 4.7 做投资人 Deck。

这不是意外，也不是品牌背叛。这是工具分层的结果。

Codex App 是调度层，GPT-5.4 管任务队列、触发时机、并发控制、Project / Thread / Automation 这些上层概念
Claude Code 是执行层，具体代码编写、调试、重构这些硬活
GPT-5.4 和 Claude Opus 4.7 是能力层，哪个任务用哪个模型，Codex App 自己挑

三层分工，每一层找最合适的工具。两个工具不在同一层，所以不是 "OpenAI vs Anthropic 二选一" 的竞争关系，是分工。

我扒完了想清楚一件事 · Claude Code 用户你一直以为自己是工作流里的主角，但 Codex App 出来之后，你慢慢会变成别人调度链里的执行层。 不是说 Claude Code 不重要，恰恰相反，它在执行层会越来越强，因为上层被 Codex App 接走了，Claude Code 可以专心做代码层的硬活。

但对你来说，下一个问题是 · 你想停留在执行层，还是把调度层也吃下来？

如果你每天打开电脑第一件事是开终端，CLI 是你舒服的形态，Claude Code 继续用，不碰调度层完全可以，让别人用 Codex App 给你派活你干就行。如果你想同时推多个项目、同时跑多个任务，那调度层你躲不掉，Codex App 这套 Project + Automation 就是给你准备的。

接下来不是"选哪个"的问题，是"你在这个分工里站哪个位置"的问题。

配图 · 时间戳 01:09:46 · Codex App 内置 Terminal 里打开 Claude Code 的那一帧

§ 七现在能用吗 · 时间戳速查表

状态，Codex App Developer Preview，对 ChatGPT Plus / Pro / Business 的开发者用户开放。下载地址 openai.com/codex/app。部分新功能（电脑控制、浏览器控制）还在分批推送，官方说未来会开放给更广泛的用户。

如果你还摸不到全功能，把下面这 10 个时间戳存下来，产品正式开放之后按顺序跟一遍就上手 ·

时间戳	内容	这段看什么
04:53	Projects 创建	怎么建一个 Project 把多对话归组
14:29	功能总览	整个 Codex App 到底有哪些能力，一张地图
18:07	Automations 实操	Calendar + Gmail 一句话做周报定时邮件
25:26	Steering vs Queueing	两种工作模式怎么选
27:35	自定义 Skill API	从 0 建一个 YouTube Research Skill
33:24	Skill → Automation	把 Skill 固化成定时任务
35:27	Part 2 多任务开场	6 条 Agent 线并发的震撼开场
01:09:46	打开 Claude Code	跨品牌工具分层的那一帧
01:22:33	iOS App 真机运行	不是模拟器
01:37:57	TestFlight 上架	可分发了

看的顺序建议，前 4 个时间戳（04:53 / 14:29 / 18:07 / 25:26）先看完，15 分钟内能把 Codex App 的核心范式搞清楚。再看 27:35 和 33:24，搞懂怎么扩展能力。最后看 35:27 开始的 Part 2，看"这套东西能干到什么程度"的证据。

按这个顺序看，1h43m 的视频 30 分钟能抓住全部要点。

配图 · 时间戳 35:27 · Part 2 开场的 6 条 Agent 线程画面 · 作为速查表结尾的视觉锚点

§ 八现在就去做这两件事

没拿到内测的，把 § 七的 10 个时间戳存进收藏，把 openai.com/codex/app 这个 URL 存进书签，等 ChatGPT Plus / Pro 账号收到开放通知，第一天按顺序跑一遍。

已经有内测资格的，今晚就去下载，建第一个 Project，把你最重复的那个任务（每周的日历周报、每天的数据巡检、每月的对账邮件）用 § 三的步骤配成 Automation，让 Agent 明天早上自己跑给你看。

调度层的工具出来了，下一步不是选哪个，是你在分工里站哪个位置。

今日互动

你现在用哪个 AI 工具写代码？Claude Code 为主扣 1，已经在用 Codex App 扣 2，两个都有扣 3。评论区见，顺便说下你打算把哪个重复任务配成 Automation。

📬 顺手说一句 · 咨询业务

长期承接这三块 · 价格大概是官方的一半 ·

Claude 官方订阅代开(Pro / Max 都能搞)
ChatGPT 官方订阅代开(Plus / Pro 都能搞)
Claude 各国 KYC 认证(美国 / 香港 / 新加坡 / 欧洲地区都能搞)

关注「麦总玩 AI」· 后台私信「订阅」或「KYC」· 报你要的档位,给你算细账。

参考 @rileybrown 发的 Codex App 教程视频。

§ 一 先说清楚这是什么 · 别跟 Codex CLI 搞混

§ 二 功能 ① · Projects 项目管理 · 多项目并行不用多开终端

怎么做 · 按视频顺序

14:29 功能总览镜头里还挂着这些

跟 Claude Code 对照着看

避坑

§ 三 功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

怎么做 · @rileybrown 演示的完整流程

关键一步 · 固化为 Automation

25:26 Steering vs Queueing · 两种工作模式

跟 Claude Code 对照着看

避坑

§ 四 功能 ③ · 自定义 Skill API · 把某个 API 变成 Codex 能调的能力

怎么做 · 建一个 YouTube Research Skill

31:34 实际使用

33:24 包装成 Automation 定时跑

跟 Claude Code 的 MCP 对照着看

避坑

§ 五 功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

三种主模式

怎么切换 · 新建 Thread 时的选项

14:29 镜头里还能看到这些配套

跟 Claude Code 对照着看

Part 2 的震撼示范

避坑

§ 六 01:09:46 那一帧 · 在 OpenAI 的 App 里打开了 Claude Code

§ 七 现在能用吗 · 时间戳速查表

§ 八 现在就去做这两件事

§ 一先说清楚这是什么 · 别跟 Codex CLI 搞混

§ 二功能 ① · Projects 项目管理 · 多项目并行不用多开终端

§ 三功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

§ 四功能 ③ · 自定义 Skill API · 把某个 API 变成 Codex 能调的能力

§ 五功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

§ 七现在能用吗 · 时间戳速查表

§ 八现在就去做这两件事