返回文章列表

2026-04-20

不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品

Claude Code 用户 / PM / 副业人 / 不碰代码的产品人,这篇写给你们。 一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。 设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发…


Claude Code 用户 / PM / 副业人 / 不碰代码的产品人,这篇写给你们。


一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。

设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发 · 8 个环节、6 个产品,一个人,一个 App 里全跑完。

不是 PPT 演示,不是模拟器截图。是 OpenAI 刚刚发的 Codex Super App 在内部演示里的真实交付。

一句话定位 · Codex App 不是又一个 AI 编程工具,是 OpenAI 把 AI Agent 做成了一套操作系统。

Projects 项目管理 + Automations 定时自动化 + Skill API 自定义能力 + 111 个内置插件 + Local / Worktree / Cloud 三种运行模式。组合起来才是"操作系统"三个字的意思 · 多任务并发、后台任务自己跑、能力可以扩展、环境可以切换。

产品还没对大众开放,ChatGPT Plus / Pro / Business 的开发者用户能下载 Developer Preview。Twitter 上 2.8 万播放、484 点赞、938 个书签 · 正常内容是点赞多于书签 5 倍,这次反过来了。不是"看完点个赞就走",是"我要回来的"。938 个人等的是"开放第一天照着跑"。

这篇是给这几批人看的 ·

  • Claude Code 的老用户,01:09:46 那一帧会告诉你,你在接下来的工具分层里应该站哪一层
  • PM / 副业人 / 独立开发者,4 大功能怎么配 + 6 个产品怎么并发 + 第一个副业 MVP 怎么开工
  • 不碰代码的产品人,AI 从工程师玩具变成操作系统的那个节点已经到了,调度层的工具长这个样

读完你知道两件事 · 这 App 具体能给你干什么,以及你在接下来的 AI 工作流分工里站哪个位置。

配图 · Twitter 原帖截图 · 2.8 万播放 / 938 书签 / 484 点赞 的数据条


§ 一 先说清楚这是什么 · 别跟 Codex CLI 搞混

OpenAI 叫 Codex 的东西至少有 3 个。

第一个是 2021 年那个 Codex,代码补全模型,给早期的 GitHub Copilot 用,已经退役了。第二个是 Codex CLI,OpenAI 去年放出来的命令行工具,终端里敲命令跟模型交互,偏工程师。

今天视频里演示的是第三个,Codex 桌面 App,一个 GUI 应用。

底层模型 GPT-5.4,默认推理档位 Extra High,右下角界面里能看到。官方口号 Build faster with Codex, A coding agent that helps you build and ship with AI。

已经在用的企业客户,Duolingo、Vanta、Virgin Atlantic、Miro、Rakuten。都是海外头部科技公司,直接进入生产环境的那批。

它跟 Claude Code 不在一个形态上。Claude Code 是终端 CLI,工程师舒服;Codex App 是桌面 GUI,侧边栏 + 面板 + 内置终端 + 插件市场,更像一个"能跑 Agent 的操作系统壳子",后面几节你会看到具体差别。

为啥 OpenAI 要做 Super App 而不是继续加强 CLI。因为 CLI 这个形态天然圈住了工程师,想要触达"不碰代码的产品人 / PM / 副业人",必须换形态。GUI 面板 + 111 个开箱插件 + 无代码 Automation,这三件事凑在一起才能把 AI agent 从"程序员的玩具"变成"每个人的操作系统"。

这段先钉死一件事,这不是命令行,是一个 App,接下来 4 个功能都围绕"App 能干什么 CLI 干不了的"展开。

配图 · 时间戳 14:29 · Codex App 主界面功能总览镜头


§ 二 功能 ① · Projects 项目管理 · 多项目并行不用多开终端

视频里 04:53 开始演示。

核心价值一句话 · 把"多对话"收进"多项目",每个项目底下跑多条并行的 Agent 线程,开着 5 个项目不乱。

怎么做 · 按视频顺序

  1. 左侧边栏,点 New chat 上面那个 Projects 图标,进入项目列表
  2. 右上角 Create Project,填项目名字和描述(比如"闲鱼机器人项目" / "副业周报自动化")
  3. 进 Project 内部,侧边出现 Thread 列表(每个 Thread 就是一条对话线程)
  4. 点 New Thread,每条 Thread 独立跑自己的 Agent,互不干扰
  5. 右侧 Project sidebar(默认展开,在主面板右边),统一看所有 Thread 状态,谁跑完了谁卡住了一目了然
  6. 队列区域里待执行的消息可以拖动重排,想先跑哪个拖到最上面
  7. 同一条 Thread 可以从某条消息处 Fork 出新分支(右键消息 → Fork from here),等于"我这个方向试试看,不行回到原路"

14:29 功能总览镜头里还挂着这些

Projects 模块底下的细节能力,视频画面一帧能看到 7 条 ·

  • 多项目(Multiple projects)
  • 并行 Agent 线程(Parallel agent threads)
  • 对话分叉(Conversation forking),刚才第 7 步说的 Fork
  • Handoff between Local and Worktree,本地跑着跑着切到分支隔离模式继续
  • Queue message reordering,待执行消息重排
  • Thread 重命名 / 搜索 / 跳最近
  • 整个 Project 下所有本地 Thread 一键归档

跟 Claude Code 对照着看

Claude Code 走 CLI,多任务靠你手动 tmux 或者多开几个终端窗口。你得自己记住哪个窗口在干哪个项目,session 管理完全靠肌肉记忆,关机重启全丢。Codex App 把这一层做成可视化面板,状态持久化,对"同时推多个副业又不想被配置卡住"的人来说,门槛差了一个台阶。

避坑

Thread Fork 这个功能很容易被忽略,但它解决的问题非常具体 · 你让 Agent 做一个需求,它给了方案 A,你想"要不试试方案 B",但又不想废掉方案 A 的上下文。这时候 Fork 出去试 B,B 不成再回 A 继续。这是 Claude Code 里要手动备份 session 才能做到的事。

副业人手头 5 个项目(一个 iOS App、一个公众号、一个闲鱼店、一个 Discord bot、一个博客),不用 5 个终端窗口了,一个 App 全装下,项目之间切换不用重新装上下文。

配图 · 时间戳 04:53 · 创建 Project 界面截图,Project sidebar 展开状态


§ 三 功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

视频里 18:07 开始演示。

核心价值一句话 · 自然语言指令就能建一个定时触发的 Agent 任务,不写一行代码,不配 cron 表达式。

怎么做 · @rileybrown 演示的完整流程

  1. 在 Plugins 面板连上 Google Calendar 和 Gmail(这两个是 Codex App 内置插件,点击 Authorize 授权一次就成)
  2. 新开一条对话,输入"列出本周日历事件"
  3. Agent 自动调 Calendar 插件,读本周事件,返回结构化清单
  4. 继续输入"把这份周报发邮件给我"
  5. Agent 自动调 Gmail 插件,填主题、填正文、发送
  6. 邮件落到收件箱,发件人 riley@notanumber.com,主题 Weekly Calendar Recap: April 13-19, 2026

关键一步 · 固化为 Automation

这是个一次性任务,接下来固化它 ·

  1. 在这条对话的右上角,有个 Save as Automation 按钮,点它
  2. 弹出配置面板,选触发条件。视频里能看到的触发类型至少 4 种 ·
    • 时间触发(每周一 09:00 / 每天 08:00 / 每月 1 日这种)
    • 邮件触发(收到来自 XXX 的邮件时)
    • 日历触发(新事件创建时 / 事件开始前 15 分钟)
    • 文件触发(Google Drive 里某个文件更新时)
  3. 填名字(比如"每周日历周报"),保存

这条任务从此自己跑。每周一早上 09:00,Agent 自动读完日历,整理周报,发邮件。你不用再开 App,不用再输入一遍指令。

25:26 Steering vs Queueing · 两种工作模式

视频里专门讲了这个对比 ·

  • Steering,实时对话引导,你边看它干边插话调整。适合 · 没做过的事、需要监督的任务、会有反复迭代的事。
  • Queueing,批量排一堆指令,Agent 依次执行。适合 · 已经固化流程的事、重复任务、你不想盯着的事。

判断逻辑 · 这个任务你已经做过 3 次以上而且每次流程几乎一致 → 走 Queueing → 再升级到 Automation 定时跑。没做过的、流程不稳定的 → 走 Steering。

跟 Claude Code 对照着看

Claude Code 要做定时任务,你得自己写 bash 脚本 + macOS launchd 或者 cron entry,再把 claude CLI 包一层。能做,但门槛不低,一般用户不会走到这步。Codex App 把这一层砍平到 UI 按钮,一个 form 填完。

避坑

触发条件的"邮件触发"和"文件触发"这两个虽然灵活,但容易触发过度(每次收到邮件都跑 Agent)。建议起手先用"时间触发",固定点跑,观察几周确定 Agent 确实在干对的事,再考虑切事件驱动。

一个 PM 每周做的"跨部门周报"、一个独立开发者每周做的"竞品定价巡检"、一个副业人每天做的"评论监控",以前要么自己搞定时脚本要么手动做,现在一句话配完,第二天开始 Agent 自己跑,邮件 / Slack / 钉钉通知就到了。

938 书签背后的心理其实就一条,不是学功能,是等产品开放之后立刻把自己那几个重复任务配进去,省下来的时间比看这个视频多几十倍。

配图 · 时间戳 18:07 · Calendar 读取 + 邮件发送全流程界面


§ 四 功能 ③ · 自定义 Skill API · 把某个 API 变成 Codex 能调的能力

视频 27:35 开始,这是 Part 1 最后一个、也是最有想象空间的功能。

核心价值一句话 · Codex App 内置 111 个插件,不够用,你可以在图形界面里自己写一个 Skill,把任意 API 变成 Agent 能调的能力。

怎么做 · 建一个 YouTube Research Skill

@rileybrown 演示的完整流程 ·

  1. Plugins 面板 → 右上角 Create Skill(或 Custom Skill)
  2. 填 Skill 名字(YouTube Research)和描述。描述很关键,Agent 根据这个描述判断"这个场景要不要调这个 Skill",写清楚"用途是查 YouTube 视频 / 频道数据"
  3. 配 API 接口 · 填 endpoint(YouTube Data API v3 的 search endpoint)、auth token(你的 YouTube API Key)、query 参数的 schema
  4. 前置条件 · YouTube Data API 需要在 Google Cloud Console 申请 API Key,免费额度每天 10000 单位调用够用。视频里没提这一步,但实际你要先去拿 Key
  5. 保存,Skill 生效,在 Plugins 列表里出现

31:34 实际使用

  1. 新开对话,输入"找过去 7 天关于 Claude Code 的 YouTube 高赞视频,列出标题 + 观看数 + 发布时间"
  2. Codex Agent 识别这是 YouTube Research Skill 的场景,自动调用
  3. 返回结构化结果,格式是表格

33:24 包装成 Automation 定时跑

  1. 选这条对话 → Save as Automation
  2. 触发器设"每天 09:00",保存
  3. Skill 从此每天早上自动跑一遍,结果发邮件

跟 Claude Code 的 MCP 对照着看

Claude Code 走 MCP 协议,你要加一个自定义 Server,得写 Node.js 或 Python 的 MCP Server 代码 → 改 ~/.claude/mcp.json 或 claude_desktop_config.json → 重启 → 试错调试。Codex App 把这整套收进图形面板,定义 API 接口这一步在一个 form 里填完,没碰一个配置文件。

哪些人对这个差别最有感触,PM、不想碰配置文件的独立开发者、把 AI 当工具而不是把 AI 当同事的那批人。对工程师来说 MCP 也不是什么门槛,对 PM 来说"配置文件"这三个字就是门。

避坑

Skill 的描述(第 2 步那个)不要写成"调用 YouTube API"这种功能描述,要写成"用途是 XXX"的场景描述。Agent 识别是不是要调这个 Skill,靠的是场景匹配不是功能名字。描述写得越像"我什么时候需要这个能力",Agent 调用准确率越高。

副业场景代入一下 ·

  • 一个独立开发者接了 YouTube 数据 API,自己建 Skill,每天早上 Agent 自动查"自己产品被哪些 YouTuber 提到了"
  • 一个跨境电商卖家建 Skill 接 1688 API,定时查某个品类的新品
  • 一个内容创作者建 Skill 接自己公众号后台 API,定时拉昨日阅读数据

每个 Skill 都是一次性配完,然后永远在后台跑。

这就是为什么叫 Super App,它不是一个工具,是一个平台。

配图 · 时间戳 27:35 · Plugins 面板创建 Skill 配置界面 配图 · 时间戳 33:24 · Skill → Automation 转换界面


§ 五 功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

视频 14:29 的功能总览镜头里,运行模式这块写得特别清楚。

核心价值一句话 · 不同任务挑不同执行环境,不用一套方案通吃所有场景,Codex 自己知道该用哪套。

三种主模式

  • Local 本地执行,Agent 在你电脑上跑,文件读写、命令执行都在本机。适合 · 改现有项目、跑测试、需要读本机环境变量的事、要看本地文件的事。
  • Worktree 分支隔离,Agent 在独立的 git worktree 里跑,改动不污染主分支。适合 · 大改重构、实验性功能、多人协作怕互踩、一个需求试两套方案对比。
  • Cloud 云端执行,任务整个扔云端跑,本机关机也在跑。适合 · 长任务(训练、批处理、爬虫)、不占本机资源的事、夜里跑白天看结果的事。

还有一个 Remote SSH(alpha 阶段),能远程连到你自己的服务器上执行,这个还在分批推送。

怎么切换 · 新建 Thread 时的选项

切换模式的操作点在新建 Thread 的那一刻。

  1. 点 New Thread
  2. 下拉选执行环境 · Local / Worktree / Cloud / Remote SSH(alpha)
  3. 选完直接开始对话,Agent 从第一条消息就在那个环境里跑

正在跑的 Thread 也能切,这就是 14:29 镜头里说的 Handoff between Local and Worktree,本地跑着发现改动太大容易污染主分支,点右上角"切到 Worktree",Agent 把当前上下文和状态搬到独立 worktree 里继续,你的主分支不受影响。

14:29 镜头里还能看到这些配套

  • 内置终端(Integrated terminal),不用切出去开 iTerm
  • Terminal readback by Codex,Agent 可以自己读 terminal 输出。你不用复制粘贴错误信息给 Agent,它自己看,自己判断是环境变量问题还是依赖问题还是代码问题,自己尝试修
  • 多终端并行(Multiple terminals),一条 Thread 里同时开几个终端
  • Approval controls / Sandbox controls,每个敏感操作要不要让 Agent 自己批,可以按项目细分
  • Windows 原生 sandbox / 可选 WSL agent,Windows 用户也能享受隔离执行

跟 Claude Code 对照着看

Claude Code 默认在 local 跑,你启动的那个 shell 就是执行环境。Worktree 你要自己 git worktree add 然后再把 Claude 切过去。Cloud 模式更麻烦,得自己起云机器、SSH 进去、装 Claude、跑任务。Codex App 把三种模式做成 UI 选项,新建 Thread 的时候下拉选一个。

Part 2 的震撼示范

Part 2 里最震撼的部分就是建立在"Agent 能自己读终端 + 三种模式自由切"这两件事上。35:27 开始,@rileybrown 同时开了 6 条 Agent 线程,每条跑不同任务,并发推进 ·

交付物 时间节点 产物类型
iOS App 设计 40:25 Mobile Design Skill 直接出设计稿
iOS App 搭建 41:47 实际代码,不是示意
落地页 + Tally 表单 46:13 能收集用户线索
Remotion 启动视频 54:08 动态视频,不是静态图
投资人 Deck 01:17:20 Claude Opus 4.7 做的
Vercel 部署 01:33:13 真实上线,不是 localhost
TestFlight 上架 01:37:57 真机可分发,不是模拟器

从设计稿一路到 App Store 测试版可分发,6 个产品同时推,一个视频里做完。这不是演示,这是交付。

避坑

Cloud 模式跑长任务,别忘了设置"完成通知"(Settings → Notifications),不然任务跑完你不知道,还以为在排队。Worktree 模式下改动完要合并回主分支,有个 Merge to main 按钮,别手动 git merge,App 里的那个按钮会顺便把 Thread 的上下文也同步过去,手动 merge 会丢上下文。

配图 · 时间戳 35:27 · 6 条 Agent 线程并发画面 配图 · 时间戳 01:37:57 · TestFlight 上架截图


§ 六 01:09:46 那一帧 · 在 OpenAI 的 App 里打开了 Claude Code

这一帧是整个视频最值得单独拎出来说的。

视频 1h09m46s,@rileybrown 在 Codex App 的内置 Terminal 里打开了 Claude Code。在 OpenAI 的 App 里,跑的是 Anthropic 的 coding agent。 01:19:09,他用 Claude Opus 4.7 做投资人 Deck。

这不是意外,也不是品牌背叛。这是工具分层的结果。

  • Codex App 是调度层,GPT-5.4 管任务队列、触发时机、并发控制、Project / Thread / Automation 这些上层概念
  • Claude Code 是执行层,具体代码编写、调试、重构这些硬活
  • GPT-5.4 和 Claude Opus 4.7 是能力层,哪个任务用哪个模型,Codex App 自己挑

三层分工,每一层找最合适的工具。两个工具不在同一层,所以不是 "OpenAI vs Anthropic 二选一" 的竞争关系,是分工。

我扒完了想清楚一件事 · Claude Code 用户你一直以为自己是工作流里的主角,但 Codex App 出来之后,你慢慢会变成别人调度链里的执行层。 不是说 Claude Code 不重要,恰恰相反,它在执行层会越来越强,因为上层被 Codex App 接走了,Claude Code 可以专心做代码层的硬活。

但对你来说,下一个问题是 · 你想停留在执行层,还是把调度层也吃下来?

如果你每天打开电脑第一件事是开终端,CLI 是你舒服的形态,Claude Code 继续用,不碰调度层完全可以,让别人用 Codex App 给你派活你干就行。如果你想同时推多个项目、同时跑多个任务,那调度层你躲不掉,Codex App 这套 Project + Automation 就是给你准备的。

接下来不是"选哪个"的问题,是"你在这个分工里站哪个位置"的问题。

配图 · 时间戳 01:09:46 · Codex App 内置 Terminal 里打开 Claude Code 的那一帧


§ 七 现在能用吗 · 时间戳速查表

状态,Codex App Developer Preview,对 ChatGPT Plus / Pro / Business 的开发者用户开放。下载地址 openai.com/codex/app。部分新功能(电脑控制、浏览器控制)还在分批推送,官方说未来会开放给更广泛的用户。

如果你还摸不到全功能,把下面这 10 个时间戳存下来,产品正式开放之后按顺序跟一遍就上手 ·

时间戳 内容 这段看什么
04:53 Projects 创建 怎么建一个 Project 把多对话归组
14:29 功能总览 整个 Codex App 到底有哪些能力,一张地图
18:07 Automations 实操 Calendar + Gmail 一句话做周报定时邮件
25:26 Steering vs Queueing 两种工作模式怎么选
27:35 自定义 Skill API 从 0 建一个 YouTube Research Skill
33:24 Skill → Automation 把 Skill 固化成定时任务
35:27 Part 2 多任务开场 6 条 Agent 线并发的震撼开场
01:09:46 打开 Claude Code 跨品牌工具分层的那一帧
01:22:33 iOS App 真机运行 不是模拟器
01:37:57 TestFlight 上架 可分发了

看的顺序建议,前 4 个时间戳(04:53 / 14:29 / 18:07 / 25:26)先看完,15 分钟内能把 Codex App 的核心范式搞清楚。再看 27:35 和 33:24,搞懂怎么扩展能力。最后看 35:27 开始的 Part 2,看"这套东西能干到什么程度"的证据。

按这个顺序看,1h43m 的视频 30 分钟能抓住全部要点。

配图 · 时间戳 35:27 · Part 2 开场的 6 条 Agent 线程画面 · 作为速查表结尾的视觉锚点


§ 八 现在就去做这两件事

没拿到内测的,把 § 七的 10 个时间戳存进收藏,把 openai.com/codex/app 这个 URL 存进书签,等 ChatGPT Plus / Pro 账号收到开放通知,第一天按顺序跑一遍。

已经有内测资格的,今晚就去下载,建第一个 Project,把你最重复的那个任务(每周的日历周报、每天的数据巡检、每月的对账邮件)用 § 三的步骤配成 Automation,让 Agent 明天早上自己跑给你看。

调度层的工具出来了,下一步不是选哪个,是你在分工里站哪个位置。


今日互动

你现在用哪个 AI 工具写代码?Claude Code 为主扣 1,已经在用 Codex App 扣 2,两个都有扣 3。评论区见,顺便说下你打算把哪个重复任务配成 Automation。


📬 顺手说一句 · 咨询业务

长期承接这三块 · 价格大概是官方的一半 ·

  • Claude 官方订阅代开(Pro / Max 都能搞)
  • ChatGPT 官方订阅代开(Plus / Pro 都能搞)
  • Claude 各国 KYC 认证(美国 / 香港 / 新加坡 / 欧洲地区都能搞)

关注「麦总玩 AI」· 后台私信「订阅」或「KYC」· 报你要的档位,给你算细账。


参考 @rileybrown 发的 Codex App 教程视频。