【AI】Codex 的工作流更新-v3 [Codex-maxxing for long-running work]
Codex 工作流更新-v3最近 OpenAI 的一篇博客 Codex-maxxing for long-running work 分享了关于长周期复杂任务的指南并针对我已有的工作流作出一些更新。长周期的复杂任务通常不是一次 prompt 改完代码就结束。它可能要经历调查、实现、预览、反馈、等 CI、继续修改、准备 PR、后续检查。该博客更像是总结了 Claude Codegoal和loop命令的思想 v2 现状v2 从项目初始化开始setup-light/setup-full生成AGENTS.md、CLAUDE.md和docs/记忆文件让 Agent 进入一个项目后知道行为规范。它不太关注于任务线本身比如预览页面谁来看用户反馈放在哪里PR review 几个小时后才来又怎么接着改这些长期任务流程问题是 v2 未涉及的。长时间复杂任务OpenAI 这篇博客把 Codex 看成一个 persistent workspace一件复杂任务有自己的线程、记忆、工具和审阅对象重要的有以下几点。Durable thread给长期任务一个固定会话维护会话的上下文、旧决策、待办和用户反馈容易丢失。Memory不只依赖聊天记录而是把项目状态、决策、开放事项写进可以查看、可以 diff、可以复用的文件。对应到当前工作流里docs/就承担了 memory 的作用跨项目 or 会话的个性要求则可以放进个人记忆或知识库。SteeringCodex 工作时用户可以继续补充 prompt。比如“先不要接短信登录”“这个错误提示太别扭”“等预览部署完再继续”。任务就不再是一次性指令而是可以边做边调整的任务队列。Thread automation定时任务比如等待部署、看 review 是否更新、检查支持工单有没有新回复。Side panel产物本身要进入审阅循环。Markdown、CSV、PDF、slides、本地页面预览都可以直接作为审阅对象用户的评论继续变成下一轮任务上下文。Goals目标要能有具体的量化标准如要写清楚页面、接口、测试、异常情况分别达到什么结果。这些点合在一起就能把任务进化成一个工作循环目标 - 线程 - 项目记忆 - 调用工具 - 产出 - review - 下一轮任务这张图可以作为本次更新的总览三层模型通过上述总结可以把工作流分成三层Thread保存一条长期任务的上下文Project memory保存 repo 内的事实也就是AGENTS.md和docs/*Execution surfaces接触真实工作界面比如 browser、Chrome、computer use、connectors、skills而 v2 正好属于 Project memory 这一层所以不需要做改进。另外长期任务容易越做越多所以边界要提前写清楚例如可以配置相关 Hooks哪些任务适合长期线程不是所有任务都要开长期线程。一次性命令、小改动、马上能验完的问题按 v2 的普通流程就够。更适合长期线程的场景会跨多轮修改需要用户看预览或多次反馈需要等待 CI、部署、review、第三方回复需要跨工具处理比如 GitHub 本地代码 浏览器后续可能沉淀成 skill中断后还要接着做Prompt 模板下次遇到复杂任务需要长时间工作流的场景可以直接这样编写 prompt可以手动引用loopgoal命令进一步约束 Agent确保执行正确这是一个长期任务线程任务名。 先读 AGENTS.md 和 docs/agent_workflow.md。 必要时再读 docs/project_status.md、docs/project_spec.md、docs/architecture.md。 目标 - 目标 1 - 目标 2 验收标准 1. 可以检查的结果 2. 需要运行的检查 3. 需要用户审阅的产物 执行规则 - 先调查不要急着改代码 - 改前说明方案和影响范围 - 改后运行相关检查 - 涉及 UI 时启动本地预览并给出地址 - 不要 push、发布、删除数据、发送消息除非用户明确批准 - 任务中断前更新 docs/project_status.md这里的关键是验收标准要能检查。不要只写“完成登录功能”而是写清楚哪些页面、哪些接口、哪些测试、哪些异常情况必须通过。Tools此外还要说清楚任务需要碰到哪些工具。可手动引用或在规范文档、prompt 中提示常见选择本地网页预览用 browser需要用户登录态用 Chrome必须点桌面软件用 computer useGitHub、Gmail、Slack、Calendar用对应的 MCP反复使用的流程整理成 skill需要隔一段时间回来查用 thread automationcheckpoint 的判断v2 里 checkpoint 更像 commit 前的项目状态检查这里 checkpoint 更像一次任务阶段记录。需要 checkpoint 的情况包括当前阶段已经完成任务要暂停要交给另一个 Agent后续需要接着做出现新的风险或阻塞行为、架构、依赖或项目状态发生变化与之前的 checkpoint 思想不同不是为了每次 commit 都按需更新记忆文档而是为了让任务之后能接上。如果只是普通小改动就不需要每次都更新一堆 docs。复盘v2 规定了 Agent 对项目的维护方式v3 则是面对复杂长期任务时总结的思想博客来源Codex-maxxing for long-running work

相关新闻

AI/ML论文核心句:如何写出一句精准的Thesis Statement

AI/ML论文核心句:如何写出一句精准的Thesis Statement

1. 为什么一句“ thesis statement”能决定你AI/ML论文的生死线刚带完今年第三组硕士生开题,有位同学交来初稿,标题是《基于Transformer的多模态情感分析研究》,全文写得密密麻麻,模型结构图画了四页,实验表格堆了十七…

2026/6/25 16:34:51阅读更多 →
Ryujinx Nintendo Switch模拟器深度解析与实战指南

Ryujinx Nintendo Switch模拟器深度解析与实战指南

Ryujinx Nintendo Switch模拟器深度解析与实战指南 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx Ryujinx是一款基于C#开发的Nintendo Switch模拟器,为技术爱好者和游戏玩…

2026/6/25 16:34:51阅读更多 →
Android 架构组件官方示例集:Google 手把手教你写规范代码

Android 架构组件官方示例集:Google 手把手教你写规范代码

文章目录Android 架构组件官方示例集:Google 手把手教你写规范代码具体包含哪些示例为什么值得看适合谁Android 架构组件官方示例集:Google 手把手教你写规范代码 做 Android 开发的人都知道,写一个能跑的 App 不难,难的是写一个…

2026/6/25 16:34:51阅读更多 →
STM32-S01-人走灯灭+光敏+自动+手动+10档调节+LCD1602屏+(无线方式选择)-3(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

STM32-S01-人走灯灭+光敏+自动+手动+10档调节+LCD1602屏+(无线方式选择)-3(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

STM32-S01-人走灯灭光敏自动手动10档调节LCD1602屏(无线方式选择)-3(设计源文件万字报告讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码 产品功能描述: 本系统由STM32F103C8T6单片机核心板、LCD1602液晶屏、(无线蓝牙/无线…

2026/6/25 17:55:34阅读更多 →
TEE-OS学习轨迹第十九篇:OP-TEE OS的启动流程:从冷热启动到SMC服务

TEE-OS学习轨迹第十九篇:OP-TEE OS的启动流程:从冷热启动到SMC服务

OP-TEE OS AArch64 架构的复位入口与早期启动核心(对应源码路径 core/arch/arm/kernel/entry_a64.S),它定义了所有 CPU 进入 OP-TEE 的第一站:主 CPU 冷启动走 _start 全量初始化,次级 CPU 热启动走 cpu_on_handler 本…

2026/6/25 17:55:34阅读更多 →
解密30天自制操作系统:从引导程序到图形界面的完整构建指南

解密30天自制操作系统:从引导程序到图形界面的完整构建指南

解密30天自制操作系统:从引导程序到图形界面的完整构建指南 【免费下载链接】30dayMakeOS 《30天自制操作系统》源码中文版。自己制作一个操作系统(OSASK)的过程 项目地址: https://gitcode.com/gh_mirrors/30/30dayMakeOS 操作系统开…

2026/6/25 17:55:34阅读更多 →
第1章:Piontnet++window11环境配置

第1章:Piontnet++window11环境配置

第1步骤:Anaconda安装版本 Anaconda是Python环境管理的推荐工具,可以方便地创建隔离的虚拟环境。 1. Anaconda官网下载页面:https://www.anaconda.com/download 2. 下载Windows版本的Anaconda安装包(推荐Python 3.10版本) 3. 运行安装程序,按照向导完成安装 (1)打…

2026/6/25 17:55:34阅读更多 →
VoiceFixer实战指南:AI语音修复从入门到精通

VoiceFixer实战指南:AI语音修复从入门到精通

VoiceFixer实战指南:AI语音修复从入门到精通 【免费下载链接】voicefixer General Speech Restoration 项目地址: https://gitcode.com/gh_mirrors/vo/voicefixer 你是否曾经面对嘈杂的会议录音束手无策?或者为历史音频的失真问题感到困扰&#x…

2026/6/25 17:55:34阅读更多 →
实体AI驱动私有5G网络市场规模突破66亿美元

实体AI驱动私有5G网络市场规模突破66亿美元

SNS Telecom and IT的最新研究进一步印证了私有移动网络市场的持续增长势头。研究显示,到2029年,全球私有5G网络的年度支出预计将突破66亿美元。这一增长的背后,是工业巨头们在现有设施和新建绿地项目中大规模推进多站点、跨国私有5G部署&…

2026/6/25 17:50:33阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/25 9:39:54阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 2:52:24阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/25 9:01:34阅读更多 →
面试辅助工具横评:我试了5款AI面试工具,最后留下了OfferGo

面试辅助工具横评:我试了5款AI面试工具,最后留下了OfferGo

上半年跳槽,面了十几家公司。说句实话,不是能力不行,是面试现场太容易崩了。 明明准备了一周,面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。 后来开始试市面上的AI面试辅助工具。前前后后装了5款,踩…

2026/6/25 11:52:11阅读更多 →
Claude Code 提示词设计:从塑造“人格”到建立“状态机”

Claude Code 提示词设计:从塑造“人格”到建立“状态机”

当前 AI Agent 设计的核心痛点在于:大模型不缺写代码的能力,缺的是克制力、边界感和验证逻辑。Prompt 不再是用来塑造“人格”的,而是用来建立“状态机(State Machine)”和“行为门禁(Guardrails&#xff0…

2026/6/25 11:52:11阅读更多 →
MC-037 | 自定义 Skill 开发:创建你的AI能力模块

MC-037 | 自定义 Skill 开发:创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发:创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列 字数: 约 1400 字…

2026/6/25 11:52:11阅读更多 →