金年会(JinNianHui)体育官网 澳洲放羊大叔引爆 AI 编程创新!Claude Code 急推 goal 模式,不干完不许停

澳洲牧羊大叔顺手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。
一醒悟来,Claude Code 又更新!
为了让 Claude 执续使命直到任务完成,Claude Code 最近推出的新功能:/goal 。
你只有设定要求,Claude 不完成任务它毫不规定!
张开剩余90%用过 AI 编程器用的东说念主齐懂,这到底多紧迫!
你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,一霎停驻来问你「接下来需要我作念什么?」
不是,bug 你这还没修完呢啊!
Agent 越来越智慧,写代码越来越快,但「重新到尾把一件事干完」这件事,到 2026 年头齐莫得一家能作念到。
然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 措置了。
while :; do cat PROMPT.md | claude-code --continuedone
他把它定名为 Ralph Loop,请安《辛普森一家》里阿谁永久搞不清情状但从不撤废的小孩 Ralph Wiggum。
逻辑极其狡猾,无尽轮回,反复把归拢个 prompt 喂给 Agent。程度写在文献系统和 Git 历史里,高下文满了就开新实例,读文献接着干。
原始,不优雅,但异常灵验。
灵验到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。
11 天,三家顶级 AI 实验室,殊途同归地把这三行 bash 写进了官方家具。
这一刻,通盘东说念主齐光显了一件事 ——
通用东说念主工智能的临门一脚,可能不是更智慧的模子,而是「把事作念完」的模子。
换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环请托」。
11 天,三条线,归拢个极端
4 月 30 日,OpenAI 的 Codex 领先上线 / goal。
Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。
一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。
11 天。三家。归拢个敕令。归拢个功能。
但完毕旅途,差了十万八沉。
Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。
Codex:把办法存成一条数据库纪录
OpenAI 是三家里开端着手的,决策也最简陋。
在 Codex 里,/goal 是一个执久化的使命流对象,存在土产货的 app-server 状态层里。
关掉末端、合上条记本、甚而重启系统,办法齐不会丢。下次通达 Codex,自动接上。
模子通过结构化的 update_goal 器用讲述程度状态,token 预算消费时触发「软着陆」而非硬停。
有东说念主用这个功能辘集跑了 14 个小时,中间暂停 5 小时去睡眠,记忆 Codex 从断点续跑,把一个设备驱动模式作念结束。
工程化,干净,但克制。
Hermes Agent:一个东说念骨干不完,金年会(JinNianHui)体育官网那就上一个团队
Hermes Agent 的贪心最大。
在这里,/goal 仅仅冰山一角。着实的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队配合问题。
看板的底层是土产货 SQLite,执久化存储,跨重启不丢。
你在上头创建一个任务卡片,Hermes 会径直把它拆成多个子任务,分拨给不同的 Agent worker。每个 worker 是一个零丁的 OS 经过,有我方的身份、模子建设和使命目次。
看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的办法锁定(Ralph loop),看板管的是多个 Agent 之间的任务鼎新。一个纵向深刻,一个横向铺开。
临了,是五层防烂尾机制。
第一层,心跳检测。每个 worker 依期向看板报到,讲授我方还在世。
第二层,僵尸回收。worker 超时没反映?系统自动判定死字,回收它手上的任务从新分拨。macOS 上还有额外的达尔文僵尸检测逻辑。
第三层,退出羁系。worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,看重「摸鱼型 Agent」反复领任务又不作念。
第四层,幻觉羁系。这是最狠的一层。AI 说「我作念结束」不算数,系统会考据它实验产出的代码是否确实落盘了。Agent 说我方创建了一个文献但实验上莫得?收拢,回滚,重来。
第五层,重试预算。每个任务有零丁的 max_retries,最多重试 N 次,向上就上报东说念主类。完全不会无尽轮回到死机。
Claude Code:作念事的东说念主和验收的东说念主,不可是归拢个
Anthropic 是三家里临了着手的,但决策最好意思妙。
实验上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。
你设定一个完成要求(比如「test / auth 目次下通盘测试通过且 lint 无报错」),Claude 就启动干活。
关键贪图在验收方法。每干完一轮,系统不让 Claude 我方判断「我作念结束莫得」。
它把对话纪录和你的完成要求一说念发给一个零丁的小模子(默许是 Haiku),让这个小模子来裁判。
小模子淌若以为没完成,就需要复返一个具体原理(比如「test_login.py还有 2 个 failure」)。然后这个原瓦解被注入 Claude 下一轮的高下文,指导它接着干。
环球体育官网登录入口淌若小模子认为完成了,办法就会自动撤销,任务结尾。
值得一提的是,这个裁判模子不调用任何器用,不读文献,不跑敕令。它只看 Claude 在对话里产出的内容。
是以,你的完成要求必须是 Claude 在对话中能讲授的东西。
它最长复古 4000 字符,因此你不错写得很细。
甚而,还不错在要求里加收敛,比如「不修改其他测试文献」「20 轮内完成不然罢手」等等。
决赛进行时:使命流进口
把视角拉远一步。
Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。
三条旅途,偶然隐敝了 ASI 决赛的三个生态进口。
而他们争的,亦然归拢样东西 —— 使命流。
谁的 Agent 先让路发者养成「设完办法就走开」的习尚,谁就锁死了使命流进口。
因为习尚一朝变成,迁徙资本是指数级的。
你不会放松离开一个也曾跑通了看板鼎新、断点续传、checkpoint 回滚的 Agent 基础方法。
一个看似很小的 / goal 敕令,背后卡的是整条 Agent 使命流的护城河。
参考资料:
https://code.claude.com/docs/en/goal
https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7
https://github.com/anthropics/claude-code/releases/tag/v2.1.139
https://developers.openai.com/codex/changelog金年会(JinNianHui)体育官网
https://code.claude.com/docs/en/goal
https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7
https://github.com/anthropics/claude-code/releases/tag/v2.1.139
https://developers.openai.com/codex/changelog
发布于:山东省