澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停
2026-05-14 02:12:35
0

澳洲牧羊大叔随手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一觉醒来,Claude Code 又更新!

为了让 Claude 持续工作直到任务完成,Claude Code 最近推出的新功能:/goal 。

你只要设定条件,Claude 不完成任务它绝不罢休!

用过 AI 编程工具的人都懂,这到底多重要!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文件,突然停下来问你「接下来需要我做什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越聪明,写代码越来越快,但「从头到尾把一件事干完」这件事,到 2026 年初都没有一家能做到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 解决了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它命名为 Ralph Loop,致敬《辛普森一家》里那个永远搞不清状况但从不放弃的小孩 Ralph Wiggum。

逻辑极其粗暴,无限循环,反复把同一个 prompt 喂给 Agent。进度写在文件系统和 Git 历史里,上下文满了就开新实例,读文件接着干。

原始,不优雅,但十分有效。

有效到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,不约而同地把这三行 bash 写进了官方产品。

这一刻,所有人都明白了一件事 ——

通用人工智能的临门一脚,可能不是更聪明的模型,而是「把事做完」的模型。

换句话说,AI 编程的核心战场正在从「生成代码」转向「闭环交付」。

11 天,三条线,同一个终点

4 月 30 日,OpenAI 的 Codex 率先上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。同一个命令。同一个功能。

但实现路径,差了十万八千里。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把目标存成一条数据库记录

OpenAI 是三家里最先出手的,方案也最简洁。

在 Codex 里,/goal 是一个持久化的工作流对象,存在本地的 app-server 状态层里。

关掉终端、合上笔记本、甚至重启系统,目标都不会丢。下次打开 Codex,自动接上。

模型通过结构化的 update_goal 工具汇报进度状态,token 预算耗尽时触发「软着陆」而非硬停。

有人用这个功能连续跑了 14 个小时,中间暂停 5 小时去睡觉,回来 Codex 从断点续跑,把一个设备驱动项目做完了。

工程化,干净,但克制。

Hermes Agent:一个人干不完,那就上一个团队

Hermes Agent 的野心最大。

在这里,/goal 只是冰山一角。真正的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队协作问题。

看板的底层是本地 SQLite,持久化存储,跨重启不丢。

你在上面创建一个任务卡片,Hermes 会直接把它拆成多个子任务,分配给不同的 Agent worker。每个 worker 是一个独立的 OS 进程,有自己的身份、模型配置和工作目录。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的目标锁定(Ralph loop),看板管的是多个 Agent 之间的任务调度。一个纵向深入,一个横向铺开。

最后,是五层防烂尾机制。

第一层,心跳检测。每个 worker 定期向看板报到,证明自己还活着。

第二层,僵尸回收。worker 超时没响应?系统自动判定死亡,回收它手上的任务重新分配。macOS 上还有专门的达尔文僵尸检测逻辑。

第三层,退出拦截。worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,防止「摸鱼型 Agent」反复领任务又不做。

第四层,幻觉拦截。这是最狠的一层。AI 说「我做完了」不算数,系统会验证它实际产出的代码是否真的落盘了。Agent 说自己创建了一个文件但实际上没有?抓住,回滚,重来。

第五层,重试预算。每个任务有独立的 max_retries,最多重试 N 次,超过就上报人类。绝对不会无限循环到死机。

Claude Code:做事的人和验收的人,不能是同一个

Anthropic 是三家里最后出手的,但方案最巧妙。

本质上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条件(比如「test / auth 目录下所有测试通过且 lint 无报错」),Claude 就开始干活。

关键设计在验收环节。每干完一轮,系统不让 Claude 自己判断「我做完了没有」。

它把对话记录和你的完成条件一起发给一个独立的小模型(默认是 Haiku),让这个小模型来裁判。

小模型如果觉得没完成,就需要返回一个具体理由(比如「test_login.py还有 2 个 failure」)。然后这个理由会被注入 Claude 下一轮的上下文,指导它接着干。

如果小模型认为完成了,目标就会自动清除,任务结束。

值得一提的是,这个裁判模型不调用任何工具,不读文件,不跑命令。它只看 Claude 在对话里产出的内容。

所以,你的完成条件必须是 Claude 在对话中能证明的东西。

它最长支持 4000 字符,因此你可以写得很细。

甚至,还可以在条件里加约束,比如「不修改其他测试文件」「20 轮内完成否则停止」等等。

决赛进行时:工作流入口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了两边的模型,同时也是 DeepSeek V4 等模型的主力分发渠道。

三条路径,恰好覆盖了 ASI 决赛的三个生态入口。

而他们争的,也是同一样东西 —— 工作流。

谁的 Agent 先让开发者养成「设完目标就走开」的习惯,谁就锁死了工作流入口。

因为习惯一旦形成,迁移成本是指数级的。

你不会轻易离开一个已经跑通了看板调度、断点续传、checkpoint 回滚的 Agent 基础设施。

一个看似很小的 / goal 命令,背后卡的是整条 Agent 工作流的护城河。

参考资料:

  • https://code.claude.com/docs/en/goal

  • https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

  • https://github.com/anthropics/claude-code/releases/tag/v2.1.139

  • https://developers.openai.com/codex/changelog

相关内容

把四个AI扔进虚拟世界,究...
记得在AI技术发展的前几年,为了检验智能体可实现的功能效果,常有类...
2026-06-04 01:41:43
我为Claude Opus...
Anthropic上周发布了最新的前沿大语言模型Claude Op...
2026-06-04 01:40:09
遭恶意“仅退款”榴莲商家,...
本文自南都。 采写 | 南都N视频记者 付冰洁 河南濮阳冷冻榴莲商...
2026-06-02 01:29:13
只有AI的世界!GPT全员...
最近看到一个事,简直像科幻片开头。 有人真的把一群AI扔进了一个虚...
2026-05-31 23:14:30
AI社会治理测试:Grok...
IT之家 5 月 30 日消息,Emergence AI 于 5 ...
2026-05-30 19:35:19
对榴莲维权商家发出“死亡恐...
▲遭恶意“仅退款”榴莲商家:接到大量威胁恐吓留言,已报警并获刑事立...
2026-05-30 19:01:11

热门资讯

人生要义:活在当下 人生要义:活在当下。→欲望即痛苦。(佛陀)→执怒就像握了一把丢向他人的热煤炭,被烫伤的人反而是你。(...
霓虹灯下,与自己的一场博弈 我站在满是海报的墙壁前,看着光影在脸上交替。左边是红调的冷艳,右边是白芒的锐利。我脱下一半的皮衣,露...
原创 菲... 英国女王的丈夫,菲利普亲王,终于走完了他漫长而传奇的一生,将年龄定格在了99岁。这个在王室里长久耕耘...
魏牌蓝山智驾夺冠,北京实景验证... 2026年5月30日,“智驾魔鬼路段挑战赛·北京站精英挑战赛”结果新鲜出炉。魏牌全新蓝山以120分满...
中考备考饮食指南:科学搭配助力... 中考是孩子学业生涯中的重要节点,不仅考验知识掌握程度,更需要良好的身体状态和专注力作为支撑。备考及考...
@奥克兰人注意!本周六,海港大... @奥克兰市民请注意! 本周六, 海港大桥将再次迎来抗议活动! 本周六(5月30日),新西兰摩托车倡导...
重庆赛帕斯汽车零部件申请五金蚀... 国家知识产权局信息显示,重庆赛帕斯汽车零部件股份有限公司申请一项名为“一种五金蚀刻自动添加系统及其循...
原创 今... 广岛三箭vs名古屋鲸八 广岛三箭近况:广岛三箭本赛季近10个主场比赛,在落后的情况下最终主场拿下的...
澳超 阿德莱德联VS奥克兰FC... 一、赛事概况 北京时间5月15日17:35,2025-26赛季澳大利亚足球超级联赛焦点对决正式打响,...
百元香水让女友变树袋熊,这味道... 那天晚上女朋友突然凑近我脖子深吸一口气,然后恶狠狠瞪着我:“说!今天喷了什么香水?”我一脸懵地站在原...