效率自动化 / 工作流案例

【完全版】《24小时不间断的最强AI Agent》制作方法

初级到中级 首次搭建后持续迭代 @sumika45379
结果

把易崩的多 agent 自动化改成可长期运行的 24 小时系统 | 设计重点从“多”转向“稳”

适合谁

想搭建长期运行、抗崩溃的 AI agent 自动化系统的个人开发者 / 自动化玩家

你覺得AI Agent的全自動化還是個遙遠的夢嗎?其實,它真的可以實現。事實上,AI Agent 跑不順的很多原因都出在「設計陷阱」。我自己也試過一開始就想全部自動化,做了大約40個Agent,結果徹底崩了,哈哈。但最近,我試了海外流行的「如何打造24小時持續運行的AI Agent」方法,效果非常顯著。這次,我會總結出一套設計方法,教你打造「不易崩潰、持續運作的AI Agent」,一起來看看吧💖

「做一個AI Agent,讓它在我睡覺的時候自動幹活」,這真的太讓人心動了。

我一開始也是這麼想的。

早上醒來,X 的草稿已經寫好了。AI新聞摘要自動發到Slack。提交紀錄整理得整整齊齊。

這種未來,肯定會有的吧?

其實,半年前還是個「不會寫代碼的文科生」的我,開始碰 Claude Code 之後,一口氣並行做了40個左右的Agent。有Leader、Writer、Researcher、QA、Editor……我邊在腦子裡畫組織圖邊做。

3小時後,全掛了,哈哈哈。

Image
Image

那一刻我才真正意識到:「做AI Agent」和「讓AI Agent持續運作」完全是兩回事。

最近 Claude Code 社群裡,有人分享「做了40個Agent最後全放棄」的經驗,我當時也做了一模一樣的事。與此同時,海外開發者 Nate Herk 發了一篇神級文章,講他「試了三種部署方法並做了對比」,看完那篇我就全明白了。

今天,我就把「從我搞廢40個Agent,到讀透Nate Herk的文章,再自己全部試過,最終摸索出的不崩潰、24小時持續運行的AI Agent打造方法」,一個不落地完整寫出來💖

讀到最後,你會收穫這些:

  • 從結構上理解「為什麼自己的Agent會崩」
  • 搞清楚 /loop / Routines / Modal / [Trigger.dev](//Trigger.dev) / Agent SDK / Managed Agents 的差別
  • 獲得「何時該用哪種方法」的判斷流程
  • 掌握 Hook(不崩潰設計的核心)的用法
  • 從此不用再重複「做40個然後全廢棄」的悲劇

我已經把內容嚼碎到連我這種「不會寫代碼的文科生」都能看懂,安心讀下去吧。

一起拿下勝利✨

■ 話說回來,為什麼那40個會崩?

先從我當時到底幹了什麼說起。

第一週,真的像魔法一樣。

「A君(研究擔當),查一下這個」「B君(文案擔當),用A的結果寫個草稿」「C君(審核擔當),檢查B的稿子」——Agent之間按順序調用,我只需要下指令。

早上去沖杯咖啡,回來就有三篇草稿等著。

是不是太神了???

但從第二週左右開始,事情就不對勁了。

「咦,B應該寫的稿子,怎麼是A在寫……」

「C不是該審核嗎,怎麼說的和B一樣……」

「話說,D不是最早創建的嗎,跑哪去了?」

到了第三週,連我自己都搞不清到底發生了什麼。

一個月後,我把40個Agent 全停了

其實已經有人分享過類似的經驗。Kohaku(@Kohaku\\\_NFT)發的筆記《做了40個AI員工,一個月後全停了》完全戳中我。跟我的經歷一模一樣。

那篇筆記列出了Agent在結構上崩潰的 3個原因。這不光是感覺,Anthropic 官方文檔裡也寫了。

原因1: 上下文腐敗(Context Rot)

用 Claude Code 的人絕對會碰到這個坑。

Claude 有上下文窗口,也就是「同時能處理的信息量上限」。Anthropic 官方文檔寫道:

*Token 數越多,模型從上下文準確回憶信息的能力就越低。*

「能裝100萬token」和「用了100萬token還能穩定運行」完全是兩回事。

實測中,超過10萬token左右輸出就開始不穩了。同時跑40個Agent,每個都背著歷史記錄,窗口很快填滿。然後就會忘記「剛才下達的指令」,規則開始被忽略,跟過去的對話矛盾。

這就是上下文腐敗。

Image
Image

我當時以為「多培養一下就好了」,於是一直加寫規則,結果越加越崩。規則越多,越會互相衝突,加速上下文腐敗

完全適得其反,哈哈哈。

原因2: Compaction 崩潰

Image
Image

Claude Code 有個 Compaction(壓縮)功能。當上下文快滿時,它會總結過去的對話,騰出空間給新的對話。

聽起來很完善,但實際上,總結的總結一層層疊加,最後會退化為噪聲。

我那40個Agent就出現過這種情況:

「3個人消失,2個人重複,剩下的35個人完全沒發現。」

這是 Kohaku 筆記裡的金句,說得一點沒錯。Compaction 之後,Agent之間開始「咦,誰在誰不在來著?」狀態不一致,但35個Agent若無其事地繼續跑。

跑3小時,幾乎必定崩潰。

原因3: 文本規則不是絕對命令

Image
Image

這是我最大的盲點。

我一直以為「寫好規則就會遵守」。在 CLAUDE.md 和 Agent 定義裡都寫了極詳細的規則。

但對 LLM 來說,規則文本只是上下文的一部分。它會被之前的對話、中途下的指令、當前的語境影響,導致解讀逐漸偏離。

明明寫了「禁止」,卻被執行了。明明寫了「必須」,卻被跳過了。

同時跑40個,每個都用略微不同的解讀開始行動。這也是崩潰的原因。

所以,我那40個Agent不是因為運營失誤而崩潰,而是從一開始就建立在會崩潰的結構上

下面是重點:如何打造「不會崩潰的結構」。

■ 不崩潰Agent的「三大支柱」(WAT框架)

Image
Image

讀 Nate Herk 的文章時,我整個世界啪地一下變了。

那就是「WAT框架」的思路。

WAT 代表:

  • W = Workflow(流程書)
  • A = Agent(思考部分)
  • T = Tools(執行部分)

我們說「做AI Agent」的時候,下意識地會把這三樣混在一起想。但把它們當作不同的東西來對待,是不崩潰Agent的大原則。

Workflow(流程書)

這是決定「做什麼、按什麼順序做」的確定性部分

比如「每天早上9點抓取X的提及 → 摘要 → 發到Slack」這樣的流程。

這裡不需要AI判斷。順序是固定的,按既定步驟執行即可。

Agent(思考部分)

這裡是AI大展身手的地方。

「根據用戶的提及,思考合適的回覆」或「根據研究結果寫出文章草稿」這類需要判斷、推理、創造的部分交給AI。

Tools(執行部分)

調用X的API、寫入文件、發送Slack、生成圖片——這些需要確定性行為,所以用代碼牢牢固定。

AI如果「自作聰明搞奇怪動作」就麻煩了,所以關鍵是限制AI可以觸及的範圍

崩潰的原因就是把三者混在一起

我當時做40個Agent的時候,是把所有東西都當成Agent

我以為「研究、寫作、質量檢查,全都讓AI判斷就好」。

不是這樣的。

需要判斷的部分(Agent)、固定步驟(Workflow)、固定行為(Tools),分別在不同層次實現。這是不崩潰設計的基礎。

此外,用WAT思考,部署方法也更清晰。

「把什麼東西部署到哪裡」就確定了。

有些方法可以承載全部WAT;有些方法只能承載W和T,丟掉A。意識到這一點,就能看出哪種方法適合自己的用途。

接下來,我們逐一看看6種實現「24小時運行」的具體方法。

■ Method 1: /loop(在終端中運行的即席Bot)

先從最簡單的方法開始。

Image
Image

Claude Code 有 /loop 功能,作為「最初的自動化」非常強大。

使用方法超級簡單。

打開 Claude Code,直接說:

*「創建一個循環,每10分鐘讀取新評論,利用轉錄結果思考回覆。」*

Claude Code 就會在後台用 cron create 工具自動幫你設置好調度。

原理:cron三兄弟

後台只靠三個工具運作:

  • cron create(創建調度)
  • cron list(查看當前調度)
  • cron delete(刪除調度)

調度器運行在 Claude Code 的進程內,每個會話獨立。所以,你在5個終端裡同時跑5個不同的循環,也不會互相干擾(只要不寫入同一個文件)。

終端版和桌面版行為不同

這是 Nate Herk 文章裡讓我「啊!?」的一點。

在桌面應用中運行 /loop 後再打 /clear,cron 會死掉

終端版裡,打 /clear 後 cron 仍然存活

這個差別其實非常大。

長時間運行循環,上下文會不斷填滿。你想用 /clear 刷新它,但如果cron也死了就沒意義了。

終端版可以只清除上下文,讓cron繼續運行。

讓我感動的絕招:在循環中嵌入 /clear

這是 Nate Herk 的原創技巧,我真心覺得太天才了。

在終端中創建兩個循環:

  • 循環A:每10分鐘做正事
  • 循環B:每5分鐘以斜杠命令的形式輸入 /clear

等等,cron能打斜杠命令?可以,哈哈。

循環A在後台執行任務時,循環B每5分鐘重置一次上下文。在上下文腐敗發生之前自動刷新

知道這個的時候,我差點從椅子上摔下來,太神了吧???

/loop 的弱點(需要知道的事)

不過也有注意事項。

  • PC 一关,循环也会停(因为是在本地运行)
  • 会话一关就结束
  • 终端版最长能跑 7 天左右,桌面版最长 3 天左右 会过期(官方没给精确值,所以写了个范围)
  • 就算指定了“每10分钟一次”,也不会刚好在 10:10:00 跑,而是会有 几分钟的偏差。这是为了不让所有 Claude Code 会话同时去请求 Anthropic 的 API,故意设计的机制

另外,最大的坑是重试循环。

这是 Zenn 上有人分享过的案例:Claude Code 误读了错误消息,反复调用同一个工具,结果 5 小时的额度在 19 分钟内就用光了

这真不是开玩笑。

要防止这种情况,后面会讲到的 Hook 很管用。如果只用 /loop,建议 别直接扔着过夜,先短时间跑一下验证行为

用 WAT 分类来说,/loop 是一种 能把 W、A、T 全带走 的部署方式。Agent 还活着,Tools 能用,Workflow 也能跑。论省事,它最强。

■ Method 2: Claude Routines(关上电脑也能跑的杀手锏)

Image
Image

这个啊,对我来说感觉就是“终于来了的杀手锏”。

/loop 虽然方便,但终究得让电脑一直开着。出门在外就不能跑,电脑重启就停。

在 Anthropic 云端运行 的,就是 Claude Routines。

使用方法

打开 Claude Code 桌面应用,选择 Routines 就行。

里面有“本地 Scheduled Tasks”和“远程 Claude Routines”两种类型:

  • 本地:在电脑上运行(电脑关上就不跑了)
  • 远程:在 Anthropic 云端运行(电脑关上也能跑)

设置界面几乎一样。写好提示词,定好时间,保存即可。

你写的提示词会按计划 注入到一个全新的 Claude Code 会话中,然后那个会话去执行任务

上限(按套餐区分)

远程 Routines 在 Anthropic 云端运行,所以 按套餐每天有执行次数上限

官方文档([code.claude.com/docs/en/routines](//code.claude.com/docs/en/routines))是这样写的:

  • Pro:每天最多 5 次
  • Max 5x:每天最多 15 次
  • Max 20x:每天最多 15 次
  • Team / Enterprise:未明确上限(可能按套餐另有设置)

超出的部分会额外收费,所以频率设计要想清楚。

最短间隔是 1 小时

这个你得知道,否则会踩坑:Routines 的最短执行间隔是 1 小时

就算你想“每 10 分钟跑一次”,cron 也不让设短于 1 小时。

要是需要更细的频率,只能回去用 /loop。

Webhook 和 GitHub 事件也能用

Routines 不只能按计划启动,还有三种触发方式:

  • 定时(cron)
  • API 端点(可从外部调用)
  • GitHub 事件(根据 GitHub 的动作触发)

也就是说,你可以从其他自动化工具调用 Routines。比如 Slack 的 Bot 满足条件后调用 Routines,让 Claude 做调研然后把结果发回来,这种复杂组合也能搭起来。

补跑功能(看似不起眼但很关键)

本地 Scheduled Tasks 有个“补跑功能”,这其实是个隐藏的坑。

如果你把电脑关了 5 天,回来一打开,它会一口气把过去 5 天没跑的任务全部跑完

有时候方便,有时候很危险。

对于“只希望在这个时间点跑”的 routine,最好把它停掉,或者重新设计。

我实际用 Routines 跑的例子

下面列一下我实际在跑的例子,以及 Claude Code 用户之间流传的成功案例。

国内 note 上有这些分享:

  • 每天早上 9 点自动收集 HackerNews / Reddit / 官方博客上的 AI 资讯 → 存入 Notion 带时间戳 → 发 Slack 通知(注意:网络权限必须设为“Full”,否则无法访问外部)
  • 每周日晚上 18 点自动生成一周的 X 帖子草稿 → 周一到周六早 7 点 / 中午 12 点 / 晚上 19 点定时发布(配合人工审核,不全自动)
  • 睡觉时跑代码 review(Routines + Claude Agent SDK 组合,后面会讲)

纯云端,不需要电脑。这真的是革命性的,太棒了。

用 WAT 分类来说,Routines 是一种 能把 W、A、T 全带走 的部署方式。和 /loop 一样,可以完整使用 Claude Code 订阅的所有功能。

这对我来说就是“第一个杀手锏”。

■ Method 3: Modal 和 [Trigger.dev](//Trigger.dev)(在云端完全自主运行)

从这里开始难度稍微提升了。

Image
Image

“已经不需要在 Claude Code 里面跑了,我想完全放到外面的云端,独立运行。” 这就是 Modal 和 [Trigger.dev](//Trigger.dev)。

Modal(Python)

Modal 是 Python 的无服务器平台。“写一个 Python 函数,部署,用 cron 触发”那种世界。

价格还算友好:

  • Free Tier:每月 $30 的计算额度(Starter 套餐)
  • 按秒计费(仅按使用 CPU、内存、GPU 的时间收费)

使用 GPU 时的单价示例:A10G 每秒 $0.000306,A100 每秒 $0.001036,H100 每秒 $0.002778(来自 [modal.com/pricing](//modal.com/pricing))。

[Trigger.dev](//Trigger.dev)(TypeScript)

[Trigger.dev](//Trigger.dev) 是 TypeScript 的 持久化工作流引擎。比 Modal 更偏向“不易中断的长时间工作流”场景。

价格如下:

  • Free:$0/月(含 $5 的使用额度),同时执行 10 个
  • Hobby:$10/月(含 $10 使用额度),同时执行 25 个
  • Pro:$50/月(含 $50 使用额度),同时执行 100+ 个

Modal 和 [Trigger.dev](//Trigger.dev) 怎么选?

简单来说:

  • 想用 Python 写 → Modal
  • 想用 TypeScript 写 → [Trigger.dev](//Trigger.dev)
  • “这是确定性脚本,不需要 AI 判断” → Modal 更轻量
  • “想搭长时间运行、类似 Agent 的工作流” → [Trigger.dev](//Trigger.dev) 更合适

两个都能用 cron 触发,也都能通过 Webhook 从外部调用。

重要取舍:失去 Agent

这一点一定要特别注意。

把“之前在 Claude Code 里做的事”移到 Modal 或 [Trigger.dev](//Trigger.dev) 上,就不能再用 Claude Code 订阅了

如果里面还要用 AI,就需要另外准备 Claude API 密钥,按 API 单价计费。

截至 2026 年 5 月,Claude API 价格如下(来自 [platform.claude.com/docs/en/about-claude/pricing](//platform.claude.com/docs/en/about-claude/pricing)):

  • Claude Opus 4.7:输入 $5,输出 $25(每百万 token)
  • Claude Sonnet 4.6:输入 $3,输出 $15
  • Claude Haiku 4.5:输入 $1,输出 $5

换句话说,如果设计上太费 token,可能比 Claude Code 订阅贵得多。

但反过来,不需要 AI 的确定性脚本,用这个就是最强方案。

比如“拉数据、格式化、写入表格”这种处理。不需要 AI 判断吧?把它放到 Modal 或 [Trigger.dev](//Trigger.dev) 上,零 API token 费用,24 小时跑满。

用 WAT 分类来说,Modal / [Trigger.dev](//Trigger.dev) 是一种 能带走 W 和 T,但会失去 A(Agent) 的部署方式。

能否意识到“这些不一定全都要用 AI”,是控制成本的关键。

■ Method 4: Claude Agent SDK(专属你的 Agent 工厂)

Image
Image

“想放到 Modal 或 [Trigger.dev](//Trigger.dev) 上,但还想保留 Agent”,这个贪心愿望的答案就是 Claude Agent SDK。

这个对我来说,感觉是“终于全都连起来了”。

把 Claude Code 平时用的“底层 harness”封装成 SDK,让你能从自己的 Python 或 TypeScript 代码里调用。

能做什么

官方发布的 Agent SDK 拥有和 Claude Code 完全一样的功能:

  • subagents(子 Agent 调用)
  • MCP(外部工具连接)
  • Hook(事件驱动处理)
  • Skills(特定任务的 behavior 定义)
  • 斜杠命令
  • CLAUDE.md(项目上下文)
  • memory(持久化记忆)
  • compaction(自动压缩压缩)

全都能用。你在 Claude Code 里做的事情,可以直接嵌入到自己的代码中。

默认是 Stateless

这里有一个坑要注意:

Agent SDK 的每个请求默认都是无状态的

如果不做任何处理,每次都会以一个全新的状态启动。它不记得“刚才聊了什么”。

要实现连续对话,需要在每次请求时传递 session ID

session_id = "my-session-001"

# 第1次
response = client.query("告诉我项目情况", session_id=session_id)

# 第2次(用同一个 session_id 连接)
response = client.query("那下周的任务呢?", session_id=session_id)

这样 Claude 就会当作“刚才对话的延续”来处理。Compaction 也会自动运行,所以长时间跑也没问题。

如果想“重置到全新状态”,用一个新 session_id 就行。没有 /clear 的对应功能。

费用:按 Claude API 单价计费

Agent SDK 与 Claude Code 订阅是分开的

需要 API 密钥,按 token 单价收费。和 Modal / [Trigger.dev](//Trigger.dev) 一样的机制。

不过,2026年5月13日 Anthropic 宣布,Claude Code 的月度订阅额度,似乎也能用在 Agent SDK 上了。这简直是革命性的。

官方公告在这里(@ClaudeDevs / 2026-05-13)。

从2026年6月15日起,新的月度额度制度启动:

  • Pro:每月 $20 的额度
  • Max 5x:每月 $100 的额度
  • Max 20x:每月 $200 的额度

这些额度可用于 Agent SDK、claude -p、Claude Code GitHub Actions、第三方 Agent SDK 应用。

之前觉得「Agent SDK 太贵了先算了」的人,这下门槛大大降低了。

用 WAT 来说,Agent SDK 能 承载 W/A/T 全部,而且是在自己的基础设施上。无敌。

■ Method 5: Managed Agents(简单提一下)

这个也顺便介绍一下。

Image
Image

Anthropic 推出的新服务,可以在 [platform.claude.com](//platform.claude.com) 上完全托管管理你的 Agent

四个步骤就能部署,在沙盒里运行,保持会话,还能连接 MCP。

不过说实话,我自己并没有在个人用途中使用它。

对于用过 Claude Code 的人来说,在 Claude Code 内完成所有操作更顺手。Managed Agents 给我的印象是「为还没打开过 Claude Code 的人准备的轻量入门包」。

如果你「还不熟悉 Claude Code,但想要 Agent」,这个可能更适合你。

用 WAT 来说,这就相当于把 W/A/T 全部 托付 给 Anthropic。便利性最强,但自定义自由度会降低。

■ Hooks(不崩坏设计的心脏)

接下来这部分,是今天我最想写的内容💖

Image
Image

打造「不崩坏的 Agent」的心脏,就是 Hook

在用 Claude Code 的人中,还有很多根本没用到它,太可惜了。

Hook 是什么?

Claude Code 有各种「时机点」:

  • 使用工具之前
  • 使用工具之后
  • 会话开始的瞬间
  • 会话结束的瞬间
  • 收到某个消息的时候
  • Compaction 运行之前

在每个时机点,你编写的小脚本会自动执行,这就是 Hook 的机制。

为什么 Hook 是不崩坏设计的心脏?

还记得40个 Agent 崩坏的故事吗?原因是3个:

  • 上下文污染
  • Compaction 崩溃
  • 文本规则不被遵守

其中两个,可以通过 Hook 从结构上预防

比如,海外开发者 Mike Dolan 先生(DEV Community)公开了这样一个 Hook:

*当 Compaction 即将运行时,Hook 检测到,并把当前工作交给 subagent 接管。*

也就是说,提前察觉「上下文危险」,自动转给另一个 Agent,在崩溃前逃跑。

我觉得这真的太天才了。

Hook 具体能做什么?

介绍5个典型例子。

第一个是「阻止危险命令执行」。比如 rm -rf、直接访问生产数据库等,Hook 检测并阻止。这是 Claude Code 失控时的最后防线。

第二个是「强制在写文件前先读取」。「先好好读文件再写」的规则,Hook 会物理强制执行。文本规则保不住,但 Hook 是绝对的。

第三个是「每次对话结束时保存回顾」。通过 SessionEnd Hook 自动积累知识。这样在下一个会话中也能利用这些知识。

第四个是「会话开始时加载所需上下文」。通过 SessionStart Hook,每次加载项目状态、过去的错误等需要先读的信息。

第五个是「重试循环检测」。刚才提到的「5小时内容19分钟消失」案例的防御措施。如果同一个工具调用在短时间内反复执行,Hook 会将其停下。

Hook 的本质是「脚本」

Hook 听起来很难,但本质上 只是脚本 而已。

Node.js、Python、Bash,什么都行。Claude Code 在指定的时机调用它而已。

连「不会写代码的文科生」我,第一个 Hook 也是从「Claude 响应结束后响个提示音」这种开始的。一行脚本也是 Hook 哦😂

慢慢积累,它会成为 你专属的安全网

不用再抱怨「规则不被遵守」,而是 用 Hook 物理强制遵守。这就是不崩坏设计的核心。

用 WAT 来说,Hook 就是 在 A 与 T 之间加入决定性约束 的机制。能阻止 AI 「自作聪明做奇怪的事」。

■ 那么,究竟该在什么时候选哪个?(判断流程)

到这里我们已经看到了6种方法。

Image
Image
  • Method 1: /loop
  • Method 2: Claude Routines
  • Method 3: Modal / [Trigger.dev](//Trigger.dev)
  • Method 4: Claude Agent SDK
  • Method 5: Managed Agents
  • Hook(作为心脏附加在所有方法上)

「那到底该选哪个?」你肯定会这么想,我一开始也是这样。

整理一下,判断轴是这样的:

1. 实时操作,且需要完整的 Agent 循环 → /loop

自己坐在屏幕前,和 AI 一起操作时用。最便捷。通过把 /clear 嵌入 /loop 的秘诀,也能应对上下文污染。

2. 睡觉或外出时,希望它自动运行 → Claude Routines

关掉 PC 也能运行的本命选项。间隔1小时以上时用这个。在套餐限制内。

3. 不需要 AI 判断,确定性处理 → Modal 或 [Trigger.dev](//Trigger.dev)

比如「获取数据、整理格式、写入表格」这种不需要 AI 推理的处理。用 /loop 或 Routines 跑这些,成本会很浪费。

4. 想在自己基础设施上运行整个 Agent → Agent SDK + Modal / [Trigger.dev](//Trigger.dev)

在 Modal 或 [Trigger.dev](//Trigger.dev) 里集成 Agent SDK的模式。自由度最高。但 API 令牌费用另算(2026年6月起可适用月额度)。

5. 总之想轻松试试 → Managed Agents

给不熟悉 Claude Code 的人作为入门。

6. 无论选哪个,都想打造不崩坏的设计 → 配合 Hook

这不是一种方法,而是基础。可以附加在1〜5的任何一种上。

Nate Herk 先生的一条推文中,有一句话让我感触极深:

*「默认选择最 agentic 的方法,是最大的陷阱」*

真的太对了💖

「全部让 AI 判断就好」是陷阱,只在需要判断的部分交给 AI,才是不崩坏设计的本质。

■ 我在弄崩40个后意识到:5个教训

最后,我写下弄崩40个、试完6种方法后终于得出的5个教训。

连「不会写代码的文科生」我都能走到这一步。大家看着我的失败,直接就能从「不崩坏的设计」开始。

教训1: 不要相信上下文污染

Image
Image

「能装100万 token」和「用100万 token 也稳定」是两回事。超过10万 token 左右,输出就开始漂移。

要运行长时间循环,从一开始就把定期 /clear,或用 Hook 在 Compaction 前转移 纳入设计。

教训2: 1人胜过40人

Image
Image

Agent 越多越容易崩坏。

「研究角色、写作角色、检查角色」这种分工的心情我懂(我也是这样)。但与其3小时全崩,让1个人按顺序运行的设计 好上一百倍。

不是靠培养就能变好。最初的结构是否不易崩坏 才是一切。

教训3: 别让重试循环吸干你的额度

Image
Image

5小时的额度19分钟消失,真有其事。

如果晚上睡觉时放着不管,一定要用 Hook 加上重试检测。另外,先短时间测试确认,再转长时间运行。

绝对不要「一开始就全速开跑」。我朋友也掉进过同一个坑😂

教训4: 不要太相信「自动化」

Image
Image

Routines 强到「超出想象」,会自己 commit、自己发通知、自己删文件😂

在陶醉于「自动化啦!」之前,一定要做权限最小化

限定可写入的目录。缩小可调外部API的范围。用 Hook 守卫。

防止「一不留神就干了奇怪的事」,只有最初的设计能做到。

教训5: 「视野」由人类掌控

Image
Image

这也许是最重要的一点。

Agent 只看得到自己负责的范围。把握整体、决定优先级、判断「这个不对」的,是 人类的工作

不是「甩给 AI」,而是 「人类精准划定交给 AI 的范围」,才是不崩坏的运营。

■ 总结

写得有点长,最后浓缩一下。

「24小时不停运行的最强AI Agent」其实就是 用 WAT 思考 + 合适部署 + 用 Hook 守护 这个三件套。

Image
Image
  • 将 Workflow(步骤)与 Agent(判断)与 Tools(执行)分开构建
  • 根据用途从 /loop / Routines / Modal / [Trigger.dev](//Trigger.dev) / Agent SDK 中选择
  • 所有方案都配上 Hook,防止上下文污染和重试循环

就这些。

连「不会写代码的文科生」我都能走到这一步。所以,我想让那些觉得自己「可能不行」的人,一定要试试。

弄崩40个的经验,现在仍在我身上活着。正因为有那些失败,我才明白了「不崩坏的结构」的意义。大家看着我的失败,直接就能从「不崩坏的设计」开始。

嘿,这不很厉害吗??

先打开 Claude Code,试试只弄一个 /loop:「创建一个每10分钟做〇〇的循环」。就那样,你看世界的方式就会改变💖

一起赢吧✨

一定要试试看!大家也来瞧瞧吧~~!💖✨😻

---

另外,这篇文章如果对你有那么一点参考价值的话。

我是栖身之处@ClaudeCode的忠实用户(@sumika45379)。

Image
Image

这个账号由我运营——一个从纯文科生、完全非工程师,到通过Vibe Coding能够进行开发的文科生。

我致力于用通俗易懂的方式解释Claude Code的最新信息和开发技巧💖

目前已经达到仅用Claude Code就能制作Web应用并发布到全世界的水平✨

平时主要分享这些内容:

  • 非工程师也能做到的Vibe Coding学习记录
  • 免费工具使用技巧
  • 新手容易踩的坑和跨越方法
  • AI Agent的设计与运维经验

从「不会写代码」的自卑,到「和AI一起什么都能做」的自信,包括踩过的坑,我都在原原本本地分享😻

感兴趣的话,欢迎关注我看看👀

今后也会继续发布「我或许也能做到」这样对新手友好的内容!

参考与引用

https://x.com/nateherk/status/2055313067144065352

https://x.com/ClaudeDevs/status/2054610152817619388

相关案例