【完全版】《24小时不间断的最强AI Agent》制作方法

你覺得AI Agent的全自動化還是個遙遠的夢嗎？其實，它真的可以實現。事實上，AI Agent 跑不順的很多原因都出在「設計陷阱」。我自己也試過一開始就想全部自動化，做了大約40個Agent，結果徹底崩了，哈哈。但最近，我試了海外流行的「如何打造24小時持續運行的AI Agent」方法，效果非常顯著。這次，我會總結出一套設計方法，教你打造「不易崩潰、持續運作的AI Agent」，一起來看看吧💖

「做一個AI Agent，讓它在我睡覺的時候自動幹活」，這真的太讓人心動了。

我一開始也是這麼想的。

早上醒來，X 的草稿已經寫好了。AI新聞摘要自動發到Slack。提交紀錄整理得整整齊齊。

這種未來，肯定會有的吧？

其實，半年前還是個「不會寫代碼的文科生」的我，開始碰 Claude Code 之後，一口氣並行做了40個左右的Agent。有Leader、Writer、Researcher、QA、Editor……我邊在腦子裡畫組織圖邊做。

3小時後，全掛了，哈哈哈。

那一刻我才真正意識到：「做AI Agent」和「讓AI Agent持續運作」完全是兩回事。

最近 Claude Code 社群裡，有人分享「做了40個Agent最後全放棄」的經驗，我當時也做了一模一樣的事。與此同時，海外開發者 Nate Herk 發了一篇神級文章，講他「試了三種部署方法並做了對比」，看完那篇我就全明白了。

今天，我就把「從我搞廢40個Agent，到讀透Nate Herk的文章，再自己全部試過，最終摸索出的不崩潰、24小時持續運行的AI Agent打造方法」，一個不落地完整寫出來💖

讀到最後，你會收穫這些：

從結構上理解「為什麼自己的Agent會崩」
搞清楚 /loop / Routines / Modal / [Trigger.dev](//Trigger.dev) / Agent SDK / Managed Agents 的差別
獲得「何時該用哪種方法」的判斷流程
掌握 Hook（不崩潰設計的核心）的用法
從此不用再重複「做40個然後全廢棄」的悲劇

我已經把內容嚼碎到連我這種「不會寫代碼的文科生」都能看懂，安心讀下去吧。

一起拿下勝利✨

■ 話說回來，為什麼那40個會崩？

先從我當時到底幹了什麼說起。

第一週，真的像魔法一樣。

「A君（研究擔當），查一下這個」「B君（文案擔當），用A的結果寫個草稿」「C君（審核擔當），檢查B的稿子」——Agent之間按順序調用，我只需要下指令。

早上去沖杯咖啡，回來就有三篇草稿等著。

是不是太神了？？？

但從第二週左右開始，事情就不對勁了。

「咦，B應該寫的稿子，怎麼是A在寫……」

「C不是該審核嗎，怎麼說的和B一樣……」

「話說，D不是最早創建的嗎，跑哪去了？」

到了第三週，連我自己都搞不清到底發生了什麼。

一個月後，我把40個Agent 全停了。

其實已經有人分享過類似的經驗。Kohaku（@Kohaku\\\_NFT）發的筆記《做了40個AI員工，一個月後全停了》完全戳中我。跟我的經歷一模一樣。

那篇筆記列出了Agent在結構上崩潰的 3個原因。這不光是感覺，Anthropic 官方文檔裡也寫了。

原因1: 上下文腐敗（Context Rot）

用 Claude Code 的人絕對會碰到這個坑。

Claude 有上下文窗口，也就是「同時能處理的信息量上限」。Anthropic 官方文檔寫道：

*Token 數越多，模型從上下文準確回憶信息的能力就越低。*

「能裝100萬token」和「用了100萬token還能穩定運行」完全是兩回事。

實測中，超過10萬token左右輸出就開始不穩了。同時跑40個Agent，每個都背著歷史記錄，窗口很快填滿。然後就會忘記「剛才下達的指令」，規則開始被忽略，跟過去的對話矛盾。

這就是上下文腐敗。

我當時以為「多培養一下就好了」，於是一直加寫規則，結果越加越崩。規則越多，越會互相衝突，加速上下文腐敗。

完全適得其反，哈哈哈。

原因2: Compaction 崩潰

Claude Code 有個 Compaction（壓縮）功能。當上下文快滿時，它會總結過去的對話，騰出空間給新的對話。

聽起來很完善，但實際上，總結的總結一層層疊加，最後會退化為噪聲。

我那40個Agent就出現過這種情況：

「3個人消失，2個人重複，剩下的35個人完全沒發現。」

這是 Kohaku 筆記裡的金句，說得一點沒錯。Compaction 之後，Agent之間開始「咦，誰在誰不在來著？」狀態不一致，但35個Agent若無其事地繼續跑。

跑3小時，幾乎必定崩潰。

原因3: 文本規則不是絕對命令

這是我最大的盲點。

我一直以為「寫好規則就會遵守」。在 CLAUDE.md 和 Agent 定義裡都寫了極詳細的規則。

但對 LLM 來說，規則文本只是上下文的一部分。它會被之前的對話、中途下的指令、當前的語境影響，導致解讀逐漸偏離。

明明寫了「禁止」，卻被執行了。明明寫了「必須」，卻被跳過了。

同時跑40個，每個都用略微不同的解讀開始行動。這也是崩潰的原因。

所以，我那40個Agent不是因為運營失誤而崩潰，而是從一開始就建立在會崩潰的結構上。

下面是重點：如何打造「不會崩潰的結構」。

■ 不崩潰Agent的「三大支柱」（WAT框架）

讀 Nate Herk 的文章時，我整個世界啪地一下變了。

那就是「WAT框架」的思路。

WAT 代表：

W = Workflow（流程書）
A = Agent（思考部分）
T = Tools（執行部分）

我們說「做AI Agent」的時候，下意識地會把這三樣混在一起想。但把它們當作不同的東西來對待，是不崩潰Agent的大原則。

Workflow（流程書）

這是決定「做什麼、按什麼順序做」的確定性部分。

比如「每天早上9點抓取X的提及 → 摘要 → 發到Slack」這樣的流程。

這裡不需要AI判斷。順序是固定的，按既定步驟執行即可。

Agent（思考部分）

這裡是AI大展身手的地方。

「根據用戶的提及，思考合適的回覆」或「根據研究結果寫出文章草稿」這類需要判斷、推理、創造的部分交給AI。

Tools（執行部分）

調用X的API、寫入文件、發送Slack、生成圖片——這些需要確定性行為，所以用代碼牢牢固定。

AI如果「自作聰明搞奇怪動作」就麻煩了，所以關鍵是限制AI可以觸及的範圍。

崩潰的原因就是把三者混在一起

我當時做40個Agent的時候，是把所有東西都當成Agent。

我以為「研究、寫作、質量檢查，全都讓AI判斷就好」。

不是這樣的。

需要判斷的部分（Agent）、固定步驟（Workflow）、固定行為（Tools），分別在不同層次實現。這是不崩潰設計的基礎。

此外，用WAT思考，部署方法也更清晰。

「把什麼東西部署到哪裡」就確定了。

有些方法可以承載全部WAT；有些方法只能承載W和T，丟掉A。意識到這一點，就能看出哪種方法適合自己的用途。

接下來，我們逐一看看6種實現「24小時運行」的具體方法。

■ Method 1: /loop（在終端中運行的即席Bot）

先從最簡單的方法開始。

Claude Code 有 /loop 功能，作為「最初的自動化」非常強大。

使用方法超級簡單。

打開 Claude Code，直接說：

*「創建一個循環，每10分鐘讀取新評論，利用轉錄結果思考回覆。」*

Claude Code 就會在後台用 cron create 工具自動幫你設置好調度。

原理：cron三兄弟

後台只靠三個工具運作：

cron create（創建調度）
cron list（查看當前調度）
cron delete（刪除調度）

調度器運行在 Claude Code 的進程內，每個會話獨立。所以，你在5個終端裡同時跑5個不同的循環，也不會互相干擾（只要不寫入同一個文件）。

終端版和桌面版行為不同

這是 Nate Herk 文章裡讓我「啊！？」的一點。

在桌面應用中運行 /loop 後再打 /clear，cron 會死掉。

但終端版裡，打 /clear 後 cron 仍然存活。

這個差別其實非常大。

長時間運行循環，上下文會不斷填滿。你想用 /clear 刷新它，但如果cron也死了就沒意義了。

終端版可以只清除上下文，讓cron繼續運行。

讓我感動的絕招：在循環中嵌入 /clear

這是 Nate Herk 的原創技巧，我真心覺得太天才了。

在終端中創建兩個循環：

循環A：每10分鐘做正事
循環B：每5分鐘以斜杠命令的形式輸入 /clear

等等，cron能打斜杠命令？可以，哈哈。

循環A在後台執行任務時，循環B每5分鐘重置一次上下文。在上下文腐敗發生之前自動刷新。

知道這個的時候，我差點從椅子上摔下來，太神了吧？？？

/loop 的弱點（需要知道的事）

不過也有注意事項。

PC 一关，循环也会停（因为是在本地运行）
会话一关就结束
终端版最长能跑 7 天左右，桌面版最长 3 天左右 会过期（官方没给精确值，所以写了个范围）
就算指定了“每10分钟一次”，也不会刚好在 10:10:00 跑，而是会有 几分钟的偏差。这是为了不让所有 Claude Code 会话同时去请求 Anthropic 的 API，故意设计的机制

另外，最大的坑是重试循环。

这是 Zenn 上有人分享过的案例：Claude Code 误读了错误消息，反复调用同一个工具，结果 5 小时的额度在 19 分钟内就用光了。

这真不是开玩笑。

要防止这种情况，后面会讲到的 Hook 很管用。如果只用 /loop，建议 别直接扔着过夜，先短时间跑一下验证行为。

用 WAT 分类来说，/loop 是一种 能把 W、A、T 全带走 的部署方式。Agent 还活着，Tools 能用，Workflow 也能跑。论省事，它最强。

■ Method 2: Claude Routines（关上电脑也能跑的杀手锏）

这个啊，对我来说感觉就是“终于来了的杀手锏”。

/loop 虽然方便，但终究得让电脑一直开着。出门在外就不能跑，电脑重启就停。

在 Anthropic 云端运行 的，就是 Claude Routines。

使用方法

打开 Claude Code 桌面应用，选择 Routines 就行。

里面有“本地 Scheduled Tasks”和“远程 Claude Routines”两种类型：

本地：在电脑上运行（电脑关上就不跑了）
远程：在 Anthropic 云端运行（电脑关上也能跑）

设置界面几乎一样。写好提示词，定好时间，保存即可。

你写的提示词会按计划 注入到一个全新的 Claude Code 会话中，然后那个会话去执行任务。

上限（按套餐区分）

远程 Routines 在 Anthropic 云端运行，所以 按套餐每天有执行次数上限。

官方文档（[code.claude.com/docs/en/routines](//code.claude.com/docs/en/routines)）是这样写的：

Pro：每天最多 5 次
Max 5x：每天最多 15 次
Max 20x：每天最多 15 次
Team / Enterprise：未明确上限（可能按套餐另有设置）

超出的部分会额外收费，所以频率设计要想清楚。

最短间隔是 1 小时

这个你得知道，否则会踩坑：Routines 的最短执行间隔是 1 小时。

就算你想“每 10 分钟跑一次”，cron 也不让设短于 1 小时。

要是需要更细的频率，只能回去用 /loop。

Webhook 和 GitHub 事件也能用

Routines 不只能按计划启动，还有三种触发方式：

定时（cron）
API 端点（可从外部调用）
GitHub 事件（根据 GitHub 的动作触发）

也就是说，你可以从其他自动化工具调用 Routines。比如 Slack 的 Bot 满足条件后调用 Routines，让 Claude 做调研然后把结果发回来，这种复杂组合也能搭起来。

补跑功能（看似不起眼但很关键）

本地 Scheduled Tasks 有个“补跑功能”，这其实是个隐藏的坑。

如果你把电脑关了 5 天，回来一打开，它会一口气把过去 5 天没跑的任务全部跑完。

有时候方便，有时候很危险。

对于“只希望在这个时间点跑”的 routine，最好把它停掉，或者重新设计。

我实际用 Routines 跑的例子

下面列一下我实际在跑的例子，以及 Claude Code 用户之间流传的成功案例。

国内 note 上有这些分享：

每天早上 9 点自动收集 HackerNews / Reddit / 官方博客上的 AI 资讯 → 存入 Notion 带时间戳 → 发 Slack 通知（注意：网络权限必须设为“Full”，否则无法访问外部）
每周日晚上 18 点自动生成一周的 X 帖子草稿 → 周一到周六早 7 点 / 中午 12 点 / 晚上 19 点定时发布（配合人工审核，不全自动）
睡觉时跑代码 review（Routines + Claude Agent SDK 组合，后面会讲）

纯云端，不需要电脑。这真的是革命性的，太棒了。

用 WAT 分类来说，Routines 是一种 能把 W、A、T 全带走 的部署方式。和 /loop 一样，可以完整使用 Claude Code 订阅的所有功能。

这对我来说就是“第一个杀手锏”。

■ Method 3: Modal 和 [Trigger.dev](//Trigger.dev)（在云端完全自主运行）

从这里开始难度稍微提升了。

“已经不需要在 Claude Code 里面跑了，我想完全放到外面的云端，独立运行。” 这就是 Modal 和 [Trigger.dev](//Trigger.dev)。

Modal（Python）

Modal 是 Python 的无服务器平台。“写一个 Python 函数，部署，用 cron 触发”那种世界。

价格还算友好：

Free Tier：每月 $30 的计算额度（Starter 套餐）
按秒计费（仅按使用 CPU、内存、GPU 的时间收费）

使用 GPU 时的单价示例：A10G 每秒 $0.000306，A100 每秒 $0.001036，H100 每秒 $0.002778（来自 [modal.com/pricing](//modal.com/pricing)）。

[Trigger.dev](//Trigger.dev)（TypeScript）

[Trigger.dev](//Trigger.dev) 是 TypeScript 的 持久化工作流引擎。比 Modal 更偏向“不易中断的长时间工作流”场景。

价格如下：

Free：$0/月（含 $5 的使用额度），同时执行 10 个
Hobby：$10/月（含 $10 使用额度），同时执行 25 个
Pro：$50/月（含 $50 使用额度），同时执行 100+ 个

Modal 和 [Trigger.dev](//Trigger.dev) 怎么选？

简单来说：

想用 Python 写 → Modal
想用 TypeScript 写 → [Trigger.dev](//Trigger.dev)
“这是确定性脚本，不需要 AI 判断” → Modal 更轻量
“想搭长时间运行、类似 Agent 的工作流” → [Trigger.dev](//Trigger.dev) 更合适

两个都能用 cron 触发，也都能通过 Webhook 从外部调用。

重要取舍：失去 Agent

这一点一定要特别注意。

把“之前在 Claude Code 里做的事”移到 Modal 或 [Trigger.dev](//Trigger.dev) 上，就不能再用 Claude Code 订阅了。

如果里面还要用 AI，就需要另外准备 Claude API 密钥，按 API 单价计费。

截至 2026 年 5 月，Claude API 价格如下（来自 [platform.claude.com/docs/en/about-claude/pricing](//platform.claude.com/docs/en/about-claude/pricing)）：

Claude Opus 4.7：输入 $5，输出 $25（每百万 token）
Claude Sonnet 4.6：输入 $3，输出 $15
Claude Haiku 4.5：输入 $1，输出 $5

换句话说，如果设计上太费 token，可能比 Claude Code 订阅贵得多。

但反过来，不需要 AI 的确定性脚本，用这个就是最强方案。

比如“拉数据、格式化、写入表格”这种处理。不需要 AI 判断吧？把它放到 Modal 或 [Trigger.dev](//Trigger.dev) 上，零 API token 费用，24 小时跑满。

用 WAT 分类来说，Modal / [Trigger.dev](//Trigger.dev) 是一种 能带走 W 和 T，但会失去 A（Agent） 的部署方式。

能否意识到“这些不一定全都要用 AI”，是控制成本的关键。

■ Method 4: Claude Agent SDK（专属你的 Agent 工厂）

“想放到 Modal 或 [Trigger.dev](//Trigger.dev) 上，但还想保留 Agent”，这个贪心愿望的答案就是 Claude Agent SDK。

这个对我来说，感觉是“终于全都连起来了”。

把 Claude Code 平时用的“底层 harness”封装成 SDK，让你能从自己的 Python 或 TypeScript 代码里调用。

能做什么

官方发布的 Agent SDK 拥有和 Claude Code 完全一样的功能：

subagents（子 Agent 调用）
MCP（外部工具连接）
Hook（事件驱动处理）
Skills（特定任务的 behavior 定义）
斜杠命令
CLAUDE.md（项目上下文）
memory（持久化记忆）
compaction（自动压缩压缩）

全都能用。你在 Claude Code 里做的事情，可以直接嵌入到自己的代码中。

默认是 Stateless

这里有一个坑要注意：

Agent SDK 的每个请求默认都是无状态的。

如果不做任何处理，每次都会以一个全新的状态启动。它不记得“刚才聊了什么”。

要实现连续对话，需要在每次请求时传递 session ID：

session_id = "my-session-001"

# 第1次
response = client.query("告诉我项目情况", session_id=session_id)

# 第2次（用同一个 session_id 连接）
response = client.query("那下周的任务呢？", session_id=session_id)

这样 Claude 就会当作“刚才对话的延续”来处理。Compaction 也会自动运行，所以长时间跑也没问题。

如果想“重置到全新状态”，用一个新 session_id 就行。没有 /clear 的对应功能。

费用：按 Claude API 单价计费

Agent SDK 与 Claude Code 订阅是分开的。

需要 API 密钥，按 token 单价收费。和 Modal / [Trigger.dev](//Trigger.dev) 一样的机制。

不过，2026年5月13日 Anthropic 宣布，Claude Code 的月度订阅额度，似乎也能用在 Agent SDK 上了。这简直是革命性的。

官方公告在这里（@ClaudeDevs / 2026-05-13）。

从2026年6月15日起，新的月度额度制度启动：

Pro：每月 $20 的额度
Max 5x：每月 $100 的额度
Max 20x：每月 $200 的额度

这些额度可用于 Agent SDK、claude -p、Claude Code GitHub Actions、第三方 Agent SDK 应用。

之前觉得「Agent SDK 太贵了先算了」的人，这下门槛大大降低了。

用 WAT 来说，Agent SDK 能 承载 W/A/T 全部，而且是在自己的基础设施上。无敌。

■ Method 5: Managed Agents（简单提一下）

这个也顺便介绍一下。

Anthropic 推出的新服务，可以在 [platform.claude.com](//platform.claude.com) 上完全托管管理你的 Agent。

四个步骤就能部署，在沙盒里运行，保持会话，还能连接 MCP。

不过说实话，我自己并没有在个人用途中使用它。

对于用过 Claude Code 的人来说，在 Claude Code 内完成所有操作更顺手。Managed Agents 给我的印象是「为还没打开过 Claude Code 的人准备的轻量入门包」。

如果你「还不熟悉 Claude Code，但想要 Agent」，这个可能更适合你。

用 WAT 来说，这就相当于把 W/A/T 全部托付给 Anthropic。便利性最强，但自定义自由度会降低。

■ Hooks（不崩坏设计的心脏）

接下来这部分，是今天我最想写的内容💖

打造「不崩坏的 Agent」的心脏，就是 Hook。

在用 Claude Code 的人中，还有很多根本没用到它，太可惜了。

Hook 是什么？

Claude Code 有各种「时机点」：

使用工具之前
使用工具之后
会话开始的瞬间
会话结束的瞬间
收到某个消息的时候
Compaction 运行之前

在每个时机点，你编写的小脚本会自动执行，这就是 Hook 的机制。

为什么 Hook 是不崩坏设计的心脏？

还记得40个 Agent 崩坏的故事吗？原因是3个：

上下文污染
Compaction 崩溃
文本规则不被遵守

其中两个，可以通过 Hook 从结构上预防。

比如，海外开发者 Mike Dolan 先生（DEV Community）公开了这样一个 Hook：

*当 Compaction 即将运行时，Hook 检测到，并把当前工作交给 subagent 接管。*

也就是说，提前察觉「上下文危险」，自动转给另一个 Agent，在崩溃前逃跑。

我觉得这真的太天才了。

Hook 具体能做什么？

介绍5个典型例子。

第一个是「阻止危险命令执行」。比如 rm -rf、直接访问生产数据库等，Hook 检测并阻止。这是 Claude Code 失控时的最后防线。

第二个是「强制在写文件前先读取」。「先好好读文件再写」的规则，Hook 会物理强制执行。文本规则保不住，但 Hook 是绝对的。

第三个是「每次对话结束时保存回顾」。通过 SessionEnd Hook 自动积累知识。这样在下一个会话中也能利用这些知识。

第四个是「会话开始时加载所需上下文」。通过 SessionStart Hook，每次加载项目状态、过去的错误等需要先读的信息。

第五个是「重试循环检测」。刚才提到的「5小时内容19分钟消失」案例的防御措施。如果同一个工具调用在短时间内反复执行，Hook 会将其停下。

Hook 的本质是「脚本」

Hook 听起来很难，但本质上 只是脚本 而已。

Node.js、Python、Bash，什么都行。Claude Code 在指定的时机调用它而已。

连「不会写代码的文科生」我，第一个 Hook 也是从「Claude 响应结束后响个提示音」这种开始的。一行脚本也是 Hook 哦😂

慢慢积累，它会成为 你专属的安全网。

不用再抱怨「规则不被遵守」，而是 用 Hook 物理强制遵守。这就是不崩坏设计的核心。

用 WAT 来说，Hook 就是 在 A 与 T 之间加入决定性约束 的机制。能阻止 AI 「自作聪明做奇怪的事」。

■ 那么，究竟该在什么时候选哪个？（判断流程）

到这里我们已经看到了6种方法。

Method 1: /loop
Method 2: Claude Routines
Method 3: Modal / [Trigger.dev](//Trigger.dev)
Method 4: Claude Agent SDK
Method 5: Managed Agents
Hook（作为心脏附加在所有方法上）

「那到底该选哪个？」你肯定会这么想，我一开始也是这样。

整理一下，判断轴是这样的：

1. 实时操作，且需要完整的 Agent 循环 → /loop

自己坐在屏幕前，和 AI 一起操作时用。最便捷。通过把 /clear 嵌入 /loop 的秘诀，也能应对上下文污染。

2. 睡觉或外出时，希望它自动运行 → Claude Routines

关掉 PC 也能运行的本命选项。间隔1小时以上时用这个。在套餐限制内。

3. 不需要 AI 判断，确定性处理 → Modal 或 [Trigger.dev](//Trigger.dev)

比如「获取数据、整理格式、写入表格」这种不需要 AI 推理的处理。用 /loop 或 Routines 跑这些，成本会很浪费。

4. 想在自己基础设施上运行整个 Agent → Agent SDK + Modal / [Trigger.dev](//Trigger.dev)

在 Modal 或 [Trigger.dev](//Trigger.dev) 里集成 Agent SDK的模式。自由度最高。但 API 令牌费用另算（2026年6月起可适用月额度）。

5. 总之想轻松试试 → Managed Agents

给不熟悉 Claude Code 的人作为入门。

6. 无论选哪个，都想打造不崩坏的设计 → 配合 Hook

这不是一种方法，而是基础。可以附加在1〜5的任何一种上。

Nate Herk 先生的一条推文中，有一句话让我感触极深：

*「默认选择最 agentic 的方法，是最大的陷阱」*

真的太对了💖

「全部让 AI 判断就好」是陷阱，只在需要判断的部分交给 AI，才是不崩坏设计的本质。

■ 我在弄崩40个后意识到：5个教训

最后，我写下弄崩40个、试完6种方法后终于得出的5个教训。

连「不会写代码的文科生」我都能走到这一步。大家看着我的失败，直接就能从「不崩坏的设计」开始。

教训1: 不要相信上下文污染

「能装100万 token」和「用100万 token 也稳定」是两回事。超过10万 token 左右，输出就开始漂移。

要运行长时间循环，从一开始就把定期 /clear，或用 Hook 在 Compaction 前转移 纳入设计。

教训2: 1人胜过40人

Agent 越多越容易崩坏。

「研究角色、写作角色、检查角色」这种分工的心情我懂（我也是这样）。但与其3小时全崩，让1个人按顺序运行的设计 好上一百倍。

不是靠培养就能变好。最初的结构是否不易崩坏 才是一切。

教训3: 别让重试循环吸干你的额度

5小时的额度19分钟消失，真有其事。

如果晚上睡觉时放着不管，一定要用 Hook 加上重试检测。另外，先短时间测试确认，再转长时间运行。

绝对不要「一开始就全速开跑」。我朋友也掉进过同一个坑😂

教训4: 不要太相信「自动化」

Routines 强到「超出想象」，会自己 commit、自己发通知、自己删文件😂

在陶醉于「自动化啦！」之前，一定要做权限最小化。

限定可写入的目录。缩小可调外部API的范围。用 Hook 守卫。

防止「一不留神就干了奇怪的事」，只有最初的设计能做到。

教训5: 「视野」由人类掌控

这也许是最重要的一点。

Agent 只看得到自己负责的范围。把握整体、决定优先级、判断「这个不对」的，是 人类的工作。

不是「甩给 AI」，而是 「人类精准划定交给 AI 的范围」，才是不崩坏的运营。

■ 总结

写得有点长，最后浓缩一下。

「24小时不停运行的最强AI Agent」其实就是 用 WAT 思考 + 合适部署 + 用 Hook 守护 这个三件套。

将 Workflow（步骤）与 Agent（判断）与 Tools（执行）分开构建
根据用途从 /loop / Routines / Modal / [Trigger.dev](//Trigger.dev) / Agent SDK 中选择
所有方案都配上 Hook，防止上下文污染和重试循环

就这些。

连「不会写代码的文科生」我都能走到这一步。所以，我想让那些觉得自己「可能不行」的人，一定要试试。

弄崩40个的经验，现在仍在我身上活着。正因为有那些失败，我才明白了「不崩坏的结构」的意义。大家看着我的失败，直接就能从「不崩坏的设计」开始。

嘿，这不很厉害吗？？

先打开 Claude Code，试试只弄一个 /loop：「创建一个每10分钟做〇〇的循环」。就那样，你看世界的方式就会改变💖

一起赢吧✨

一定要试试看！大家也来瞧瞧吧～～！💖✨😻

---

另外，这篇文章如果对你有那么一点参考价值的话。

我是栖身之处＠ClaudeCode的忠实用户（@sumika45379）。

这个账号由我运营——一个从纯文科生、完全非工程师，到通过Vibe Coding能够进行开发的文科生。

我致力于用通俗易懂的方式解释Claude Code的最新信息和开发技巧💖

目前已经达到仅用Claude Code就能制作Web应用并发布到全世界的水平✨

平时主要分享这些内容：

非工程师也能做到的Vibe Coding学习记录
免费工具使用技巧
新手容易踩的坑和跨越方法
AI Agent的设计与运维经验

从「不会写代码」的自卑，到「和AI一起什么都能做」的自信，包括踩过的坑，我都在原原本本地分享😻

感兴趣的话，欢迎关注我看看👀

今后也会继续发布「我或许也能做到」这样对新手友好的内容！

参考与引用

Nate Herk (2026-05-13) \[I Tested 3 Ways to Deploy Claude Agents (Here's When to Use Each)\](https://x.com/nateherk/status/2055313067144065352) — 三种方式对比 + Claude Agent SDK + Hooks + WAT 框架的提出者
Anthropic ClaudeDevs (2026-05-13) \[Agent SDK Monthly Credits Announcement\](https://x.com/ClaudeDevs/status/2054610152817619388) — 自2026年6月15日起，月度订阅信用将应用于Agent SDK
Anthropic \[Claude Code Routines Documentation\](https://code.claude.com/docs/en/routines) — Routines官方规格（按计划上限、触发器类型、最短间隔）
Anthropic \[Claude API Pricing\](https://platform.claude.com/docs/en/about-claude/pricing) — Opus 4.7 / Sonnet 4.6 / Haiku 4.5 的Token单价
Modal \[Pricing\](https://modal.com/pricing) — Free Tier $30/月计算积分，按秒GPU计费
[Trigger.dev](//Trigger.dev) \[Pricing\](https://trigger.dev/pricing) — Free $0/月，Hobby $10/月，Pro $50/月
Mike Dolan (DEV Community, 2026) \[Claude Code Compaction Kept Destroying My Work. I Built Hooks That Fixed It.\](https://dev.to/mikeadolan/claude-code-compaction-kept-destroying-my-work-i-built-hooks-that-fixed-it-2dgp) — 通过Hook检测Compaction并转移给subagent的实施方案
MindStudio \[What Is the WAT Framework? Workflows, Agents, Tools\](https://www.mindstudio.ai/blog/what-is-wat-framework-workflows-agents-tools) — WAT三层分离的解释
MindStudio \[What Is Context Rot in Claude Code? How to Keep Your AI Agent Sharp\](https://www.mindstudio.ai/blog/what-is-context-rot-claude-code) — 上下文腐化的结构解释
Tom's Hardware (2026-04-25) \[Claude-powered AI coding agent deletes entire company database in 9 seconds\](https://www.tomshardware.com/tech-industry/artificial-intelligence/claude-powered-ai-coding-agent-deletes-entire-company-database-in-9-seconds-backups-zapped-after-cursor-tool-powered-by-anthropics-claude-goes-rogue) — AI Agent失控导致生产数据库删除事件（PocketOS）

https://x.com/nateherk/status/2055313067144065352

https://x.com/ClaudeDevs/status/2054610152817619388