知识学习 / 工作流案例

几天前,我在 Mac mini 上装了 Hermes agent,和我现有的 OpenClaw bot 一起用。

初级到中级 首次搭建后持续迭代 @witcheer
结果

8 组 query 对跑:Hermes 34/40,OpenClaw 36.5/40;5 秒级研究回路 vs 60 秒 | 双 agent 自治研究对比 workflow

适合谁

想把多个 agent 并行部署、做同题研究对比或长期自治情报收集的 builder / 研究型用户

几天前,我在 Mac mini 上安装了 @NousResearch 的 Hermes Agent,和原本已运行六周的 @openclaw(Oz)Bot 一起跑。

两个 AI Agent,同一台机器,16GB 内存,同一个 Telegram 聊天频道。以下是至今的经历。

~/ 想法:

如果另一个架构不同的 Agent 能找到第一个遗漏的东西呢?

搭建花了大概一天。克隆仓库、创建 Python 3.11 的 venv、配好 GLM-5 作为主模型、Kimi K2.5 作为备选。写了 SOUL.md——Hermes 的系统提示词,定义它的个性、工具和文件路径。配了 11 个 Telegram 工具集:网页、终端、文件、技能、记忆、待办、会话搜索、代码执行、委托和定时任务。用 launchd 让它开机自启。

然后搭了研究管线。Hermes 在 Oz 研究同一主题一小时后,自动执行自主研究。两者都往各自的研究文件里写结论,并在 Telegram 上推送要点总结。我每晚对比它们的输出。

在 8 个相同查询上做了背靠背测试。Hermes 得了 34/40,Oz 得了 36.5/40。

  • Hermes 速度明显更快(5 秒 vs 60 秒),在结构化数据获取、实时价格、协议数据、CoinGecko 拉取方面表现更好。
  • Oz 在累积上下文、模仿我的写作风格、以及将新发现与过往研究关联方面更强。

早期结果很有希望。在自主研究的头 48 小时里,Hermes 就报出了今天发生的 Meta/Moltbook 事件。

~/ 关于 bug:

大部分出在我这边,小部分在 Hermes 那边。

  • 网页搜索工具需要一个我没配好的 Firecrawl API Key,所以我改成了 DuckDuckGo CLI。
  • API 终点和模型命名约定跟我想的不一样,试错了几次才搞定。
  • 这个提供商不支持 reasoning_effort 参数。
  • 会话超过 30 轮后会膨胀,因为推理 token 会累积,所以我写了自动压缩、每日重置和周清理脚本。
  • 最妙的一个:Hermes 找不到自己的定时研究文件,因为系统提示词里没指定那些文件路径,它得出结论说自己找到的结果是幻觉,而不是承认不知道路径。

每个 bug 都能修,每个 bug 也教了我一些 Agent 基础设施到底怎么运转的道理。

~/ 为什么我认为 Hermes 长期有可能超越 OpenClaw:

它原生运行,没有 Docker 开销、没有沙盒启动、直接访问文件系统。它自带原生工具模式(终端、文件操作、代码执行),而不需要所有东西都通过一个网关。它的定时任务系统,修正之后,简洁又轻量。

Hermes 才运行几天,只有几天的记忆。Oz 有六周。如果 Hermes 的知识像 Oz 那样累积,再加上速度优势,它可能会成为主力 Agent。

目前我同时跑两个。同一主题、不同时间,每日对比输出。几周后我会回来报告:哪个产生的可执行研究更多,哪个更早抓到突发新闻,以及 Hermes 的速度优势是否胜过 Oz 的深度。

一台 Mac mini 上两个 Agent,基础设施 $0/月。实验仍在继续。

相关案例