几天前,我在 Mac mini 上安装了 @NousResearch 的 Hermes Agent,和原本已运行六周的 @openclaw(Oz)Bot 一起跑。
两个 AI Agent,同一台机器,16GB 内存,同一个 Telegram 聊天频道。以下是至今的经历。
~/ 想法:
如果另一个架构不同的 Agent 能找到第一个遗漏的东西呢?
搭建花了大概一天。克隆仓库、创建 Python 3.11 的 venv、配好 GLM-5 作为主模型、Kimi K2.5 作为备选。写了 SOUL.md——Hermes 的系统提示词,定义它的个性、工具和文件路径。配了 11 个 Telegram 工具集:网页、终端、文件、技能、记忆、待办、会话搜索、代码执行、委托和定时任务。用 launchd 让它开机自启。
然后搭了研究管线。Hermes 在 Oz 研究同一主题一小时后,自动执行自主研究。两者都往各自的研究文件里写结论,并在 Telegram 上推送要点总结。我每晚对比它们的输出。
在 8 个相同查询上做了背靠背测试。Hermes 得了 34/40,Oz 得了 36.5/40。
- Hermes 速度明显更快(5 秒 vs 60 秒),在结构化数据获取、实时价格、协议数据、CoinGecko 拉取方面表现更好。
- Oz 在累积上下文、模仿我的写作风格、以及将新发现与过往研究关联方面更强。
早期结果很有希望。在自主研究的头 48 小时里,Hermes 就报出了今天发生的 Meta/Moltbook 事件。
~/ 关于 bug:
大部分出在我这边,小部分在 Hermes 那边。
- 网页搜索工具需要一个我没配好的 Firecrawl API Key,所以我改成了 DuckDuckGo CLI。
- API 终点和模型命名约定跟我想的不一样,试错了几次才搞定。
- 这个提供商不支持 reasoning_effort 参数。
- 会话超过 30 轮后会膨胀,因为推理 token 会累积,所以我写了自动压缩、每日重置和周清理脚本。
- 最妙的一个:Hermes 找不到自己的定时研究文件,因为系统提示词里没指定那些文件路径,它得出结论说自己找到的结果是幻觉,而不是承认不知道路径。
每个 bug 都能修,每个 bug 也教了我一些 Agent 基础设施到底怎么运转的道理。
~/ 为什么我认为 Hermes 长期有可能超越 OpenClaw:
它原生运行,没有 Docker 开销、没有沙盒启动、直接访问文件系统。它自带原生工具模式(终端、文件操作、代码执行),而不需要所有东西都通过一个网关。它的定时任务系统,修正之后,简洁又轻量。
Hermes 才运行几天,只有几天的记忆。Oz 有六周。如果 Hermes 的知识像 Oz 那样累积,再加上速度优势,它可能会成为主力 Agent。
目前我同时跑两个。同一主题、不同时间,每日对比输出。几周后我会回来报告:哪个产生的可执行研究更多,哪个更早抓到突发新闻,以及 Hermes 的速度优势是否胜过 Oz 的深度。
一台 Mac mini 上两个 Agent,基础设施 $0/月。实验仍在继续。