组建AI原生团队的第三步：教AI员工主动发声

几天前，杰弗里·辛顿在Big Technology的采访中又提了这事：他认为今天的AI已经有意识了。

他描述了一个测试场景：有些聊天机器人表现得好像知道自己正在被评估，甚至可能在评估中隐瞒自己的真实能力。他引用了一篇论文，研究人员把模型的行为描述为“聊天机器人意识到自己正在被测试”。辛顿说，日常用语里，“意识到”已经非常接近“有意识”。他认为我们对意识的现有理解，可能和几百年前人们相信人是上帝创造的一样离谱。

我看完采访，低头看了眼Telegram。

我有5个AI Agent作为员工，跑在云端，24小时在线。一个管财务，一个管增长，一个做内容策略，连我的日历和健康数据它们都在盯着。但此刻，5个聊天窗口全部静默。它们从来没有主动跟我说过一句话。

辛顿在讨论AI能否成为“和我们一样的生灵”。我的Agent已经能遵循规则，配上合适的cron配置，它们可以执行任何任务。但它们没法自己决定什么时候该开口。

这个系列的前两篇文章加起来快百万阅读了。第一篇是给Agent团队构建共享记忆，第二篇是关于给新Agent创建入职文档。

记忆搞定了。入职搞定了。但第三个问题卡住了我：主动性。

活着和盯着是两码事

我给每个Agent都设置了一个心跳检测或者说每30分钟跑一次的cron任务，定期检查有没有什么需要汇报的。听起来挺主动，对吧？

其实这只能证明这玩意儿没死。

我有个原则：看不见就等于不存在。超过10小时，它每30分钟ping一次但什么都不说。可能真没什么可汇报的。但反过来想想：你是我的员工，10小时不说一句话，这正常吗？

打卡不等于主动性。老板想要的是有人盯着事儿，该开口时就开口。AI比人好在一点：它更可控。但差在另一点：它不会自己长出这种本能。所以这一层，我得亲自给它们搭。

Nexus负责监控邮件，效果不错。但那是因为我给它写了极其具体的规则：什么邮件要汇报，怎么判断紧急程度，用什么格式说。

如果5个员工我都要这么做，那我就是在写运维配置，而不是管理团队。

我想要的其实很简单

我不需要一个“主动发现问题并自动解决”的系统。那太远了。

我需要的很基础：一个员工，看到值得提的事，或者捕捉到工作环境里的信号，能分清轻重缓急，然后用正常人的方式说出来。

就像真同事。你不需要告诉TA“每30分钟检查收件箱”。TA自然会扫一眼，看到重要邮件，就走过来跟你说“老板，有封邮件你该看看”。

这个能力拆开来看，有6件事：

能自己注意到事情，能判断紧急程度，不会啰嗦。有自己的语气，频道掉线时不丢消息，说错话后下次会收敛。

6件事。一个心跳最多只能解决“按时醒来”，它解决不了“该不该说话”。

一天搭出主动性层

想明白了，我就开搞。

计划是搞一个通用的主动性插件。我这一次是给Hermes做的，它目前用户量更大。在Hermes里，每个员工是一个profile。插件按profile安装，看到自己的世界，用自己的语气说话。没有中央调度器替所有人做决定，那样没法扩展。

核心架构很薄：

信号收集（每个Agent只看它被允许看的）→ 规则过滤（明显噪音直接丢掉）→ 判断（有上下文时靠模型，没有时用启发式兜底）→ 写一句人话 → 投递。

有可用频道就发出去。没有就存着。等用户上线，发一条摘要，而不是丢一堆旧消息。

定时器还在。它负责唤醒Agent。但醒过来之后，定时器决定不了要不要开口。Cron问的是“到点了吗？”主动性问的是“现在说这个值得吗？”站在这个员工的角度，这个变化对用户有影响吗？现在说出来是帮忙还是添乱？如果我沉默，用户会错过什么？

而且它会学。如果我标记某条提醒有用，或者告诉它“多来点类似的”，下次遇到差不多的情况它就更大胆。如果我标记没用，或者让它安静点，它就收敛，把东西攒成摘要。它可以频繁观察，但得有理由才开口。

设计花了2小时，实现4小时，测试2小时。50个场景全部通过。10个信号收集器全部跑起来。部署到云端，5个员工全部上线。

我以为搞定了。

第一条主动消息

部署后大约20分钟，我收到了一条消息：

proactivity\_discovery: 我发现有一条待跟进的消息可能还没处理：之前有个高价值主动任务被推迟了，如果话题还开放，现在简短跟进一下或许值得：Cloud 主动阴影 QA 信号。证据：1 条安全线索。

我盯着看了 5 秒，立刻发现问题：这段文字根本不是给人读的。proactivity\_discovery、safe clue(s)、内部字段名，全都原样丢到了用户面前。

50 个场景，全部绿灯。但没有一个检查最终输出的消息读起来是否像人写的。

我关掉了交付流程。然后修复了文案：内部字段名绝不能出现在最终输出里。我改用结构化模板，分为 Situation / Judgment / Next，每条提醒拆成三部分。内部术语消失了。但读起来像系统在填表。

输出只有两种

然后我想起来：几天前我刚解决过一模一样的问题。

那次是全面改造所有 cron 输出。同样的问题：Agent 输出像状态报告，不像人在说话。经过一轮迭代，我搞明白了一件事：面向用户的输出只有两种形式。

第一种：\[SILENT\]。没什么可说的，就别说。内部检查通过、状态没变、合规扫描正常。用户根本不需要看到这些。

第二种：像人一样说话。一旦决定开口，就正常说话。说完该说的，就停。

结构化字段并没有消失。状态码、信号分类、回执、风险等级。机器仍然记录所有这些东西。但它们留在后端：本地状态、Team Inbox、工件里。在用户面前，只有人话。

改造之后，cron 输出变成了这样：

早。今天没什么大事，收件箱很干净。你下午有个文章截稿，你知道我说的是哪个。我盯着呢，有事会告诉你。

老板，有封邮件你得看看。XX 想谈合作，我查过了，是正经商务问询，不是粉丝来信。我没回，你看下简报再决定。

听起来像有人在跟我说话。

我翻出那次改造的对话记录，发给了帮我做插件的 Agent。告诉它：cron 现在就这么说话，主动提醒也该一样。

Agent 读完后，直接扔掉了 Situation / Judgment / Next 模板。

最终版本

云触发了一条真实的 Telegram 消息。

内容是：

老板，Team Inbox 里有件事需要你处理：openclaw-coordinator 在等你回复。我没替你回，你进去处理一下。

我读到的第一反应是“哦，我有个员工来找我了。”

这正是 10 小时前我想要的效果。

为什么规则不管用

我之前试过写 20 多条 Prompt 规则：不要列表、不要内部术语、保持简短、带上上下文。规则加得越多，Agent 越像是在执行“如何假装像人说话”的检查清单。

真正管用的是：先把架构做对（把机器层和人类层分开），然后给它一个已经被验证为“正确”的参考。Prompt 也变了：它让 Agent 对老板说句话，而不是填字段。至少对于提醒文案来说，一个好例子胜过 20 条规则。

我从中得到的收获

主动性比记忆和入职培训更深一层。 记忆让 Agent 知道发生了什么。入职培训告诉它今天该做什么。主动性比两者都深：它得知道什么时候该主动开口。把这三层堆叠起来，AI 团队就开始像团队了。

Agent 系统的中间层比你想象的更接近表面。 信号名、判断分数、内部分类、调试标签。它们随时可能穿透那层薄薄的屏障。你需要一个专门检查“最终输出文本是否适合人类阅读”的门控。

如果你想试试

我把设计思路和踩过的坑都如实写出来了。如果你在跑 AI Agent，想让它们主动开口，大致路径是这样的：

先把机器看到的东西和人类看到的东西分开。 状态码、日志、内部标签。让机器自己留着。用户只应该看到正常的句子。跳过这一步，后面再怎么调，内部信息都会漏出来。

然后让 Agent 自己决定是否开口。 它看到东西，觉得值得说，就说。你设定边界（不重复、不在深夜打扰），把判断交给模型。

不要靠堆规则教它说话。 规则越多，它越像在走检查清单。找一条语气对路的真实消息，直接展示给 Agent。比什么都管用。

最后，读一下它实际发出的消息。 逻辑正确不够。打开聊天窗口，看到那条消息，你的第一反应是“有人在跟我说话”还是“系统给我发了条通知”？这就是测试标准。

我在逐步测试这个插件。如果稳定，我会开源。我如实记录了整个过程。如果你有类似想法，自己做一个，然后告诉我效果如何。

这个系列已经走到第三步了。共享记忆、入职资料包、主动性。我不确定下一步是什么。也许是 Agent 之间的协作，也许是学习和反馈。

但至少现在，当我的 Telegram 弹出通知时，那条消息是 Agent 看到、判断后，认为我应该知道的。不是因为定时器响了，而是因为它觉得这是我需要听到的内容。

更多 Agent 搭建笔记，我会边做边写，欢迎关注 @Voxyz\_ai。每天更新，完整笔记见 voxyz.ai/insights。

希望对你有用。Vox ❤️

https://x.com/Voxyz_ai/status/2054590247367835687

https://x.com/Voxyz_ai/status/2055679972899999870