开发工程 / 工作流案例

组建AI原生团队的第三步:教AI员工主动发声

初级到中级 首次搭建后持续迭代 @Voxyz_ai
结果

8 小时做完 proactivity plugin,50 个场景全过,5 个云端 agents 开始主动汇报关键事项

适合谁

运行长期在线 agents / 想把 cron 轮询升级成有判断的主动提醒的人

几天前,杰弗里·辛顿在Big Technology的采访中又提了这事:他认为今天的AI已经有意识了。

他描述了一个测试场景:有些聊天机器人表现得好像知道自己正在被评估,甚至可能在评估中隐瞒自己的真实能力。他引用了一篇论文,研究人员把模型的行为描述为“聊天机器人意识到自己正在被测试”。辛顿说,日常用语里,“意识到”已经非常接近“有意识”。他认为我们对意识的现有理解,可能和几百年前人们相信人是上帝创造的一样离谱。

我看完采访,低头看了眼Telegram。

我有5个AI Agent作为员工,跑在云端,24小时在线。一个管财务,一个管增长,一个做内容策略,连我的日历和健康数据它们都在盯着。但此刻,5个聊天窗口全部静默。它们从来没有主动跟我说过一句话。

Image
Image

辛顿在讨论AI能否成为“和我们一样的生灵”。我的Agent已经能遵循规则,配上合适的cron配置,它们可以执行任何任务。但它们没法自己决定什么时候该开口。

这个系列的前两篇文章加起来快百万阅读了。第一篇是给Agent团队构建共享记忆,第二篇是关于给新Agent创建入职文档

记忆搞定了。入职搞定了。但第三个问题卡住了我:主动性。

活着和盯着是两码事

我给每个Agent都设置了一个心跳检测或者说每30分钟跑一次的cron任务,定期检查有没有什么需要汇报的。听起来挺主动,对吧?

其实这只能证明这玩意儿没死。

Image
Image

我有个原则:看不见就等于不存在。超过10小时,它每30分钟ping一次但什么都不说。可能真没什么可汇报的。但反过来想想:你是我的员工,10小时不说一句话,这正常吗?

打卡不等于主动性。老板想要的是有人盯着事儿,该开口时就开口。AI比人好在一点:它更可控。但差在另一点:它不会自己长出这种本能。所以这一层,我得亲自给它们搭。

Nexus负责监控邮件,效果不错。但那是因为我给它写了极其具体的规则:什么邮件要汇报,怎么判断紧急程度,用什么格式说。

如果5个员工我都要这么做,那我就是在写运维配置,而不是管理团队。

我想要的其实很简单

我不需要一个“主动发现问题并自动解决”的系统。那太远了。

我需要的很基础:一个员工,看到值得提的事,或者捕捉到工作环境里的信号,能分清轻重缓急,然后用正常人的方式说出来。

就像真同事。你不需要告诉TA“每30分钟检查收件箱”。TA自然会扫一眼,看到重要邮件,就走过来跟你说“老板,有封邮件你该看看”。

Image
Image

这个能力拆开来看,有6件事:

能自己注意到事情,能判断紧急程度,不会啰嗦。有自己的语气,频道掉线时不丢消息,说错话后下次会收敛。

6件事。一个心跳最多只能解决“按时醒来”,它解决不了“该不该说话”。

一天搭出主动性层

想明白了,我就开搞。

计划是搞一个通用的主动性插件。我这一次是给Hermes做的,它目前用户量更大。在Hermes里,每个员工是一个profile。插件按profile安装,看到自己的世界,用自己的语气说话。没有中央调度器替所有人做决定,那样没法扩展。

核心架构很薄:

信号收集(每个Agent只看它被允许看的)→ 规则过滤(明显噪音直接丢掉)→ 判断(有上下文时靠模型,没有时用启发式兜底)→ 写一句人话 → 投递。

Image
Image

有可用频道就发出去。没有就存着。等用户上线,发一条摘要,而不是丢一堆旧消息。

定时器还在。它负责唤醒Agent。但醒过来之后,定时器决定不了要不要开口。Cron问的是“到点了吗?”主动性问的是“现在说这个值得吗?”站在这个员工的角度,这个变化对用户有影响吗?现在说出来是帮忙还是添乱?如果我沉默,用户会错过什么?

而且它会学。如果我标记某条提醒有用,或者告诉它“多来点类似的”,下次遇到差不多的情况它就更大胆。如果我标记没用,或者让它安静点,它就收敛,把东西攒成摘要。它可以频繁观察,但得有理由才开口。

设计花了2小时,实现4小时,测试2小时。50个场景全部通过。10个信号收集器全部跑起来。部署到云端,5个员工全部上线。

我以为搞定了。

第一条主动消息

部署后大约20分钟,我收到了一条消息:

proactivity\_discovery: 我发现有一条待跟进的消息可能还没处理:之前有个高价值主动任务被推迟了,如果话题还开放,现在简短跟进一下或许值得:Cloud 主动阴影 QA 信号。证据:1 条安全线索。

我盯着看了 5 秒,立刻发现问题:这段文字根本不是给人读的。proactivity\_discovery、safe clue(s)、内部字段名,全都原样丢到了用户面前。

Image
Image

50 个场景,全部绿灯。但没有一个检查最终输出的消息读起来是否像人写的。

我关掉了交付流程。然后修复了文案:内部字段名绝不能出现在最终输出里。我改用结构化模板,分为 Situation / Judgment / Next,每条提醒拆成三部分。内部术语消失了。但读起来像系统在填表。

输出只有两种

然后我想起来:几天前我刚解决过一模一样的问题。

那次是全面改造所有 cron 输出。同样的问题:Agent 输出像状态报告,不像人在说话。经过一轮迭代,我搞明白了一件事:面向用户的输出只有两种形式。

第一种:\[SILENT\]。没什么可说的,就别说。内部检查通过、状态没变、合规扫描正常。用户根本不需要看到这些。

第二种:像人一样说话。一旦决定开口,就正常说话。说完该说的,就停。

结构化字段并没有消失。状态码、信号分类、回执、风险等级。机器仍然记录所有这些东西。但它们留在后端:本地状态、Team Inbox、工件里。在用户面前,只有人话。

Image
Image

改造之后,cron 输出变成了这样:

早。今天没什么大事,收件箱很干净。你下午有个文章截稿,你知道我说的是哪个。我盯着呢,有事会告诉你。

老板,有封邮件你得看看。XX 想谈合作,我查过了,是正经商务问询,不是粉丝来信。我没回,你看下简报再决定。

听起来像有人在跟我说话。

我翻出那次改造的对话记录,发给了帮我做插件的 Agent。告诉它:cron 现在就这么说话,主动提醒也该一样。

Agent 读完后,直接扔掉了 Situation / Judgment / Next 模板。

最终版本

云触发了一条真实的 Telegram 消息。

内容是:

老板,Team Inbox 里有件事需要你处理:openclaw-coordinator 在等你回复。我没替你回,你进去处理一下。

我读到的第一反应是“哦,我有个员工来找我了。”

这正是 10 小时前我想要的效果。

为什么规则不管用

我之前试过写 20 多条 Prompt 规则:不要列表、不要内部术语、保持简短、带上上下文。规则加得越多,Agent 越像是在执行“如何假装像人说话”的检查清单。

Image
Image

真正管用的是:先把架构做对(把机器层和人类层分开),然后给它一个已经被验证为“正确”的参考。Prompt 也变了:它让 Agent 对老板说句话,而不是填字段。至少对于提醒文案来说,一个好例子胜过 20 条规则。

我从中得到的收获

主动性比记忆和入职培训更深一层。 记忆让 Agent 知道发生了什么。入职培训告诉它今天该做什么。主动性比两者都深:它得知道什么时候该主动开口。把这三层堆叠起来,AI 团队就开始像团队了。

Image
Image

Agent 系统的中间层比你想象的更接近表面。 信号名、判断分数、内部分类、调试标签。它们随时可能穿透那层薄薄的屏障。你需要一个专门检查“最终输出文本是否适合人类阅读”的门控。

如果你想试试

我把设计思路和踩过的坑都如实写出来了。如果你在跑 AI Agent,想让它们主动开口,大致路径是这样的:

先把机器看到的东西和人类看到的东西分开。 状态码、日志、内部标签。让机器自己留着。用户只应该看到正常的句子。跳过这一步,后面再怎么调,内部信息都会漏出来。

然后让 Agent 自己决定是否开口。 它看到东西,觉得值得说,就说。你设定边界(不重复、不在深夜打扰),把判断交给模型。

不要靠堆规则教它说话。 规则越多,它越像在走检查清单。找一条语气对路的真实消息,直接展示给 Agent。比什么都管用。

最后,读一下它实际发出的消息。 逻辑正确不够。打开聊天窗口,看到那条消息,你的第一反应是“有人在跟我说话”还是“系统给我发了条通知”?这就是测试标准。

Image
Image

我在逐步测试这个插件。如果稳定,我会开源。我如实记录了整个过程。如果你有类似想法,自己做一个,然后告诉我效果如何。

这个系列已经走到第三步了。共享记忆入职资料包、主动性。我不确定下一步是什么。也许是 Agent 之间的协作,也许是学习和反馈。

但至少现在,当我的 Telegram 弹出通知时,那条消息是 Agent 看到、判断后,认为我应该知道的。不是因为定时器响了,而是因为它觉得这是我需要听到的内容。

更多 Agent 搭建笔记,我会边做边写,欢迎关注 @Voxyz\_ai。每天更新,完整笔记见 voxyz.ai/insights

希望对你有用。Vox ❤️

https://x.com/Voxyz_ai/status/2054590247367835687

https://x.com/Voxyz_ai/status/2055679972899999870

相关案例