Hermes Agent vs OpenClaw:两个路线完全不同的 AI Agent,到底该选哪个
4月初花了两时间折腾了 Hermes Agent,顺手和手头一直在用的 OpenClaw 做了个系统对比。网上这两天的讨论已经很多了,但大多数要么是新闻通稿,要么是安装教程,真正从实际使用出发做横向对比的还不多见。这篇文章就把这两天的感受整理一下,供正在纠结选型的朋友参考。
这两个工具虽然看起来做的事情差不多——都是让 AI 在你的机器上干活——但背后的设计哲学完全不同,选哪个取决于你想要什么。
Hermes Agent 是研究型产品,核心解决的是”AI 能不能越用越聪明”这个问题。
OpenClaw 是工程型产品,核心解决的是”怎么把 AI 接进你现有的工作流”这个问题。
方向不同,没有绝对的好坏。
两个产品不是非此即彼的关系。实际上,已经有开发者开始探索让它们协同工作:OpenClaw 负责多渠道接入和快速执行,Hermes Agent 负责深度分析和长期规划。
OpenClaw 走的是网关模式。
它本质上是一个连接层,负责把你的 AI 和各种渠道(Telegram、Discord、Signal、WhatsApp)、各种工具(浏览器、文件系统、Shell 命令)接在一起。设计思路是”广度优先”:尽可能多地覆盖场景,让你能在一个入口管理所有事情。
Hermes Agent 走的是引擎模式。
它更像一个独立的工作单元,核心精力放在让这个单元本身变得越来越好用。设计思路是”深度优先”:不是接更多东西,而是把已有的事情做得更好、更聪明。
一个很直观的比喻:
这是两个工具差异最明显的地方。
OpenClaw 的记忆靠的是 Markdown 文件。每次对话结束后,AI 会把值得记住的内容写入当天的 memory 文件。你可以定期整理这些文件,形成长期记忆。
这个机制是有效的,但有一个前提:你得自己判断什么值得记,以及自己动手整理。
Hermes Agent 的记忆系统复杂得多,它实际上构建了四层体系:
第一层:常量提示记忆
存在 MEMORY.md 和 USER.md 里,分别记录环境事实和用户偏好,加起来限制在 1300 tokens 左右,防止上下文无限膨胀。
第二层:SQLite 会话历史
通过 FTS5 做全文检索,随时可以翻回去查之前的对话,不用担心被覆盖。
第三层:自动生成的技能文件
当 Agent 完成一个复杂任务(涉及 5 个以上工具调用),它会自动复盘这次任务,把有效的步骤提炼成一个可复用的 Skill 存到 skills 目录里。
第四层:Honcho 用户建模引擎
理解你是谁、喜欢怎么做、讨厌什么。
这个过程是自动的,不需要你提醒,也不需要你事后手动整理。Agent 在使用过程中会持续优化这些技能,效果不好的地方自己会改。
OpenClaw 的安全靠的是插件市场的审核机制和自己配置权限边界。它给了用户很大的自由度,但也意味着你得自己判断一个插件是否可信、自己把控操作的边界。
Hermes Agent 的安全是内置在框架层面的。它的命令执行有审批流程,敏感操作会弹窗让你确认,支持容器隔离,默认配备上下文扫描。这套机制不是可选插件,而是框架自带的安全基底。
两种思路各有利弊。OpenClaw 的开放策略灵活性更高,适合有能力自己做判断的用户。Hermes Agent 的内置安全降低了出错的概率,但也意味着你改动空间有限。
ClawHub 插件市场已经有相当数量的现成工具,覆盖浏览器自动化、GitHub 管理、日历邮件、本地文件等常见场景。如果你的需求比较标准,大概率能找到现成的解决方案,不需要自己写。
工具链主要面向命令行和 IDE 集成,没有那么丰富的现成插件。但是它的工具注册机制设计得很干净——新增工具只需要写一个文件加装饰器,不需要改动核心逻辑。
对于愿意动手优化的开发者来说,这个框架的扩展成本其实更低。
两者都支持多模型切换,不锁定单一供应商。
| 特性 | OpenClaw | Hermes Agent |
|---|---|---|
| 模型路由 | 网关层动态切换 | 命令行随时切换 |
| 支持商 | 多种 | OpenRouter(200+)、阿里云、DeepSeek、Kimi、智谱、MiniMax、Ollama |
| 本地模型 | 支持 | 支持 |
有一点值得注意的是,有用户反映 OpenClaw 在某些模型额度(比如 Claude)上出现了问题,而 Hermes Agent 目前还没有这方面的限制。
OpenClaw 负责多渠道接入和快速执行,Hermes Agent 负责深度分析和长期规划。两者在 Discord 或者其他平台上互补使用,各司其职。
这两天的实际体验中:
OpenClaw 最让我满意的地方是它的工具丰富度和渠道覆盖。装好浏览器自动化插件之后,几乎不需要配置就能让 AI 操作网页。这种”接上就能用”的体验确实成熟。
Hermes Agent 最让我惊讶的是它的成长速度。用了两天之后,它已经开始在 skills 目录里自动生成几个小技能,虽然还很粗糙,但能明显感觉到它在学习。整个过程不需要我做任何事情,就是正常用它干活,它自己就在记录和优化。
要说问题的话,OpenClaw 的上下文管理是个长期隐患。时间久了 memory 目录里的内容越来越多,AI 需要读取的历史也越来越长,推理成本会逐渐增加。
Hermes Agent 的问题则是生态不够丰富,有些想要的插件暂时找不到,需要自己写。
总的来说,这两条路线没有对错之分:
两个都值得亲自试试,实际用过才有发言权。