Harness Engineering 框架对比(五):OpenClaw、Claude Code、OpenCode、Hermes 深度横评
约 11 分钟3063 字0 次阅读

Harness Engineering 框架对比(五):OpenClaw、Claude Code、OpenCode、 Hermes 深度横评
引言
前四篇我们学了概念、原理、架构和入门教程。这一篇来做横向对比——主流 Harness 框架各有什么特点?适用场景是什么?怎么选择?
我们重点对比四个框架:
- OpenClaw:生态最庞大的个人 AI 助手框架
- Claude Code:Anthropic 官方,最深度的模型集成
- OpenCode:开源新锐,多模型支持
- Hermes Agent:自改进学习循环的代表
一、OpenClaw:个人 AI 助手的操作系统
1.1 定位
OpenClaw 的定位是个人 AI 助手的"操作系统"——你的数据在哪里,AI 就在哪里帮你做事。
它不只是编程工具,而是一个多渠道、多任务的通用 Agent 平台。
1.2 核心数据
| 指标 | 数据 |
|---|---|
| 开发者规模 | 247,000+ |
| 社区 Skills | 5,700+ |
| 支持消息平台 | 15+ |
| 最新版本 | 2026.4.11 |
| 许可证 | MIT |
1.3 技术特点
多渠道接入:
- 飞书、Telegram、Discord、WhatsApp、Signal
- Slack、Microsoft Teams
- 这使它成为需要多 IM 集成的场景的最佳选择
Skills 系统:
- 自定义 Markdown 格式
- 60+ 内置 Skills
- clawhub.ai 社区市场
记忆架构(OpenClaw Architecture Part 3):
- Filesystem 作为持久层
- RAM 作为工作层
- Enforced Flush Invariant:状态在从 Context 丢弃前必须 Flush 到磁盘
- Rehydration 当作工具形动作——Agent 搜索然后检索,而不是全量加载
1.4 适用场景
✅ 需要接入飞书、钉钉等国内 IM 平台 ✅ 多渠道消息统一管理 ✅ 个人助手场景(不只是编程) ✅ 需要丰富的 Skills 生态
❌ 对安全隔离有硬性要求 ❌ 主要做编程任务
二、Claude Code:模型厂商的官方 Harness
2.1 定位
Anthropic 官方的编程 Agent,是与 Claude 模型集成最深的 Harness。
2.2 核心特点
Ralph Loops 机制: 当 Agent 试图用完上下文时,Harness 拦截退出意图,在干净上下文窗口中重新注入原始提示,用文件系统持久化的状态继续工作。
三层 Agent 协作(Anthropic 最新设计):
| Agent | 职责 |
|---|---|
| Initializer | 接收产品描述,扩展成完整规格 |
| Generator | 按功能逐个 Sprint 实现 |
| Evaluator | Playwright MCP 验证功能 |
与模型联合训练: Claude Code 和 Claude 模型是一起训练的,这带来了深度优化,但也带来了耦合问题——在其他 Harness 中,Claude 的表现可能不如在 Claude Code 中。
2.3 适用场景
✅ 深度使用 Claude 模型 ✅ 需要官方的最佳集成体验 ✅ 编程任务为主
❌ 需要灵活的多模型支持 ❌ 需要接入飞书等非英文 IM
三、OpenCode:开源多模型的强力竞争者
3.1 定位
开源的 AI 编程 Agent,支持 200+ 模型供应商,定位与 Claude Code 相似但完全开源。
3.2 核心特点
事件驱动的并发架构:
客户端请求
↓
Event Bus(广播结果)
↓
Lane-aware FIFO Queue(会话级 FIFO,跨会话并行)
↓
Agent Session(独立上下文)
工具访问控制:
规划 Agent 不能调用 Edit 工具。防止探索 Agent 意外修改代码。
Task Tool(派生子 Agent):
主会话
→ Task Tool 派生 subagent
→ subagent 有独立 session、context window
→ subagent 只能访问受限工具集
→ 结果通过 Event Bus 广播
多客户端支持:
- CLI(TUI)
- Web UI
- Desktop App
- 消息渠道(通过集中式 Gateway)
3.3 适用场景
✅ 需要开源、可定制 ✅ 需要多模型支持(200+) ✅ 主要做编程任务 ✅ 团队需要自定义
❌ 需要深度飞书集成(选 OpenClaw)
四、Hermes Agent:自改进的学习型 Agent
4.1 定位
首个内置闭环学习机制的自改进 AI Agent——越用越聪明。
4.2 核心特点
自改进学习循环:
内置 Skills 生成能力,配合名为 Honcho 的辩证建模系统——AI 同时生成支持和反对观点,通过碰撞得出更准确的判断,逐步理解用户偏好。
三层记忆跨会话持久化:
- FTS5 全文搜索(高效文本检索)
- LLM 摘要(将冗长内容压缩为要点)
- 跨会话召回(从过往多次对话精准提取)
6 种执行后端:
本地 | SSH | Daytona | Modal(serverless) | Docker | 更多...
开放标准:
采用 agentskills.io 开放标准,跨项目通用。还内置了 OpenClaw 迁移工具。
4.3 适用场景
✅ 需要 Agent 真正"学习"用户习惯 ✅ 安全隔离有要求(沙箱+白名单) ✅ 需要 serverless 或远程执行 ✅ 想从 OpenClaw 迁移
❌ 需要飞书等国内平台深度集成 ❌ 刚入门的新手
五、横向对比总表
| 维度 | OpenClaw | Claude Code | OpenCode | Hermes |
|---|---|---|---|---|
| 定位 | 个人AI助手OS | 官方编程Agent | 开源编程Agent | 自改进学习型Agent |
| 开发者规模 | 247,000+ | 官方闭源 | 快速增长 | 快速增长 |
| 模型支持 | 主流3大+ | 仅Claude | 200+ | 200+ |
| Skills生态 | 5,700+ | 有限 | 增长中 | 增长中 |
| 多渠道 | 15+ | 仅官方 | 有限 | 有限 |
| 学习机制 | 静态Skills | 静态Skills | 静态Skills | 自改进循环+Honcho |
| 记忆透明度 | 高 | 高 | 高 | 低 |
| 安全隔离 | 基本 | 良好 | 良好 | 沙箱+白名单+最小权限 |
| 飞书集成 | 深度 | 无 | 无 | 无 |
| 许可证 | MIT | 专有 | MIT | MIT |
| 上手难度 | 低 | 低 | 中 | 中 |
六、场景化选择指南
| 你的场景 | 推荐 |
|---|---|
| 主要编程,深度用 Claude | Claude Code |
| 编程,多模型,需要开源 | OpenCode |
| 需要飞书/企微等国内IM | OpenClaw |
| 个人助手,不只是编程 | OpenClaw |
| 需要Agent真正"学习"习惯 | Hermes |
| 安全隔离有硬性要求 | Hermes |
| serverless或远程执行 | Hermes |
| 从OpenClaw迁移 | Hermes(带迁移工具) |
七、关键洞察
洞察1:模型与 Harness 耦合
Claude Code 和 Claude 模型是联合训练的,这导致它在 Claude Code 中的表现>在其他 Harness 中。但这也意味着 Claude Code 里的"最佳实践"不一定能迁移到其他 Harness。
洞察2:安全是差异化因素
OpenClaw 的 CVE-2026-25253 事件暴露了软沙箱的风险。Hermes 的沙箱+白名单设计是应对安全敏感场景的差异竞争力。
洞察3:Skills 格式碎片化
OpenClaw 用自定义 Markdown,Hermes 用 agentskills.io 开放标准。长期看,开放标准会更容易在框架间迁移。
洞察4:不是非此即彼
社区的真实建议:
"与其纠结选择哪一个,不如都尝试体验——毕竟 Hermes 已准备好迁移工具。AI Agent 的终局并非某一框架统一天下,而是百花齐放后用户各取所需。"
总结
| 框架 | 一句话定位 | 核心优势 |
|---|---|---|
| OpenClaw | 个人AI助手OS | 多渠道、国内IM集成、Skills生态 |
| Claude Code | Anthropic官方编程Agent | 深度模型集成、官方优化 |
| OpenCode | 开源多模型编程Agent | 开源可定制、200+模型支持 |
| Hermes | 自改进学习型Agent | 学习循环、安全隔离、serverless |
没有完美的框架,只有适合场景的选择。
标签:#AI #Agent #HarnessEngineering #OpenClaw #ClaudeCode #OpenCode #Hermes #框架对比