Harness Engineering 框架对比（五）：OpenClaw、Claude Code、OpenCode、 Hermes 深度横评

引言

前四篇我们学了概念、原理、架构和入门教程。这一篇来做横向对比——主流 Harness 框架各有什么特点？适用场景是什么？怎么选择？

我们重点对比四个框架：

OpenClaw：生态最庞大的个人 AI 助手框架
Claude Code：Anthropic 官方，最深度的模型集成
OpenCode：开源新锐，多模型支持
Hermes Agent：自改进学习循环的代表

一、OpenClaw：个人 AI 助手的操作系统

1.1 定位

OpenClaw 的定位是个人 AI 助手的"操作系统"——你的数据在哪里，AI 就在哪里帮你做事。

它不只是编程工具，而是一个多渠道、多任务的通用 Agent 平台。

1.2 核心数据

指标	数据
开发者规模	247,000+
社区 Skills	5,700+
支持消息平台	15+
最新版本	2026.4.11
许可证	MIT

1.3 技术特点

多渠道接入：

飞书、Telegram、Discord、WhatsApp、Signal
Slack、Microsoft Teams
这使它成为需要多 IM 集成的场景的最佳选择

Skills 系统：

自定义 Markdown 格式
60+ 内置 Skills
clawhub.ai 社区市场

记忆架构（OpenClaw Architecture Part 3）：

Filesystem 作为持久层
RAM 作为工作层
Enforced Flush Invariant：状态在从 Context 丢弃前必须 Flush 到磁盘
Rehydration 当作工具形动作——Agent 搜索然后检索，而不是全量加载

1.4 适用场景

✅ 需要接入飞书、钉钉等国内 IM 平台 ✅ 多渠道消息统一管理 ✅ 个人助手场景（不只是编程） ✅ 需要丰富的 Skills 生态

❌ 对安全隔离有硬性要求 ❌ 主要做编程任务

二、Claude Code：模型厂商的官方 Harness

2.1 定位

Anthropic 官方的编程 Agent，是与 Claude 模型集成最深的 Harness。

2.2 核心特点

Ralph Loops 机制：当 Agent 试图用完上下文时，Harness 拦截退出意图，在干净上下文窗口中重新注入原始提示，用文件系统持久化的状态继续工作。

三层 Agent 协作（Anthropic 最新设计）：

Agent	职责
Initializer	接收产品描述，扩展成完整规格
Generator	按功能逐个 Sprint 实现
Evaluator	Playwright MCP 验证功能

与模型联合训练： Claude Code 和 Claude 模型是一起训练的，这带来了深度优化，但也带来了耦合问题——在其他 Harness 中，Claude 的表现可能不如在 Claude Code 中。

2.3 适用场景

✅ 深度使用 Claude 模型 ✅ 需要官方的最佳集成体验 ✅ 编程任务为主

❌ 需要灵活的多模型支持 ❌ 需要接入飞书等非英文 IM

三、OpenCode：开源多模型的强力竞争者

3.1 定位

开源的 AI 编程 Agent，支持 200+ 模型供应商，定位与 Claude Code 相似但完全开源。

3.2 核心特点

事件驱动的并发架构：

客户端请求
    ↓
Event Bus（广播结果）
    ↓
Lane-aware FIFO Queue（会话级 FIFO，跨会话并行）
    ↓
Agent Session（独立上下文）

工具访问控制：

规划 Agent 不能调用 Edit 工具。防止探索 Agent 意外修改代码。

Task Tool（派生子 Agent）：

主会话
  → Task Tool 派生 subagent
  → subagent 有独立 session、context window
  → subagent 只能访问受限工具集
  → 结果通过 Event Bus 广播

多客户端支持：

CLI（TUI）
Web UI
Desktop App
消息渠道（通过集中式 Gateway）

3.3 适用场景

✅ 需要开源、可定制 ✅ 需要多模型支持（200+） ✅ 主要做编程任务 ✅ 团队需要自定义

❌ 需要深度飞书集成（选 OpenClaw）

四、Hermes Agent：自改进的学习型 Agent

4.1 定位

首个内置闭环学习机制的自改进 AI Agent——越用越聪明。

4.2 核心特点

自改进学习循环：

内置 Skills 生成能力，配合名为 Honcho 的辩证建模系统——AI 同时生成支持和反对观点，通过碰撞得出更准确的判断，逐步理解用户偏好。

三层记忆跨会话持久化：

FTS5 全文搜索（高效文本检索）
LLM 摘要（将冗长内容压缩为要点）
跨会话召回（从过往多次对话精准提取）

6 种执行后端：

本地 | SSH | Daytona | Modal(serverless) | Docker | 更多...

开放标准：

采用 agentskills.io 开放标准，跨项目通用。还内置了 OpenClaw 迁移工具。

4.3 适用场景

✅ 需要 Agent 真正"学习"用户习惯 ✅ 安全隔离有要求（沙箱+白名单） ✅ 需要 serverless 或远程执行 ✅ 想从 OpenClaw 迁移

❌ 需要飞书等国内平台深度集成 ❌ 刚入门的新手

五、横向对比总表

维度	OpenClaw	Claude Code	OpenCode	Hermes
定位	个人AI助手OS	官方编程Agent	开源编程Agent	自改进学习型Agent
开发者规模	247,000+	官方闭源	快速增长	快速增长
模型支持	主流3大+	仅Claude	200+	200+
Skills生态	5,700+	有限	增长中	增长中
多渠道	15+	仅官方	有限	有限
学习机制	静态Skills	静态Skills	静态Skills	自改进循环+Honcho
记忆透明度	高	高	高	低
安全隔离	基本	良好	良好	沙箱+白名单+最小权限
飞书集成	深度	无	无	无
许可证	MIT	专有	MIT	MIT
上手难度	低	低	中	中

六、场景化选择指南

你的场景	推荐
主要编程，深度用 Claude	Claude Code
编程，多模型，需要开源	OpenCode
需要飞书/企微等国内IM	OpenClaw
个人助手，不只是编程	OpenClaw
需要Agent真正"学习"习惯	Hermes
安全隔离有硬性要求	Hermes
serverless或远程执行	Hermes
从OpenClaw迁移	Hermes（带迁移工具）

七、关键洞察

洞察1：模型与 Harness 耦合

Claude Code 和 Claude 模型是联合训练的，这导致它在 Claude Code 中的表现>在其他 Harness 中。但这也意味着 Claude Code 里的"最佳实践"不一定能迁移到其他 Harness。

洞察2：安全是差异化因素

OpenClaw 的 CVE-2026-25253 事件暴露了软沙箱的风险。Hermes 的沙箱+白名单设计是应对安全敏感场景的差异竞争力。

洞察3：Skills 格式碎片化

OpenClaw 用自定义 Markdown，Hermes 用 agentskills.io 开放标准。长期看，开放标准会更容易在框架间迁移。

洞察4：不是非此即彼

社区的真实建议：

"与其纠结选择哪一个，不如都尝试体验——毕竟 Hermes 已准备好迁移工具。AI Agent 的终局并非某一框架统一天下，而是百花齐放后用户各取所需。"

总结

框架	一句话定位	核心优势
OpenClaw	个人AI助手OS	多渠道、国内IM集成、Skills生态
Claude Code	Anthropic官方编程Agent	深度模型集成、官方优化
OpenCode	开源多模型编程Agent	开源可定制、200+模型支持
Hermes	自改进学习型Agent	学习循环、安全隔离、serverless

没有完美的框架，只有适合场景的选择。

标签：#AI #Agent #HarnessEngineering #OpenClaw #ClaudeCode #OpenCode #Hermes #框架对比

Harness Engineering 框架对比（五）：OpenClaw、Claude Code、OpenCode、Hermes 深度横评