📚 本系列目录：《Hermes Agent》当前第 2/9 篇 · 上一篇：Hermes Agent vs OpenClaw：2026年最热门个人AI Agent框架深度对比 · 下一篇：5 分钟快速上手 Hermes Agent

📚 系列导航

《Hermes Agent》共 9 篇，本篇是第 2 篇。

← 上一篇：Hermes Agent vs OpenClaw：2026年最热门个人AI Agent框架深度对比

下一篇：5 分钟快速上手 Hermes Agent →

认识 Hermes Agent（一）：会成长的开源 AI 智能体

它不是聊天机器人，不是代码补全工具，而是一个住在你机器上、每天都在变聪明的智能体。

2026 年 2 月，Nous Research 发布了 Hermes Agent——一个具备持久记忆和自动技能创建能力的开源 AI 智能体。短短三个月，GitHub Star 数突破 6 万，成为 AI 领域最受关注的开源项目之一，在 GitHub Trending 多次霸榜。

这篇文章带你全面认识这个"会成长"的 AI 智能体——它是什么、为什么存在、能做什么、以及为什么值得你尝试。

一、Hermes Agent 到底是什么？

1.1 定义

Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体框架。

它的核心定位非常独特：

部署在你的服务器上，连接你的消息账号，它就成为你的持久个人智能体——学习你的项目、自动构建技能、随时随地触达你。

一句话描述：

Hermes Agent = 持久记忆 + 自动技能创建 + 多平台接入 + 研究友好 的开源 AI 智能体

1.2 与传统 AI 工具的本质区别

类型	代表产品	核心特点	数据归属	记忆能力
聊天机器人	ChatGPT、Claude.ai	云端托管，每次对话独立	数据存储在服务商	❌ 无
代码补全工具	GitHub Copilot、Cursor	绑定 IDE，上下文有限	需联网，部分数据上传	❌ 有限
终端助手	Claude Code	本地运行，会话内记忆	本地存储	⚠️ 会话级
Hermes Agent	⭐	自托管，持久记忆，越用越聪明	100% 本地存储	✅ 持久

关键差异：

传统 AI 助手：
  第一次使用 → 你解释项目背景 → 完成任务 → 结束
  第二次使用 → 你再次解释项目背景 → 完成任务 → 结束
  （每次都要重新开始，效率低）

Hermes Agent：
  第一次使用 → 你解释项目背景 → 完成任务 → 学会
  第二次使用 → 记得项目背景 → 完成任务 → 更熟练
  第三次使用 → 已经了解你的偏好 → 主动建议
  （越用越聪明，效率递增）

1.3 核心价值主张

Hermes Agent 不是：

❌ 绑定在 IDE 上的代码补全工具
❌ 套壳 OpenAI/Claude 的简单聊天机器人
❌ "用完即忘"的会话式 AI
❌ 需要每次重新解释上下文的工具

Hermes Agent 是：

✅ 住在你服务器上的持久智能体
✅ 记住学到的一切，越用越聪明
✅ 自动积累可复用技能
✅ 多平台无缝接入
✅ 研究友好（批量轨迹 + RL 训练）

二、Nous Research：开源基因的传承

2.1 团队背景

提到 Hermes Agent，必须先了解背后的开发团队——Nous Research。

Nous Research 是开源 AI 社区中声誉极高的研究机构，成立于 2023 年，专注于大语言模型的研究和应用。他们的核心理念是：开源可控的 AI。

团队历史：

2023 年：发布 Hermes 系列开源模型（Hermes-2, Hermes-3）
2024 年：发布 Hermes-2.5，提升工具调用能力
2025 年：推出 Atropos 强化学习框架
2026 年：发布 Hermes Agent，聚焦智能体领域

核心团队成员：

开发者论坛上活跃的社区互动
主要贡献者来自 AI 研究和系统工程背景

2.2 开源基因的体现

四大开源原则：

原则	实践
MIT 许可证	完全开源，每行代码都可审计，无隐藏条款
零遥测	无追踪，无数据收集，无使用分析
开放标准	agentskills.io 技能格式可移植，随处分享
社区驱动	Discord 活跃，Skills Hub 持续扩展

与其他闭源 AI 的对比：

闭源 AI (ChatGPT/Claude):
  - 数据会上传云端
  - 使用行为被追踪
  - 功能更新不透明
  - 可能被封禁或限流

Hermes Agent:
  - 数据 100% 本地存储
  - 零遥测，完全隐私
  - 开源可审计
  - 完全自主控制

三、核心特性全面解析

3.1 特性一览

┌─────────────────────────────────────────────────────────────────────────┐
│                   Hermes Agent 核心架构                   │
├─────────────────────────────────────────────────────────────────────────┤
│                                                         │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐   │
│  │  持久记忆   │  │ 自动技能    │  │ 多平台网关  │   │
│  │ 三层架构    │  │ 创建系统    │  │  6+ 平台  │   │
│  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘   │
│         │                │                │           │
│         ▼                ▼                ▼           │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐   │
│  │ 定时任务   │  │ 子智能体   │  │  浏览器    │   │
│  │ Cron 调度  │  │ 并行执行   │  │ 自动化    │   │
│  └─────────────┘  └─────────────┘  └─────────────┘   │
│                                                         │
│  基础：40+ 内置技能 / 7 种终端后端 / 完整工具链           │
└─────────────────────────────────────────────────────────────────────────┘

3.2 持久记忆系统

三层记忆架构：

┌─────────────────────────────────────────┐
│          用户画像 (Honcho)               │
│    跨会话理解你的工作习惯、偏好         │
├─────────────────────────────────────────┤
│          技能记忆 (Skills)             │
│   自动创建可复用技能文档              │
├─────────────────────────────────────────┤
│          会话记忆 (FTS5)             │
│  全文搜索 + LLM 摘要压缩            │
└─────────────────────────────────────────┘

功能详解：

层级	功能	技术
会话记忆	FTS5 全文搜索	SQLite FTS5
技能记忆	自动创建 SKILL.md	AI 自动生成
用户画像	工作习惯建模	Honcho

记忆工作流程：

1. 用户对话 → 提取关键信息
2. 存储到对应层级
3. 压缩历史摘要
4. 检索时组合上下文
5. 越用越精准

3.3 自动技能创建

核心能力：

当 Hermes 解决了一个难题，它会自动写下可复用的技能文档——下次遇到类似问题，直接调用技能解决。

技能格式（SKILL.md）：

# Skill: 代码审查

## 触发条件
- 文件包含安全敏感代码
- 包含性能瓶颈

## 分析步骤
1. 检查密码/密钥泄露
2. 检查 SQL 注入风险
3. 检查 N+1 查询
4. 生成分数报告

## 输出格式
- 问题列表（严重/警告/提示）
- 改进建议

使用示例：

用户：帮我分析这段代码安全问题

Hermes：检测到安全问题，建议创建"安全审查"技能？
→ 创建技能 → 解决后技能自动保存
→ 下次遇到类似问题，直接调用技能

3.4 多平台消息网关

支持平台：

平台	状态	独特功能
Telegram	✅ 稳定	Markdown/HTML、Keyboard
Discord	✅ 稳定	Embed、Webhook
Slack	✅ 稳定	Block Kit
WhatsApp	🧪 预览	模板消息
Signal	✅ 稳定	端到端加密
CLI	✅ 稳定	本地交互

跨平台体验：

在 Telegram 开始对话 → 切换到 Discord 继续
→ 上下文无缝衔接，记忆共享

3.5 定时自动化任务

自然语言 cron：

用户：每天早上9点推送天气报告

Hermes 自动解析：
  "每天早上9点" → cron: 0 9 * * *
  → 定时执行 → 推送 → 监控

功能：

自然语言描述时间
多平台投递
智能编排（依赖/并行）
状态持久化

3.6 并行子智能体

典型场景：

用户：同时查询天气、股票、新闻

Hermes 生成子智能体：
  ┌─ Weather Agent ────┐
  │ 天气查询        └──► 结果聚合 ──► 推送给用户
  ├─ Stock Agent  ────┤
  │ 股票查询        ──┘
  └─ News Agent  ─────┘
    新闻聚合

技术优势：

零上下文消耗的操作
隔离的对话和终端
通过 RPC 协调

3.7 完整浏览器与网页控制

能力：

网页搜索（Google/Bing）
页面内容提取
完整浏览器自动化（Playwright）
- 导航、点击、输入、截图
视觉分析
图像生成（DALL-E）
文字转语音（ElevenLabs）

四、典型使用场景深度解析

4.1 场景一：个人生产力助手

需求： "每天早上 9 点，给我推送今日待办事项和天气报告"

Hermes 实现：

1. 从笔记系统提取待办（Notion/Things/Reminders）
2. 查询天气 API（OpenWeatherMap）
3. 合并为简报
4. 通过 Telegram 推送
5. 记住你喜欢的格式，下次自动沿用

关键点：

自动提取 → 不需要手动整理
记住偏好 → 越用越懂你
定时推送 → 无需提醒

4.2 场景二：项目维护自动化

需求： "监控这个 GitHub 仓库，每次有新 PR 时帮我快速审查"

Hermes 实现：

1. 通过 GitHub API 监控仓库事件
2. PR 创建时自动触发
3. 拉取 PR 代码并分析变更
4. 检测安全/性能/风格问题
5. 生成审查摘要
6. 通过 Slack 发送

学习能力：

你关注安全 → 优先检测安全问题
你关注性能 → 优先检测性能瓶颈
形成个性化审查偏好

4.3 场景三：MLOps 研究平台

需求： "帮我生成 1000 条工具调用轨迹，用于训练下一个模型"

Hermes 实现：

1. 批量并行生成轨迹数据
2. 导出 ShareGPT 格式
3. 集成 Atropos 进行强化学习训练

这是 Hermes Agent 的隐藏王炸——不只是任务自动化，更是 AI 研究的完整平台。

4.4 更多场景

场景	实现方式
代码审查自动化	GitHub Webhook → 自动审查 → Slack 通知
日报生成	自动汇总日历/邮件/任务 → 定时推送
数据库监控	定时查询 → 异常告警 → Telegram
竞品监控	定时爬取 → 变化对比 → 推送
客服助手	Telegram → AI 回复 → 自动学习

五、与 OpenClaw 的关系

5.1 两者对比

相似之处：

都是自托管的 AI 智能体
都支持多平台消息接入
都有记忆系统和工作区概念

Hermes Agent 的独特优势：

特性	OpenClaw	Hermes Agent
技能创建	需手动编写	自动生成
用户建模	基础	Honcho 深层
研究支持	无	批量轨迹 + RL
终端后端	3 种	7 种

5.2 迁移路径

Hermes Agent 提供一键迁移工具：

hermes claw migrate

自动导入：

SOUL.md（角色设定）
MEMORY.md 和 USER.md（记忆数据）
用户创建的 Skills
API Keys（Telegram、OpenRouter 等）
工作区指令（AGENTS.md）

六、技术概览

6.1 支持的模型

来源	模型数量	说明
Nous Portal	多个	原生 OAuth 集成
OpenRouter	200+	通过 API Key 访问
NVIDIA NIM	Nemotron	NVIDIA 官方模型
Kimi/Moonshot	-	国产大模型
MiniMax	-	国产大模型
OpenAI	GPT 系列	官方 API
Anthropic	Claude 系列	官方 API
本地 vLLM	任意	完全本地化

切换模型：

hermes model
# 交互式选择模型

6.2 支持的平台

操作系统：

平台	状态	说明
Linux	✅ 完全支持	首选环境
macOS	✅ 完全支持	原生支持
WSL2	✅ 完全支持	Windows 用户首选
Windows 原生	🧪 预览	Beta

消息平台：

Telegram、Discord、Slack、WhatsApp、Signal、CLI

终端后端：

Local、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox

6.3 内置能力

40+ 内置技能：MLOps、GitHub、图表、笔记等
7 种终端后端：灵活的执行环境
完整浏览器自动化：Playwright 驱动
语音支持：Whisper 转录 + ElevenLabs TTS

七、为什么选择 Hermes Agent？

7.1 五大核心优势

优势	说明
✅ 数据完全私有	所有记忆存储在你的机器上，无遥测、无追踪
✅ 越用越聪明	不是每次都要重新解释项目背景
✅ 开源可审计	MIT 许可证，每行代码都可检查
✅ 成本可控	VPS 到 GPU 集群，Serverless 零成本
✅ 研究友好	批量轨迹生成 + RL 训练集成

7.2 数据安全对比

~/.hermes/ 目录结构：
├── memory/           # 持久记忆
│   ├── sessions/    # 会话历史
│   ├── skills/      # 技能库
│   └── user_profile # 用户画像
├── config.yaml      # 配置
├── skills/         # 自定义技能
└── logs/           # 日志

零遥测原则：

❌ 无使用追踪
❌ 无数据收集
❌ 无云端锁定

八、快速开始

8.1 安装

一行命令快速安装：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

8.2 首次配置

hermes setup

交互式配置向导：

选择模型提供商
配置 API Key
选择消息平台（可选）
设置工作区

8.3 开始对话

hermes

输入第一条消息：

你好！帮我介绍一下你的能力

九、系列文章预告

篇	标题	核心内容
01	认识 Hermes Agent	是什么、为什么选择
02	5分钟快速上手	安装、配置、第一次对话
03	持久记忆系统	三层记忆、学习闭环
04	Skills 系统深度解剖	SKILL.md、自动创建
05	技术架构全解析	四层架构、七种后端
06	消息网关深度指南	多平台接入
07	Cron 定时任务	自然语言自动化
08	MLOps 与研究能力	批量轨迹、RL训练
09	与 OpenClaw 对比	迁移指南
10	最佳实践与生态展望	总结与未来

十、总结

Hermes Agent 代表了 AI 智能体的新范式：

不再是"用完即忘"的聊天工具，而是"越用越懂你"的持久伙伴。

核心特性回顾

特性	价值
持久记忆	三层架构自动学习
自动技能	解决难题后永不遗忘
多平台网关	一个入口接入所有
研究友好	批量轨迹 + RL 训练
开源可控	MIT 许可，100% 本地

适合人群

想拥有真正私有 AI 助手的人
想自动化重复工作的人
想持续积累经验的开发者
想做AI 研究的工程师

系列文章预告：

（二）5 分钟快速上手：从安装到第一次对话的完整指南。

如果你对 AI 智能体、开源技术或自动化工作流感兴趣，欢迎持续关注本系列。有问题？在评论区分享！

📚 系列导航

认识 Hermes Agent（一）：会成长的开源 AI 智能体

一、Hermes Agent 到底是什么？

1.1 定义

1.2 与传统 AI 工具的本质区别

1.3 核心价值主张

二、Nous Research：开源基因的传承

2.1 团队背景

2.2 开源基因的体现

三、核心特性全面解析

3.1 特性一览

3.2 持久记忆系统

3.3 自动技能创建

3.4 多平台消息网关

3.5 定时自动化任务

3.6 并行子智能体

3.7 完整浏览器与网页控制

四、典型使用场景深度解析

4.1 场景一：个人生产力助手

4.2 场景二：项目维护自动化

4.3 场景三：MLOps 研究平台

4.4 更多场景

五、与 OpenClaw 的关系

5.1 两者对比

5.2 迁移路径

六、技术概览

6.1 支持的模型

6.2 支持的平台

6.3 内置能力

七、为什么选择 Hermes Agent？

7.1 五大核心优势

7.2 数据安全对比

八、快速开始

8.1 安装

8.2 首次配置

8.3 开始对话

九、系列文章预告

十、总结

核心特性回顾

适合人群

系列：Hermes-Agent系列

评论

发表评论