认识 Hermes Agent(一):会成长的开源 AI 智能体
约 14 分钟3941 字2 次阅读
认识 Hermes Agent(一):会成长的开源 AI 智能体
它不是聊天机器人,不是代码补全工具,而是一个住在你机器上、每天都在变聪明的智能体。
2026 年 2 月,Nous Research 发布了 Hermes Agent——一个具备持久记忆和自动技能创建能力的开源 AI 智能体。短短三个月,GitHub Star 数突破 6 万,成为 AI 领域最受关注的开源项目之一,在 GitHub Trending 多次霸榜。
这篇文章带你全面认识这个"会成长"的 AI 智能体——它是什么、为什么存在、能做什么、以及为什么值得你尝试。
一、Hermes Agent 到底是什么?
1.1 定义
Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体框架。
它的核心定位非常独特:
部署在你的服务器上,连接你的消息账号,它就成为你的持久个人智能体——学习你的项目、自动构建技能、随时随地触达你。
一句话描述:
Hermes Agent = 持久记忆 + 自动技能创建 + 多平台接入 + 研究友好 的开源 AI 智能体
1.2 与传统 AI 工具的本质区别
| 类型 | 代表产品 | 核心特点 | 数据归属 | 记忆能力 |
|---|---|---|---|---|
| 聊天机器人 | ChatGPT、Claude.ai | 云端托管,每次对话独立 | 数据存储在服务商 | ❌ 无 |
| 代码补全工具 | GitHub Copilot、Cursor | 绑定 IDE,上下文有限 | 需联网,部分数据上传 | ❌ 有限 |
| 终端助手 | Claude Code | 本地运行,会话内记忆 | 本地存储 | ⚠️ 会话级 |
| Hermes Agent | ⭐ | 自托管,持久记忆,越用越聪明 | 100% 本地存储 | ✅ 持久 |
关键差异:
传统 AI 助手:
第一次使用 → 你解释项目背景 → 完成任务 → 结束
第二次使用 → 你再次解释项目背景 → 完成任务 → 结束
(每次都要重新开始,效率低)
Hermes Agent:
第一次使用 → 你解释项目背景 → 完成任务 → 学会
第二次使用 → 记得项目背景 → 完成任务 → 更熟练
第三次使用 → 已经了解你的偏好 → 主动建议
(越用越聪明,效率递增)
1.3 核心价值主张
Hermes Agent 不是:
- ❌ 绑定在 IDE 上的代码补全工具
- ❌ 套壳 OpenAI/Claude 的简单聊天机器人
- ❌ "用完即忘"的会话式 AI
- ❌ 需要每次重新解释上下文的工具
Hermes Agent 是:
- ✅ 住在你服务器上的持久智能体
- ✅ 记住学到的一切,越用越聪明
- ✅ 自动积累可复用技能
- ✅ 多平台无缝接入
- ✅ 研究友好(批量轨迹 + RL 训练)
二、Nous Research:开源基因的传承
2.1 团队背景
提到 Hermes Agent,必须先了解背后的开发团队——Nous Research。
Nous Research 是开源 AI 社区中声誉极高的研究机构,成立于 2023 年,专注于大语言模型的研究和应用。他们的核心理念是:开源可控的 AI。
团队历史:
- 2023 年:发布 Hermes 系列开源模型(Hermes-2, Hermes-3)
- 2024 年:发布 Hermes-2.5,提升工具调用能力
- 2025 年:推出 Atropos 强化学习框架
- 2026 年:发布 Hermes Agent,聚焦智能体领域
核心团队成员:
- 开发者论坛 上活跃的社区互动
- 主要贡献者来自 AI 研究和系统工程背景
2.2 开源基因的体现
四大开源原则:
| 原则 | 实践 |
|---|---|
| MIT 许可证 | 完全开源,每行代码都可审计,无隐藏条款 |
| 零遥测 | 无追踪,无数据收集,无使用分析 |
| 开放标准 | agentskills.io 技能格式可移植,随处分享 |
| 社区驱动 | Discord 活跃,Skills Hub 持续扩展 |
与其他闭源 AI 的对比:
闭源 AI (ChatGPT/Claude):
- 数据会上传云端
- 使用行为被追踪
- 功能更新不透明
- 可能被封禁或限流
Hermes Agent:
- 数据 100% 本地存储
- 零遥测,完全隐私
- 开源可审计
- 完全自主控制
三、核心特性全面解析
3.1 特性一览
┌─────────────────────────────────────────────────────────────────────────┐
│ Hermes Agent 核心架构 │
├─────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 持久记忆 │ │ 自动技能 │ │ 多平台网关 │ │
│ │ 三层架构 │ │ 创建系统 │ │ 6+ 平台 │ │
│ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 定时任务 │ │ 子智能体 │ │ 浏览器 │ │
│ │ Cron 调度 │ │ 并行执行 │ │ 自动化 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ 基础:40+ 内置技能 / 7 种终端后端 / 完整工具链 │
└─────────────────────────────────────────────────────────────────────────┘
3.2 持久记忆系统
三层记忆架构:
┌─────────────────────────────────────────┐
│ 用户画像 (Honcho) │
│ 跨会话理解你的工作习惯、偏好 │
├─────────────────────────────────────────┤
│ 技能记忆 (Skills) │
│ 自动创建可复用技能文档 │
├─────────────────────────────────────────┤
│ 会话记忆 (FTS5) │
│ 全文搜索 + LLM 摘要压缩 │
└─────────────────────────────────────────┘
功能详解:
| 层级 | 功能 | 技术 |
|---|---|---|
| 会话记忆 | FTS5 全文搜索 | SQLite FTS5 |
| 技能记忆 | 自动创建 SKILL.md | AI 自动生成 |
| 用户画像 | 工作习惯建模 | Honcho |
记忆工作流程:
1. 用户对话 → 提取关键信息
2. 存储到对应层级
3. 压缩历史摘要
4. 检索时组合上下文
5. 越用越精准
3.3 自动技能创建
核心能力:
当 Hermes 解决了一个难题,它会自动写下可复用的技能文档——下次遇到类似问题,直接调用技能解决。
技能格式(SKILL.md):
# Skill: 代码审查
## 触发条件
- 文件包含安全敏感代码
- 包含性能瓶颈
## 分析步骤
1. 检查密码/密钥泄露
2. 检查 SQL 注入风险
3. 检查 N+1 查询
4. 生成分数报告
## 输出格式
- 问题列表(严重/警告/提示)
- 改进建议
使用示例:
用户:帮我分析这段代码安全问题
Hermes:检测到安全问题,建议创建"安全审查"技能?
→ 创建技能 → 解决后技能自动保存
→ 下次遇到类似问题,直接调用技能
3.4 多平台消息网关
支持平台:
| 平台 | 状态 | 独特功能 |
|---|---|---|
| Telegram | ✅ 稳定 | Markdown/HTML、Keyboard |
| Discord | ✅ 稳定 | Embed、Webhook |
| Slack | ✅ 稳定 | Block Kit |
| 🧪 预览 | 模板消息 | |
| Signal | ✅ 稳定 | 端到端加密 |
| CLI | ✅ 稳定 | 本地交互 |
跨平台体验:
在 Telegram 开始对话 → 切换到 Discord 继续
→ 上下文无缝衔接,记忆共享
3.5 定时自动化任务
自然语言 cron:
用户:每天早上9点推送天气报告
Hermes 自动解析:
"每天早上9点" → cron: 0 9 * * *
→ 定时执行 → 推送 → 监控
功能:
- 自然语言描述时间
- 多平台投递
- 智能编排(依赖/并行)
- 状态持久化
3.6 并行子智能体
典型场景:
用户:同时查询天气、股票、新闻
Hermes 生成子智能体:
┌─ Weather Agent ────┐
│ 天气查询 └──► 结果聚合 ──► 推送给用户
├─ Stock Agent ────┤
│ 股票查询 ──┘
└─ News Agent ─────┘
新闻聚合
技术优势:
- 零上下文消耗的操作
- 隔离的对话和终端
- 通过 RPC 协调
3.7 完整浏览器与网页控制
能力:
- 网页搜索(Google/Bing)
- 页面内容提取
- 完整浏览器自动化(Playwright)
- 导航、点击、输入、截图
- 视觉分析
- 图像生成(DALL-E)
- 文字转语音(ElevenLabs)
四、典型使用场景深度解析
4.1 场景一:个人生产力助手
需求: "每天早上 9 点,给我推送今日待办事项和天气报告"
Hermes 实现:
1. 从笔记系统提取待办(Notion/Things/Reminders)
2. 查询天气 API(OpenWeatherMap)
3. 合并为简报
4. 通过 Telegram 推送
5. 记住你喜欢的格式,下次自动沿用
关键点:
- 自动提取 → 不需要手动整理
- 记住偏好 → 越用越懂你
- 定时推送 → 无需提醒
4.2 场景二:项目维护自动化
需求: "监控这个 GitHub 仓库,每次有新 PR 时帮我快速审查"
Hermes 实现:
1. 通过 GitHub API 监控仓库事件
2. PR 创建时自动触发
3. 拉取 PR 代码并分析变更
4. 检测安全/性能/风格问题
5. 生成审查摘要
6. 通过 Slack 发送
学习能力:
- 你关注安全 → 优先检测安全问题
- 你关注性能 → 优先检测性能瓶颈
- 形成个性化审查偏好
4.3 场景三:MLOps 研究平台
需求: "帮我生成 1000 条工具调用轨迹,用于训练下一个模型"
Hermes 实现:
1. 批量并行生成轨迹数据
2. 导出 ShareGPT 格式
3. 集成 Atropos 进行强化学习训练
这是 Hermes Agent 的隐藏王炸——不只是任务自动化,更是 AI 研究的完整平台。
4.4 更多场景
| 场景 | 实现方式 |
|---|---|
| 代码审查自动化 | GitHub Webhook → 自动审查 → Slack 通知 |
| 日报生成 | 自动汇总日历/邮件/任务 → 定时推送 |
| 数据库监控 | 定时查询 → 异常告警 → Telegram |
| 竞品监控 | 定时爬取 → 变化对比 → 推送 |
| 客服助手 | Telegram → AI 回复 → 自动学习 |
五、与 OpenClaw 的关系
5.1 两者对比
相似之处:
- 都是自托管的 AI 智能体
- 都支持多平台消息接入
- 都有记忆系统和工作区概念
Hermes Agent 的独特优势:
| 特性 | OpenClaw | Hermes Agent |
|---|---|---|
| 技能创建 | 需手动编写 | 自动生成 |
| 用户建模 | 基础 | Honcho 深层 |
| 研究支持 | 无 | 批量轨迹 + RL |
| 终端后端 | 3 种 | 7 种 |
5.2 迁移路径
Hermes Agent 提供一键迁移工具:
hermes claw migrate
自动导入:
- SOUL.md(角色设定)
- MEMORY.md 和 USER.md(记忆数据)
- 用户创建的 Skills
- API Keys(Telegram、OpenRouter 等)
- 工作区指令(AGENTS.md)
六、技术概览
6.1 支持的模型
| 来源 | 模型数量 | 说明 |
|---|---|---|
| Nous Portal | 多个 | 原生 OAuth 集成 |
| OpenRouter | 200+ | 通过 API Key 访问 |
| NVIDIA NIM | Nemotron | NVIDIA 官方模型 |
| Kimi/Moonshot | - | 国产大模型 |
| MiniMax | - | 国产大模型 |
| OpenAI | GPT 系列 | 官方 API |
| Anthropic | Claude 系列 | 官方 API |
| 本地 vLLM | 任意 | 完全本地化 |
切换模型:
hermes model
# 交互式选择模型
6.2 支持的平台
操作系统:
| 平台 | 状态 | 说明 |
|---|---|---|
| Linux | ✅ 完全支持 | 首选环境 |
| macOS | ✅ 完全支持 | 原生支持 |
| WSL2 | ✅ 完全支持 | Windows 用户首选 |
| Windows 原生 | 🧪 预览 | Beta |
消息平台:
- Telegram、Discord、Slack、WhatsApp、Signal、CLI
终端后端:
- Local、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox
6.3 内置能力
- 40+ 内置技能:MLOps、GitHub、图表、笔记等
- 7 种终端后端:灵活的执行环境
- 完整浏览器自动化:Playwright 驱动
- 语音支持:Whisper 转录 + ElevenLabs TTS
七、为什么选择 Hermes Agent?
7.1 五大核心优势
| 优势 | 说明 |
|---|---|
| ✅ 数据完全私有 | 所有记忆存储在你的机器上,无遥测、无追踪 |
| ✅ 越用越聪明 | 不是每次都要重新解释项目背景 |
| ✅ 开源可审计 | MIT 许可证,每行代码都可检查 |
| ✅ 成本可控 | VPS 到 GPU 集群,Serverless 零成本 |
| ✅ 研究友好 | 批量轨迹生成 + RL 训练集成 |
7.2 数据安全对比
~/.hermes/ 目录结构:
├── memory/ # 持久记忆
│ ├── sessions/ # 会话历史
│ ├── skills/ # 技能库
│ └── user_profile # 用户画像
├── config.yaml # 配置
├── skills/ # 自定义技能
└── logs/ # 日志
零遥测原则:
- ❌ 无使用追踪
- ❌ 无数据收集
- ❌ 无云端锁定
八、快速开始
8.1 安装
一行命令快速安装:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
8.2 首次配置
hermes setup
交互式配置向导:
- 选择模型提供商
- 配置 API Key
- 选择消息平台(可选)
- 设置工作区
8.3 开始对话
hermes
输入第一条消息:
你好!帮我介绍一下你的能力
九、系列文章预告
| 篇 | 标题 | 核心内容 |
|---|---|---|
| 01 | 认识 Hermes Agent | 是什么、为什么选择 |
| 02 | 5分钟快速上手 | 安装、配置、第一次对话 |
| 03 | 持久记忆系统 | 三层记忆、学习闭环 |
| 04 | Skills 系统深度解剖 | SKILL.md、自动创建 |
| 05 | 技术架构全解析 | 四层架构、七种后端 |
| 06 | 消息网关深度指南 | 多平台接入 |
| 07 | Cron 定时任务 | 自然语言自动化 |
| 08 | MLOps 与研究能力 | 批量轨迹、RL训练 |
| 09 | 与 OpenClaw 对比 | 迁移指南 |
| 10 | 最佳实践与生态展望 | 总结与未来 |
十、总结
Hermes Agent 代表了 AI 智能体的新范式:
不再是"用完即忘"的聊天工具,而是"越用越懂你"的持久伙伴。
核心特性回顾
| 特性 | 价值 |
|---|---|
| 持久记忆 | 三层架构自动学习 |
| 自动技能 | 解决难题后永不遗忘 |
| 多平台网关 | 一个入口接入所有 |
| 研究友好 | 批量轨迹 + RL 训练 |
| 开源可控 | MIT 许可,100% 本地 |
适合人群
- 想拥有真正私有 AI 助手的人
- 想自动化重复工作的人
- 想持续积累经验的开发者
- 想做AI 研究的工程师
系列文章预告:
- (二)5 分钟快速上手:从安装到第一次对话的完整指南。
如果你对 AI 智能体、开源技术或自动化工作流感兴趣,欢迎持续关注本系列。有问题?在评论区分享!