博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

  1. 文章
  2. 认识 Hermes Agent(一):会成长的开源 AI 智能体

认识 Hermes Agent(一):会成长的开源 AI 智能体

2026年5月11日·约 14 分钟·4145 字·18 次阅读
Hermes Agent
认识 Hermes Agent(一):会成长的开源 AI 智能体

目录

  • 📚 系列导航
  • 一、Hermes Agent 到底是什么?
  • 1.1 定义
  • 1.2 与传统 AI 工具的本质区别
  • 1.3 核心价值主张
  • 二、Nous Research:开源基因的传承
  • 2.1 团队背景
  • 2.2 开源基因的体现
  • 三、核心特性全面解析
  • 3.1 特性一览
  • 3.2 持久记忆系统
  • 3.3 自动技能创建
  • 触发条件
  • 分析步骤
  • 输出格式
  • 3.4 多平台消息网关
  • 3.5 定时自动化任务
  • 3.6 并行子智能体
  • 3.7 完整浏览器与网页控制
  • 四、典型使用场景深度解析
  • 4.1 场景一:个人生产力助手
  • 4.2 场景二:项目维护自动化
  • 4.3 场景三:MLOps 研究平台
  • 4.4 更多场景
  • 五、与 OpenClaw 的关系
  • 5.1 两者对比
  • 5.2 迁移路径
  • 六、技术概览
  • 6.1 支持的模型
  • 6.2 支持的平台
  • 6.3 内置能力
  • 七、为什么选择 Hermes Agent?
  • 7.1 五大核心优势
  • 7.2 数据安全对比
  • 八、快速开始
  • 8.1 安装
  • 8.2 首次配置
  • 8.3 开始对话
  • 九、系列文章预告
  • 十、总结
  • 核心特性回顾
  • 适合人群

📚 本系列目录:《Hermes Agent》 当前第 2/9 篇 · 上一篇:Hermes Agent vs OpenClaw:2026年最热门个人AI Agent框架深度对比 · 下一篇:5 分钟快速上手 Hermes Agent



📚 系列导航

《Hermes Agent》共 9 篇,本篇是第 2 篇。

← 上一篇:Hermes Agent vs OpenClaw:2026年最热门个人AI Agent框架深度对比

下一篇:5 分钟快速上手 Hermes Agent →


认识 Hermes Agent(一):会成长的开源 AI 智能体

它不是聊天机器人,不是代码补全工具,而是一个住在你机器上、每天都在变聪明的智能体。

2026 年 2 月,Nous Research 发布了 Hermes Agent——一个具备持久记忆和自动技能创建能力的开源 AI 智能体。短短三个月,GitHub Star 数突破 6 万,成为 AI 领域最受关注的开源项目之一,在 GitHub Trending 多次霸榜。

这篇文章带你全面认识这个"会成长"的 AI 智能体——它是什么、为什么存在、能做什么、以及为什么值得你尝试。


一、Hermes Agent 到底是什么?

1.1 定义

Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体框架。

它的核心定位非常独特:

部署在你的服务器上,连接你的消息账号,它就成为你的持久个人智能体——学习你的项目、自动构建技能、随时随地触达你。

一句话描述:

Hermes Agent = 持久记忆 + 自动技能创建 + 多平台接入 + 研究友好 的开源 AI 智能体

1.2 与传统 AI 工具的本质区别

类型代表产品核心特点数据归属记忆能力
聊天机器人ChatGPT、Claude.ai云端托管,每次对话独立数据存储在服务商❌ 无
代码补全工具GitHub Copilot、Cursor绑定 IDE,上下文有限需联网,部分数据上传❌ 有限
终端助手Claude Code本地运行,会话内记忆本地存储⚠️ 会话级
Hermes Agent⭐自托管,持久记忆,越用越聪明100% 本地存储✅ 持久

关键差异:

传统 AI 助手:
  第一次使用 → 你解释项目背景 → 完成任务 → 结束
  第二次使用 → 你再次解释项目背景 → 完成任务 → 结束
  (每次都要重新开始,效率低)

Hermes Agent:
  第一次使用 → 你解释项目背景 → 完成任务 → 学会
  第二次使用 → 记得项目背景 → 完成任务 → 更熟练
  第三次使用 → 已经了解你的偏好 → 主动建议
  (越用越聪明,效率递增)

1.3 核心价值主张

Hermes Agent 不是:

  • ❌ 绑定在 IDE 上的代码补全工具
  • ❌ 套壳 OpenAI/Claude 的简单聊天机器人
  • ❌ "用完即忘"的会话式 AI
  • ❌ 需要每次重新解释上下文的工具

Hermes Agent 是:

  • ✅ 住在你服务器上的持久智能体
  • ✅ 记住学到的一切,越用越聪明
  • ✅ 自动积累可复用技能
  • ✅ 多平台无缝接入
  • ✅ 研究友好(批量轨迹 + RL 训练)

二、Nous Research:开源基因的传承

2.1 团队背景

提到 Hermes Agent,必须先了解背后的开发团队——Nous Research。

Nous Research 是开源 AI 社区中声誉极高的研究机构,成立于 2023 年,专注于大语言模型的研究和应用。他们的核心理念是:开源可控的 AI。

团队历史:

  • 2023 年:发布 Hermes 系列开源模型(Hermes-2, Hermes-3)
  • 2024 年:发布 Hermes-2.5,提升工具调用能力
  • 2025 年:推出 Atropos 强化学习框架
  • 2026 年:发布 Hermes Agent,聚焦智能体领域

核心团队成员:

  • 开发者论坛 上活跃的社区互动
  • 主要贡献者来自 AI 研究和系统工程背景

2.2 开源基因的体现

四大开源原则:

原则实践
MIT 许可证完全开源,每行代码都可审计,无隐藏条款
零遥测无追踪,无数据收集,无使用分析
开放标准agentskills.io 技能格式可移植,随处分享
社区驱动Discord 活跃,Skills Hub 持续扩展

与其他闭源 AI 的对比:

闭源 AI (ChatGPT/Claude):
  - 数据会上传云端
  - 使用行为被追踪
  - 功能更新不透明
  - 可能被封禁或限流

Hermes Agent:
  - 数据 100% 本地存储
  - 零遥测,完全隐私
  - 开源可审计
  - 完全自主控制

三、核心特性全面解析

3.1 特性一览

┌─────────────────────────────────────────────────────────────────────────┐
│                   Hermes Agent 核心架构                   │
├─────────────────────────────────────────────────────────────────────────┤
│                                                         │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐   │
│  │  持久记忆   │  │ 自动技能    │  │ 多平台网关  │   │
│  │ 三层架构    │  │ 创建系统    │  │  6+ 平台  │   │
│  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘   │
│         │                │                │           │
│         ▼                ▼                ▼           │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐   │
│  │ 定时任务   │  │ 子智能体   │  │  浏览器    │   │
│  │ Cron 调度  │  │ 并行执行   │  │ 自动化    │   │
│  └─────────────┘  └─────────────┘  └─────────────┘   │
│                                                         │
│  基础:40+ 内置技能 / 7 种终端后端 / 完整工具链           │
└─────────────────────────────────────────────────────────────────────────┘

3.2 持久记忆系统

三层记忆架构:

┌─────────────────────────────────────────┐
│          用户画像 (Honcho)               │
│    跨会话理解你的工作习惯、偏好         │
├─────────────────────────────────────────┤
│          技能记忆 (Skills)             │
│   自动创建可复用技能文档              │
├─────────────────────────────────────────┤
│          会话记忆 (FTS5)             │
│  全文搜索 + LLM 摘要压缩            │
└─────────────────────────────────────────┘

功能详解:

层级功能技术
会话记忆FTS5 全文搜索SQLite FTS5
技能记忆自动创建 SKILL.mdAI 自动生成
用户画像工作习惯建模Honcho

记忆工作流程:

1. 用户对话 → 提取关键信息
2. 存储到对应层级
3. 压缩历史摘要
4. 检索时组合上下文
5. 越用越精准

3.3 自动技能创建

核心能力:

当 Hermes 解决了一个难题,它会自动写下可复用的技能文档——下次遇到类似问题,直接调用技能解决。

技能格式(SKILL.md):

# Skill: 代码审查

## 触发条件
- 文件包含安全敏感代码
- 包含性能瓶颈

## 分析步骤
1. 检查密码/密钥泄露
2. 检查 SQL 注入风险
3. 检查 N+1 查询
4. 生成分数报告

## 输出格式
- 问题列表(严重/警告/提示)
- 改进建议

使用示例:

用户:帮我分析这段代码安全问题

Hermes:检测到安全问题,建议创建"安全审查"技能?
→ 创建技能 → 解决后技能自动保存
→ 下次遇到类似问题,直接调用技能

3.4 多平台消息网关

支持平台:

平台状态独特功能
Telegram✅ 稳定Markdown/HTML、Keyboard
Discord✅ 稳定Embed、Webhook
Slack✅ 稳定Block Kit
WhatsApp🧪 预览模板消息
Signal✅ 稳定端到端加密
CLI✅ 稳定本地交互

跨平台体验:

在 Telegram 开始对话 → 切换到 Discord 继续
→ 上下文无缝衔接,记忆共享

3.5 定时自动化任务

自然语言 cron:

用户:每天早上9点推送天气报告

Hermes 自动解析:
  "每天早上9点" → cron: 0 9 * * *
  → 定时执行 → 推送 → 监控

功能:

  • 自然语言描述时间
  • 多平台投递
  • 智能编排(依赖/并行)
  • 状态持久化

3.6 并行子智能体

典型场景:

用户:同时查询天气、股票、新闻

Hermes 生成子智能体:
  ┌─ Weather Agent ────┐
  │ 天气查询        └──► 结果聚合 ──► 推送给用户
  ├─ Stock Agent  ────┤
  │ 股票查询        ──┘
  └─ News Agent  ─────┘
    新闻聚合

技术优势:

  • 零上下文消耗的操作
  • 隔离的对话和终端
  • 通过 RPC 协调

3.7 完整浏览器与网页控制

能力:

  • 网页搜索(Google/Bing)
  • 页面内容提取
  • 完整浏览器自动化(Playwright)
    • 导航、点击、输入、截图
  • 视觉分析
  • 图像生成(DALL-E)
  • 文字转语音(ElevenLabs)

四、典型使用场景深度解析

4.1 场景一:个人生产力助手

需求: "每天早上 9 点,给我推送今日待办事项和天气报告"

Hermes 实现:

1. 从笔记系统提取待办(Notion/Things/Reminders)
2. 查询天气 API(OpenWeatherMap)
3. 合并为简报
4. 通过 Telegram 推送
5. 记住你喜欢的格式,下次自动沿用

关键点:

  • 自动提取 → 不需要手动整理
  • 记住偏好 → 越用越懂你
  • 定时推送 → 无需提醒

4.2 场景二:项目维护自动化

需求: "监控这个 GitHub 仓库,每次有新 PR 时帮我快速审查"

Hermes 实现:

1. 通过 GitHub API 监控仓库事件
2. PR 创建时自动触发
3. 拉取 PR 代码并分析变更
4. 检测安全/性能/风格问题
5. 生成审查摘要
6. 通过 Slack 发送

学习能力:

  • 你关注安全 → 优先检测安全问题
  • 你关注性能 → 优先检测性能瓶颈
  • 形成个性化审查偏好

4.3 场景三:MLOps 研究平台

需求: "帮我生成 1000 条工具调用轨迹,用于训练下一个模型"

Hermes 实现:

1. 批量并行生成轨迹数据
2. 导出 ShareGPT 格式
3. 集成 Atropos 进行强化学习训练

这是 Hermes Agent 的隐藏王炸——不只是任务自动化,更是 AI 研究的完整平台。

4.4 更多场景

场景实现方式
代码审查自动化GitHub Webhook → 自动审查 → Slack 通知
日报生成自动汇总日历/邮件/任务 → 定时推送
数据库监控定时查询 → 异常告警 → Telegram
竞品监控定时爬取 → 变化对比 → 推送
客服助手Telegram → AI 回复 → 自动学习

五、与 OpenClaw 的关系

5.1 两者对比

相似之处:

  • 都是自托管的 AI 智能体
  • 都支持多平台消息接入
  • 都有记忆系统和工作区概念

Hermes Agent 的独特优势:

特性OpenClawHermes Agent
技能创建需手动编写自动生成
用户建模基础Honcho 深层
研究支持无批量轨迹 + RL
终端后端3 种7 种

5.2 迁移路径

Hermes Agent 提供一键迁移工具:

hermes claw migrate

自动导入:

  • SOUL.md(角色设定)
  • MEMORY.md 和 USER.md(记忆数据)
  • 用户创建的 Skills
  • API Keys(Telegram、OpenRouter 等)
  • 工作区指令(AGENTS.md)

六、技术概览

6.1 支持的模型

来源模型数量说明
Nous Portal多个原生 OAuth 集成
OpenRouter200+通过 API Key 访问
NVIDIA NIMNemotronNVIDIA 官方模型
Kimi/Moonshot-国产大模型
MiniMax-国产大模型
OpenAIGPT 系列官方 API
AnthropicClaude 系列官方 API
本地 vLLM任意完全本地化

切换模型:

hermes model
# 交互式选择模型

6.2 支持的平台

操作系统:

平台状态说明
Linux✅ 完全支持首选环境
macOS✅ 完全支持原生支持
WSL2✅ 完全支持Windows 用户首选
Windows 原生🧪 预览Beta

消息平台:

  • Telegram、Discord、Slack、WhatsApp、Signal、CLI

终端后端:

  • Local、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox

6.3 内置能力

  • 40+ 内置技能:MLOps、GitHub、图表、笔记等
  • 7 种终端后端:灵活的执行环境
  • 完整浏览器自动化:Playwright 驱动
  • 语音支持:Whisper 转录 + ElevenLabs TTS

七、为什么选择 Hermes Agent?

7.1 五大核心优势

优势说明
✅ 数据完全私有所有记忆存储在你的机器上,无遥测、无追踪
✅ 越用越聪明不是每次都要重新解释项目背景
✅ 开源可审计MIT 许可证,每行代码都可检查
✅ 成本可控VPS 到 GPU 集群,Serverless 零成本
✅ 研究友好批量轨迹生成 + RL 训练集成

7.2 数据安全对比

~/.hermes/ 目录结构:
├── memory/           # 持久记忆
│   ├── sessions/    # 会话历史
│   ├── skills/      # 技能库
│   └── user_profile # 用户画像
├── config.yaml      # 配置
├── skills/         # 自定义技能
└── logs/           # 日志

零遥测原则:

  • ❌ 无使用追踪
  • ❌ 无数据收集
  • ❌ 无云端锁定

八、快速开始

8.1 安装

一行命令快速安装:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

8.2 首次配置

hermes setup

交互式配置向导:

  1. 选择模型提供商
  2. 配置 API Key
  3. 选择消息平台(可选)
  4. 设置工作区

8.3 开始对话

hermes

输入第一条消息:

你好!帮我介绍一下你的能力

九、系列文章预告

篇标题核心内容
01认识 Hermes Agent是什么、为什么选择
025分钟快速上手安装、配置、第一次对话
03持久记忆系统三层记忆、学习闭环
04Skills 系统深度解剖SKILL.md、自动创建
05技术架构全解析四层架构、七种后端
06消息网关深度指南多平台接入
07Cron 定时任务自然语言自动化
08MLOps 与研究能力批量轨迹、RL训练
09与 OpenClaw 对比迁移指南
10最佳实践与生态展望总结与未来

十、总结

Hermes Agent 代表了 AI 智能体的新范式:

不再是"用完即忘"的聊天工具,而是"越用越懂你"的持久伙伴。

核心特性回顾

特性价值
持久记忆三层架构自动学习
自动技能解决难题后永不遗忘
多平台网关一个入口接入所有
研究友好批量轨迹 + RL 训练
开源可控MIT 许可,100% 本地

适合人群

  • 想拥有真正私有 AI 助手的人
  • 想自动化重复工作的人
  • 想持续积累经验的开发者
  • 想做AI 研究的工程师

系列文章预告:

  • (二)5 分钟快速上手:从安装到第一次对话的完整指南。

如果你对 AI 智能体、开源技术或自动化工作流感兴趣,欢迎持续关注本系列。有问题?在评论区分享!

相关文章

  • Hermes Agent 完全使用指南:日常技巧与常见用法详解5月14日
  • Hermes-Agent(八):消息网关深度指南——统一多平台接入的核心枢纽5月11日
  • 最佳实践与生态展望——Hermes Agent 深度使用指南5月11日

评论

加载评论中…

发表评论

返回文章列表