从装上 Hermes Agent 到彻底玩明白:我整理的三阶段通关路线

目录

  1. 先说结论:Hermes Agent 不是「又一个」AI 助手
  2. 第一阶段:新手入门——让它先跑起来
    1. 目标
    2. 三个你必须理解的核心概念
    3. 一键安装
    4. 配置你的第一个模型
    5. 第一次对话
    6. 新手阶段必备命令
    7. 验收标准
  3. 第二阶段:中级进阶——让它「真的有用」
    1. 目标
    2. Skill 系统:为什么它比普通 Agent 省 token
    3. 任务一:接入 Telegram
    4. 任务二:接入飞书 / 钉钉
    5. 任务三:打开常用工具集
    6. 任务四:验证跨会话记忆
    7. 任务五:主动触发一次 Skill 创建
    8. 验收标准
  4. 第三阶段:高手精通——搭自进化闭环
    1. 目标
    2. MCP 扩展:让 Hermes Agent 操作一切
    3. Cron 定时任务:7×24 自动执行
    4. 多 Agent 编排:让角色各司其职
    5. 执行后端与安全
    6. 数据备份:不要等丢了才后悔
    7. 性能优化小技巧
    8. 高手阶段验收标准
  5. 常见问题速查表
  6. 写在最后
  7. 官方资源
  8. 延伸阅读:OpenClaw 社区资源

先说结论:Hermes Agent 不是「又一个」AI 助手

前阵子有朋友问我:「2026 年了,AI Agent 框架我已经装了五六个,Hermes Agent 凭什么值得我再装一个?」

我给他的回答是:你之前装的那些是「工具」,Hermes Agent 更像一个会自己攒经验的「员工」。

它跟普通 Agent 框架最大的区别,不在于模型本身有多强——毕竟模型是外部接的,你今天用 DeepSeek 明天可以换 Claude。它的护城河在三件事上:

  1. 跨会话记忆——关掉终端再打开,它还记得你是谁、在做什么项目、上次聊到哪;
  2. Skill 自动沉淀——你让它完成一个复杂任务,它会把成功经验自动打包成可复用的技能文件,下次同类任务直接调用,省 token 也省时间;
  3. 消息网关统一接入——一次配置,Telegram / 飞书 / 钉钉 / 微信 / Slack 等 15+ 平台同时可用,不用每个平台写一套机器人逻辑。

如果你对这些概念还没直观感受,可以先看我之前写的 Hermes Agent 完全指南——那篇偏”为什么”,这篇偏”怎么做”。

这篇文章我想做的事很简单:把从零上手到熟练使用的完整路径,按「新手 / 中级 / 高手」三个阶段拆开,每个阶段给你明确的目标、步骤和验收标准

看完照着做,理论上 2-3 个晚上能打到「高手」门槛。


第一阶段:新手入门——让它先跑起来

目标

打开终端,完成一次和 Hermes Agent 的正常对话。就这么朴素。

三个你必须理解的核心概念

先别急着装,花 2 分钟把这几个词在脑子里过一遍,后面就不会迷路:

  • 记忆(Memory):跨会话保留的上下文——你的偏好、正在做的项目、常用工作环境。
  • 技能(Skill):日常任务执行过程中,系统自动总结出的可复用工作流,省 token、提效率。
  • 网关(Gateway):对接 15+ 通讯平台的消息路由层,让 AI「无处不在」。

这三个概念后面会反复出现,记住就行。

一键安装

macOS / Linux / WSL2 用户直接一条命令:

1
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Windows 用户稍微麻烦一点:得先装 WSL2,再在 WSL2 终端里跑上面那条。

这条脚本背后帮你做了什么?大概是这些事:

  • 自动检测并补齐 Python、Node.js、Git 等依赖;
  • 创建配置目录 ~/.hermes/
  • 写入环境变量到 shell 配置文件。

装完别急着用,先确认环境:

1
2
3
source ~/.bashrc   # zsh 用户换成 ~/.zshrc
hermes version # 看版本
hermes doctor # 环境自检

hermes doctor 是个我推荐你记住的命令。后面遇到任何莫名其妙的问题,先跑它。

更细节的安装流程和疑难杂症,可以参考 十分钟搞定 Hermes Agent 保姆级教程

配置你的第一个模型

装完会自动进入配置向导。新手强烈推荐 Quick Setup

模型选哪个?我的建议很实在:先白嫖

国产的 DeepSeek、Kimi 免费额度都挺大,先拿它们练手。等你摸清自己的使用量,再决定要不要掏钱上 Claude / GPT-4。

配置方式有两种:

1
2
3
4
5
# 交互式选择
hermes model

# 或者直接设置 API Key
hermes config set OPENROUTER_API_KEY sk-or-xxxxxx

API Key 从哪儿来?各家注册方法不一样,我整理过一份 10 大 AI 服务商 API Key 配置指南,照着注册就行。

第一次对话

1
hermes chat -q "Hello! What tools do you have available?"

能收到回复,就算是装上了。

新手阶段必备命令

这几条你得记在脑子里,相当于 Hermes Agent 的「方向盘」:

命令 作用
hermes chat 打开交互式对话
hermes model 选择模型和供应商
hermes tools 配置启用的工具集
hermes config set 设置单项配置
hermes gateway 启动消息网关
hermes setup 重跑全量配置向导
hermes doctor 诊断运行环境
hermes status 查看当前配置状态
hermes update 升级到最新版本

验收标准

  • hermes doctor 全绿;
  • 能正常和它对话、收到回复;
  • 至少配好一个模型供应商的 API Key。

打到这里,你已经超过了大部分「看了教程没动手」的人。


第二阶段:中级进阶——让它「真的有用」

目标

这一阶段我们要解决一个很关键的问题:让 Hermes Agent 从「命令行玩具」变成「贴身助手」

核心是两件事:

  1. 把它接到你日常用的聊天工具里(Telegram / 飞书 / 钉钉);
  2. 打开常用工具集(搜索、抓网页、执行命令)。

Skill 系统:为什么它比普通 Agent 省 token

先讲一下 Skill 这个概念,因为很多人装完不知道这玩意怎么触发。

Hermes Agent 完成一个多步任务后,会自动评估:”这个流程是不是值得沉淀成可复用的技能?”如果值得,它会把执行过程写成一个技能文件。

自动触发 Skill 创建的三种场景

  • 完成了一个明显多步的复杂任务;
  • 你明确说「把这个流程保存成技能」;
  • 同类工作模式在多次会话中反复出现。

查看已有技能:

1
ls ~/.hermes/skills/

Skill 为什么能省 token?因为下次类似任务,它不用再把思考过程全跑一遍,直接加载技能文件即可。这部分我在 Hermes Agent Skills 深度解析 里写过更细的机制。

任务一:接入 Telegram

Step 1 - 创建 Bot

在 Telegram 里搜 @BotFather,发 /newbot,按提示走完,记下 Bot Token。

Step 2 - 配置 Hermes

1
2
3
4
5
# 方式一:直接写进 .env
echo "TELEGRAM_BOT_TOKEN=your-bot-token" >> ~/.hermes/.env

# 方式二:用命令
hermes config set TELEGRAM_BOT_TOKEN your-bot-token

Step 3 - 开启 Telegram 适配器

编辑 ~/.hermes/config.yaml

1
2
3
4
gateway:
adapters:
telegram:
enabled: true

Step 4 - 启动网关

1
hermes gateway

Step 5 - 测试

回 Telegram 给 Bot 发 /start,能收到回复就成了。

任务二:接入飞书 / 钉钉

飞书最省事:

1
2
hermes gateway setup
# 选"飞书",按提示填 App ID / App Secret

或者手动编辑配置:

1
2
3
4
5
6
7
8
gateway:
adapters:
feishu:
enabled: true
require_mention: false
default_group_policy: open
dingtalk:
enabled: true

更完整的多平台网关对比和参数含义,参考 Hermes Agent 多平台网关对接全记录

任务三:打开常用工具集

1
hermes tools

新手期我推荐优先启用这几个:

工具 用途
filesystem 本地文件读写
web_search 联网搜索
firecrawl 网页抓取
send_message 跨平台发消息
execute_command 执行终端命令
mcp MCP 协议扩展(下一阶段用到)

任务四:验证跨会话记忆

这个测试特别适合「感受」Hermes Agent 和普通大模型的差别:

  1. 开一次对话:「我叫小明,我喜欢用中文交流,平时在做一个叫 XYZ 的项目」;
  2. exit 退出;
  3. 重新 hermes chat
  4. 问它:「你还记得我是谁吗?」

如果它能复述你上次说过的关键信息,记忆系统就正常。背后的工作原理我在 Hermes Agent 记忆系统剖析 里拆过。

任务五:主动触发一次 Skill 创建

1
2
hermes chat
> 帮我抓取 Hacker News 首页的 AI 相关新闻,整理成中文摘要,保存到 ~/Desktop/hn-ai.md

这是一个典型的多步任务:搜索 → 抓取 → 翻译 → 写文件。任务结束后,观察 Hermes Agent 是否提示「要不要保存为技能」。

验收标准

  • Telegram 或飞书机器人能正常响应消息;
  • hermes tools 里至少启用了 3 个;
  • 跨会话记忆验证通过;
  • 至少触发过一次 Skill 创建。

做到这步,Hermes Agent 已经不是命令行里的小玩具了——它现在是你手机里随时能喊的私人助理。


第三阶段:高手精通——搭自进化闭环

目标

到了这一阶段,我们要做三件「进阶工程师才会做」的事:

  1. 用 MCP 协议把 Hermes Agent 接到外部世界(GitHub、数据库、自定义 API);
  2. 用 Cron 做 7×24 自动化;
  3. 编排多个子 Agent 协作。

MCP 扩展:让 Hermes Agent 操作一切

MCP(Model Context Protocol)是一套让 Agent 调用外部工具的标准协议。接上 MCP 之后,Hermes Agent 能做的事突然变多了:

  • 连本地数据库,直接查数据;
  • 读写 GitHub 仓库、自动处理 Issue;
  • 调用你自己写的 API;
  • 精细控制文件系统。

安装 MCP 扩展

1
uv pip install -e ".[mcp]"

配置 MCP 服务器,编辑 ~/.hermes/config.yaml

1
2
3
4
5
6
7
8
9
10
11
12
13
mcp:
servers:
filesystem:
command: "npx"
args:
- "-y"
- "@modelcontextprotocol/server-filesystem"
- "/path/to/your/workspace"
github:
command: "npx"
args:
- "-y"
- "@modelcontextprotocol/server-github"

用起来就是一句话

1
> 读一下我 GitHub 上最新的 5 条 Issue,挑出需要我本周处理的,总结发到飞书

MCP 背后的架构细节可以看 Hermes Agent 架构解析

Cron 定时任务:7×24 自动执行

内置 Cron 调度的好处是,你不用再写一堆 shell 脚本。

查看已有定时任务:

1
ls ~/.hermes/cron/

手动编辑 ~/.hermes/cron/tasks.yaml

1
2
3
4
5
6
7
8
9
10
11
tasks:
- name: daily_news
schedule: "0 9 * * *" # 每天早上 9 点
command: "总结今日 AI 新闻并发我"
platform: telegram
chat_id: "your-chat-id"

- name: weekly_report
schedule: "0 18 * * 5" # 每周五晚 6 点
command: "整理本周 GitHub Issue 进度,生成周报"
platform: feishu

配好之后就不用管了,它会按时给你干活。更多 Cron 用法见 Hermes Agent Cron 定时任务实战

多 Agent 编排:让角色各司其职

单 Agent 什么都干,难免力不从心。高手玩法是拆成几个分工明确的子 Agent:

1
2
3
4
5
6
7
8
9
10
agents:
researcher:
role: "调研员"
tools: [web_search, firecrawl]
writer:
role: "作家"
tools: [filesystem]
editor:
role: "校对员"
tools: [filesystem]

然后在对话里直接调度:

1
2
3
> 让调研 Agent 收集最近一周 AI 行业大事件;
让写作 Agent 整理成 800 字公众号推文;
让校对 Agent 检查错别字和事实错误。

子 Agent 协作的机制,可以看 Hermes Agent 子 Agent 模式详解

执行后端与安全

当 Hermes Agent 开始帮你执行终端命令,隔离环境就变得重要了——你肯定不希望它一条 rm -rf 把你桌面清了。

1
2
3
4
5
# Docker 容器隔离(推荐)
hermes config set terminal.backend docker

# 远程 SSH 模式
hermes config set terminal.backend ssh

安全配置的完整清单,我整理在 Hermes Agent 安全与权限配置

数据备份:不要等丢了才后悔

~/.hermes/ 这个目录里塞了你所有会话历史、记忆、技能、配置。定期备份:

1
tar -czvf hermes-backup-$(date +%Y%m%d).tar.gz ~/.hermes/

备份覆盖的内容:

  • ~/.hermes/sessions/ — 对话历史
  • ~/.hermes/memories/ — 记忆数据
  • ~/.hermes/skills/ — 技能文件
  • ~/.hermes/config.yaml — 主配置

性能优化小技巧

监控日志(排障必备):

1
tail -f ~/.hermes/logs/hermes.log

模型预热(降低首次调用延迟):

1
hermes model warmup

容器化资源限制

1
2
3
4
5
6
7
docker run -d \
--name hermes-agent \
--memory="2g" \
--cpus="2" \
-v ~/.hermes:/home/hermes/.hermes \
ghcr.io/nousresearch/hermes-agent:latest \
hermes

高手阶段验收标准

  • MCP 至少接通一个外部服务(GitHub 或 filesystem);
  • 至少一条 Cron 任务在稳定运行;
  • 多 Agent 协作流程跑通过一次;
  • 会做配置备份;
  • 能看懂并手改 config.yaml 里的高级参数。

常见问题速查表

这些坑我或多或少都踩过,整理出来给你省点时间:

症状 处理办法
hermes: command not found source ~/.bashrc 或检查 PATH 是否包含 ~/.hermes/bin
安装后找不到命令 ln -sf 重建软链接到 /usr/local/bin/
Windows 装不上 先装 WSL2,再在 WSL 里跑安装脚本
API Key 未设置 hermes model 重新走配置
模型无响应 检查 API Key 额度和网络代理
更新后配置丢了 hermes config checkhermes config migrate
机器人不回复 hermes gateway 是否在跑,日志有没有报错
权限错误 核对 Bot Token 和平台权限授予
消息发不出 检查 chat_id 和适配器配置

遇到拿不准的问题,第一句永远是

1
hermes doctor

它会告诉你缺什么、怎么修。


写在最后

Hermes Agent 这个项目的设计哲学挺有意思——它不追求「开箱即用的超级 AI」,而是承认 AI 需要时间学会你的工作方式,然后把这个学习过程做成一个系统化的闭环。

装好是 1 天的事,用熟是 1 周的事,让它成为你工作流里不可替代的一环,大概需要 1-2 个月。

值不值得投入这些时间?

我的答案是:如果你每天在 AI 对话上花超过 1 小时、经常重复类似的操作、同时在用多个平台收发信息,那它对你的杠杆会很大。

如果你只是偶尔问问 AI 怎么写代码,那老实说,直接用网页版 ChatGPT 可能更适合。

工具没有好坏,只有合不合适。


官方资源

延伸阅读:OpenClaw 社区资源

如果你在研究 AI Agent 与主流模型的工程化落地,姊妹站 OpenClaw 中文社区 也许有帮助:

参与讨论

对这篇文章有疑问或想法?cocoloop 社区有不少开发者在讨论 Hermes 相关话题,欢迎加入交流。

前往 cocoloop 社区 →