先说结论:Hermes Agent 不是「又一个」AI 助手
前阵子有朋友问我:「2026 年了,AI Agent 框架我已经装了五六个,Hermes Agent 凭什么值得我再装一个?」
我给他的回答是:你之前装的那些是「工具」,Hermes Agent 更像一个会自己攒经验的「员工」。
它跟普通 Agent 框架最大的区别,不在于模型本身有多强——毕竟模型是外部接的,你今天用 DeepSeek 明天可以换 Claude。它的护城河在三件事上:
- 跨会话记忆——关掉终端再打开,它还记得你是谁、在做什么项目、上次聊到哪;
- Skill 自动沉淀——你让它完成一个复杂任务,它会把成功经验自动打包成可复用的技能文件,下次同类任务直接调用,省 token 也省时间;
- 消息网关统一接入——一次配置,Telegram / 飞书 / 钉钉 / 微信 / Slack 等 15+ 平台同时可用,不用每个平台写一套机器人逻辑。
如果你对这些概念还没直观感受,可以先看我之前写的 Hermes Agent 完全指南——那篇偏”为什么”,这篇偏”怎么做”。
这篇文章我想做的事很简单:把从零上手到熟练使用的完整路径,按「新手 / 中级 / 高手」三个阶段拆开,每个阶段给你明确的目标、步骤和验收标准。
看完照着做,理论上 2-3 个晚上能打到「高手」门槛。
第一阶段:新手入门——让它先跑起来
目标
打开终端,完成一次和 Hermes Agent 的正常对话。就这么朴素。
三个你必须理解的核心概念
先别急着装,花 2 分钟把这几个词在脑子里过一遍,后面就不会迷路:
- 记忆(Memory):跨会话保留的上下文——你的偏好、正在做的项目、常用工作环境。
- 技能(Skill):日常任务执行过程中,系统自动总结出的可复用工作流,省 token、提效率。
- 网关(Gateway):对接 15+ 通讯平台的消息路由层,让 AI「无处不在」。
这三个概念后面会反复出现,记住就行。
一键安装
macOS / Linux / WSL2 用户直接一条命令:
1 | curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash |
Windows 用户稍微麻烦一点:得先装 WSL2,再在 WSL2 终端里跑上面那条。
这条脚本背后帮你做了什么?大概是这些事:
- 自动检测并补齐 Python、Node.js、Git 等依赖;
- 创建配置目录
~/.hermes/; - 写入环境变量到 shell 配置文件。
装完别急着用,先确认环境:
1 | source ~/.bashrc # zsh 用户换成 ~/.zshrc |
hermes doctor 是个我推荐你记住的命令。后面遇到任何莫名其妙的问题,先跑它。
更细节的安装流程和疑难杂症,可以参考 十分钟搞定 Hermes Agent 保姆级教程。
配置你的第一个模型
装完会自动进入配置向导。新手强烈推荐 Quick Setup。
模型选哪个?我的建议很实在:先白嫖。
国产的 DeepSeek、Kimi 免费额度都挺大,先拿它们练手。等你摸清自己的使用量,再决定要不要掏钱上 Claude / GPT-4。
配置方式有两种:
1 | # 交互式选择 |
API Key 从哪儿来?各家注册方法不一样,我整理过一份 10 大 AI 服务商 API Key 配置指南,照着注册就行。
第一次对话
1 | hermes chat -q "Hello! What tools do you have available?" |
能收到回复,就算是装上了。
新手阶段必备命令
这几条你得记在脑子里,相当于 Hermes Agent 的「方向盘」:
| 命令 | 作用 |
|---|---|
hermes chat |
打开交互式对话 |
hermes model |
选择模型和供应商 |
hermes tools |
配置启用的工具集 |
hermes config set |
设置单项配置 |
hermes gateway |
启动消息网关 |
hermes setup |
重跑全量配置向导 |
hermes doctor |
诊断运行环境 |
hermes status |
查看当前配置状态 |
hermes update |
升级到最新版本 |
验收标准
hermes doctor全绿;- 能正常和它对话、收到回复;
- 至少配好一个模型供应商的 API Key。
打到这里,你已经超过了大部分「看了教程没动手」的人。
第二阶段:中级进阶——让它「真的有用」
目标
这一阶段我们要解决一个很关键的问题:让 Hermes Agent 从「命令行玩具」变成「贴身助手」。
核心是两件事:
- 把它接到你日常用的聊天工具里(Telegram / 飞书 / 钉钉);
- 打开常用工具集(搜索、抓网页、执行命令)。
Skill 系统:为什么它比普通 Agent 省 token
先讲一下 Skill 这个概念,因为很多人装完不知道这玩意怎么触发。
Hermes Agent 完成一个多步任务后,会自动评估:”这个流程是不是值得沉淀成可复用的技能?”如果值得,它会把执行过程写成一个技能文件。
自动触发 Skill 创建的三种场景:
- 完成了一个明显多步的复杂任务;
- 你明确说「把这个流程保存成技能」;
- 同类工作模式在多次会话中反复出现。
查看已有技能:
1 | ls ~/.hermes/skills/ |
Skill 为什么能省 token?因为下次类似任务,它不用再把思考过程全跑一遍,直接加载技能文件即可。这部分我在 Hermes Agent Skills 深度解析 里写过更细的机制。
任务一:接入 Telegram
Step 1 - 创建 Bot
在 Telegram 里搜 @BotFather,发 /newbot,按提示走完,记下 Bot Token。
Step 2 - 配置 Hermes
1 | # 方式一:直接写进 .env |
Step 3 - 开启 Telegram 适配器
编辑 ~/.hermes/config.yaml:
1 | gateway: |
Step 4 - 启动网关
1 | hermes gateway |
Step 5 - 测试
回 Telegram 给 Bot 发 /start,能收到回复就成了。
任务二:接入飞书 / 钉钉
飞书最省事:
1 | hermes gateway setup |
或者手动编辑配置:
1 | gateway: |
更完整的多平台网关对比和参数含义,参考 Hermes Agent 多平台网关对接全记录。
任务三:打开常用工具集
1 | hermes tools |
新手期我推荐优先启用这几个:
| 工具 | 用途 |
|---|---|
filesystem |
本地文件读写 |
web_search |
联网搜索 |
firecrawl |
网页抓取 |
send_message |
跨平台发消息 |
execute_command |
执行终端命令 |
mcp |
MCP 协议扩展(下一阶段用到) |
任务四:验证跨会话记忆
这个测试特别适合「感受」Hermes Agent 和普通大模型的差别:
- 开一次对话:「我叫小明,我喜欢用中文交流,平时在做一个叫 XYZ 的项目」;
exit退出;- 重新
hermes chat; - 问它:「你还记得我是谁吗?」
如果它能复述你上次说过的关键信息,记忆系统就正常。背后的工作原理我在 Hermes Agent 记忆系统剖析 里拆过。
任务五:主动触发一次 Skill 创建
1 | hermes chat |
这是一个典型的多步任务:搜索 → 抓取 → 翻译 → 写文件。任务结束后,观察 Hermes Agent 是否提示「要不要保存为技能」。
验收标准
- Telegram 或飞书机器人能正常响应消息;
hermes tools里至少启用了 3 个;- 跨会话记忆验证通过;
- 至少触发过一次 Skill 创建。
做到这步,Hermes Agent 已经不是命令行里的小玩具了——它现在是你手机里随时能喊的私人助理。
第三阶段:高手精通——搭自进化闭环
目标
到了这一阶段,我们要做三件「进阶工程师才会做」的事:
- 用 MCP 协议把 Hermes Agent 接到外部世界(GitHub、数据库、自定义 API);
- 用 Cron 做 7×24 自动化;
- 编排多个子 Agent 协作。
MCP 扩展:让 Hermes Agent 操作一切
MCP(Model Context Protocol)是一套让 Agent 调用外部工具的标准协议。接上 MCP 之后,Hermes Agent 能做的事突然变多了:
- 连本地数据库,直接查数据;
- 读写 GitHub 仓库、自动处理 Issue;
- 调用你自己写的 API;
- 精细控制文件系统。
安装 MCP 扩展:
1 | uv pip install -e ".[mcp]" |
配置 MCP 服务器,编辑 ~/.hermes/config.yaml:
1 | mcp: |
用起来就是一句话:
1 | > 读一下我 GitHub 上最新的 5 条 Issue,挑出需要我本周处理的,总结发到飞书 |
MCP 背后的架构细节可以看 Hermes Agent 架构解析。
Cron 定时任务:7×24 自动执行
内置 Cron 调度的好处是,你不用再写一堆 shell 脚本。
查看已有定时任务:
1 | ls ~/.hermes/cron/ |
手动编辑 ~/.hermes/cron/tasks.yaml:
1 | tasks: |
配好之后就不用管了,它会按时给你干活。更多 Cron 用法见 Hermes Agent Cron 定时任务实战。
多 Agent 编排:让角色各司其职
单 Agent 什么都干,难免力不从心。高手玩法是拆成几个分工明确的子 Agent:
1 | agents: |
然后在对话里直接调度:
1 | > 让调研 Agent 收集最近一周 AI 行业大事件; |
子 Agent 协作的机制,可以看 Hermes Agent 子 Agent 模式详解。
执行后端与安全
当 Hermes Agent 开始帮你执行终端命令,隔离环境就变得重要了——你肯定不希望它一条 rm -rf 把你桌面清了。
1 | # Docker 容器隔离(推荐) |
安全配置的完整清单,我整理在 Hermes Agent 安全与权限配置。
数据备份:不要等丢了才后悔
~/.hermes/ 这个目录里塞了你所有会话历史、记忆、技能、配置。定期备份:
1 | tar -czvf hermes-backup-$(date +%Y%m%d).tar.gz ~/.hermes/ |
备份覆盖的内容:
~/.hermes/sessions/— 对话历史~/.hermes/memories/— 记忆数据~/.hermes/skills/— 技能文件~/.hermes/config.yaml— 主配置
性能优化小技巧
监控日志(排障必备):
1 | tail -f ~/.hermes/logs/hermes.log |
模型预热(降低首次调用延迟):
1 | hermes model warmup |
容器化资源限制:
1 | docker run -d \ |
高手阶段验收标准
- MCP 至少接通一个外部服务(GitHub 或 filesystem);
- 至少一条 Cron 任务在稳定运行;
- 多 Agent 协作流程跑通过一次;
- 会做配置备份;
- 能看懂并手改
config.yaml里的高级参数。
常见问题速查表
这些坑我或多或少都踩过,整理出来给你省点时间:
| 症状 | 处理办法 |
|---|---|
hermes: command not found |
source ~/.bashrc 或检查 PATH 是否包含 ~/.hermes/bin |
| 安装后找不到命令 | ln -sf 重建软链接到 /usr/local/bin/ |
| Windows 装不上 | 先装 WSL2,再在 WSL 里跑安装脚本 |
| API Key 未设置 | hermes model 重新走配置 |
| 模型无响应 | 检查 API Key 额度和网络代理 |
| 更新后配置丢了 | hermes config check 再 hermes config migrate |
| 机器人不回复 | 看 hermes gateway 是否在跑,日志有没有报错 |
| 权限错误 | 核对 Bot Token 和平台权限授予 |
| 消息发不出 | 检查 chat_id 和适配器配置 |
遇到拿不准的问题,第一句永远是:
1 | hermes doctor |
它会告诉你缺什么、怎么修。
写在最后
Hermes Agent 这个项目的设计哲学挺有意思——它不追求「开箱即用的超级 AI」,而是承认 AI 需要时间学会你的工作方式,然后把这个学习过程做成一个系统化的闭环。
装好是 1 天的事,用熟是 1 周的事,让它成为你工作流里不可替代的一环,大概需要 1-2 个月。
值不值得投入这些时间?
我的答案是:如果你每天在 AI 对话上花超过 1 小时、经常重复类似的操作、同时在用多个平台收发信息,那它对你的杠杆会很大。
如果你只是偶尔问问 AI 怎么写代码,那老实说,直接用网页版 ChatGPT 可能更适合。
工具没有好坏,只有合不合适。
官方资源
- GitHub 仓库:https://github.com/NousResearch/hermes-agent
- 官方文档:https://hermes-agent.nousresearch.com/docs/
延伸阅读:OpenClaw 社区资源
如果你在研究 AI Agent 与主流模型的工程化落地,姊妹站 OpenClaw 中文社区 也许有帮助: