从装上 Hermes Agent 到彻底玩明白：我整理的三阶段通关路线

先说结论：Hermes Agent 不是「又一个」AI 助手

前阵子有朋友问我：「2026 年了，AI Agent 框架我已经装了五六个，Hermes Agent 凭什么值得我再装一个？」

我给他的回答是：你之前装的那些是「工具」，Hermes Agent 更像一个会自己攒经验的「员工」。

它跟普通 Agent 框架最大的区别，不在于模型本身有多强——毕竟模型是外部接的，你今天用 DeepSeek 明天可以换 Claude。它的护城河在三件事上：

跨会话记忆——关掉终端再打开，它还记得你是谁、在做什么项目、上次聊到哪；
Skill 自动沉淀——你让它完成一个复杂任务，它会把成功经验自动打包成可复用的技能文件，下次同类任务直接调用，省 token 也省时间；
消息网关统一接入——一次配置，Telegram / 飞书 / 钉钉 / 微信 / Slack 等 15+ 平台同时可用，不用每个平台写一套机器人逻辑。

如果你对这些概念还没直观感受，可以先看我之前写的 Hermes Agent 完全指南——那篇偏”为什么”，这篇偏”怎么做”。

这篇文章我想做的事很简单：把从零上手到熟练使用的完整路径，按「新手 / 中级 / 高手」三个阶段拆开，每个阶段给你明确的目标、步骤和验收标准。

看完照着做，理论上 2-3 个晚上能打到「高手」门槛。

第一阶段：新手入门——让它先跑起来

目标

打开终端，完成一次和 Hermes Agent 的正常对话。就这么朴素。

三个你必须理解的核心概念

先别急着装，花 2 分钟把这几个词在脑子里过一遍，后面就不会迷路：

记忆（Memory）：跨会话保留的上下文——你的偏好、正在做的项目、常用工作环境。
技能（Skill）：日常任务执行过程中，系统自动总结出的可复用工作流，省 token、提效率。
网关（Gateway）：对接 15+ 通讯平台的消息路由层，让 AI「无处不在」。

这三个概念后面会反复出现，记住就行。

一键安装

macOS / Linux / WSL2 用户直接一条命令：

1	curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh \| bash

Windows 用户稍微麻烦一点：得先装 WSL2，再在 WSL2 终端里跑上面那条。

这条脚本背后帮你做了什么？大概是这些事：

自动检测并补齐 Python、Node.js、Git 等依赖；
创建配置目录 ~/.hermes/；
写入环境变量到 shell 配置文件。

装完别急着用，先确认环境：

1
2
3

source ~/.bashrc   # zsh 用户换成 ~/.zshrc
hermes version     # 看版本
hermes doctor      # 环境自检

hermes doctor 是个我推荐你记住的命令。后面遇到任何莫名其妙的问题，先跑它。

更细节的安装流程和疑难杂症，可以参考十分钟搞定 Hermes Agent 保姆级教程。

配置你的第一个模型

装完会自动进入配置向导。新手强烈推荐 Quick Setup。

模型选哪个？我的建议很实在：先白嫖。

国产的 DeepSeek、Kimi 免费额度都挺大，先拿它们练手。等你摸清自己的使用量，再决定要不要掏钱上 Claude / GPT-4。

配置方式有两种：

# 交互式选择
hermes model

# 或者直接设置 API Key
hermes config set OPENROUTER_API_KEY sk-or-xxxxxx

API Key 从哪儿来？各家注册方法不一样，我整理过一份 10 大 AI 服务商 API Key 配置指南，照着注册就行。

第一次对话

1	hermes chat -q "Hello! What tools do you have available?"

能收到回复，就算是装上了。

新手阶段必备命令

这几条你得记在脑子里，相当于 Hermes Agent 的「方向盘」：

命令	作用
`hermes chat`	打开交互式对话
`hermes model`	选择模型和供应商
`hermes tools`	配置启用的工具集
`hermes config set`	设置单项配置
`hermes gateway`	启动消息网关
`hermes setup`	重跑全量配置向导
`hermes doctor`	诊断运行环境
`hermes status`	查看当前配置状态
`hermes update`	升级到最新版本

验收标准

hermes doctor 全绿；
能正常和它对话、收到回复；
至少配好一个模型供应商的 API Key。

打到这里，你已经超过了大部分「看了教程没动手」的人。

第二阶段：中级进阶——让它「真的有用」

目标

这一阶段我们要解决一个很关键的问题：让 Hermes Agent 从「命令行玩具」变成「贴身助手」。

核心是两件事：

把它接到你日常用的聊天工具里（Telegram / 飞书 / 钉钉）；
打开常用工具集（搜索、抓网页、执行命令）。

Skill 系统：为什么它比普通 Agent 省 token

先讲一下 Skill 这个概念，因为很多人装完不知道这玩意怎么触发。

Hermes Agent 完成一个多步任务后，会自动评估：”这个流程是不是值得沉淀成可复用的技能？”如果值得，它会把执行过程写成一个技能文件。

自动触发 Skill 创建的三种场景：

完成了一个明显多步的复杂任务；
你明确说「把这个流程保存成技能」；
同类工作模式在多次会话中反复出现。

查看已有技能：

1	ls ~/.hermes/skills/

Skill 为什么能省 token？因为下次类似任务，它不用再把思考过程全跑一遍，直接加载技能文件即可。这部分我在 Hermes Agent Skills 深度解析里写过更细的机制。

任务一：接入 Telegram

Step 1 - 创建 Bot

在 Telegram 里搜 @BotFather，发 /newbot，按提示走完，记下 Bot Token。

Step 2 - 配置 Hermes

# 方式一：直接写进 .env
echo "TELEGRAM_BOT_TOKEN=your-bot-token" >> ~/.hermes/.env

# 方式二：用命令
hermes config set TELEGRAM_BOT_TOKEN your-bot-token

Step 3 - 开启 Telegram 适配器

编辑 ~/.hermes/config.yaml：

gateway:
  adapters:
    telegram:
      enabled: true

Step 4 - 启动网关

1	hermes gateway

Step 5 - 测试

回 Telegram 给 Bot 发 /start，能收到回复就成了。

任务二：接入飞书 / 钉钉

飞书最省事：

1 2	hermes gateway setup # 选"飞书"，按提示填 App ID / App Secret

或者手动编辑配置：

gateway:
  adapters:
    feishu:
      enabled: true
      require_mention: false
      default_group_policy: open
    dingtalk:
      enabled: true

更完整的多平台网关对比和参数含义，参考 Hermes Agent 多平台网关对接全记录。

任务三：打开常用工具集

1	hermes tools

新手期我推荐优先启用这几个：

工具	用途
`filesystem`	本地文件读写
`web_search`	联网搜索
`firecrawl`	网页抓取
`send_message`	跨平台发消息
`execute_command`	执行终端命令
`mcp`	MCP 协议扩展（下一阶段用到）

任务四：验证跨会话记忆

这个测试特别适合「感受」Hermes Agent 和普通大模型的差别：

开一次对话：「我叫小明，我喜欢用中文交流，平时在做一个叫 XYZ 的项目」；
exit 退出；
重新 hermes chat；
问它：「你还记得我是谁吗？」

如果它能复述你上次说过的关键信息，记忆系统就正常。背后的工作原理我在 Hermes Agent 记忆系统剖析里拆过。

任务五：主动触发一次 Skill 创建

1 2	hermes chat > 帮我抓取 Hacker News 首页的 AI 相关新闻，整理成中文摘要，保存到 ~/Desktop/hn-ai.md

这是一个典型的多步任务：搜索 → 抓取 → 翻译 → 写文件。任务结束后，观察 Hermes Agent 是否提示「要不要保存为技能」。

验收标准

Telegram 或飞书机器人能正常响应消息；
hermes tools 里至少启用了 3 个；
跨会话记忆验证通过；
至少触发过一次 Skill 创建。

做到这步，Hermes Agent 已经不是命令行里的小玩具了——它现在是你手机里随时能喊的私人助理。

第三阶段：高手精通——搭自进化闭环

目标

到了这一阶段，我们要做三件「进阶工程师才会做」的事：

用 MCP 协议把 Hermes Agent 接到外部世界（GitHub、数据库、自定义 API）；
用 Cron 做 7×24 自动化；
编排多个子 Agent 协作。

MCP 扩展：让 Hermes Agent 操作一切

MCP（Model Context Protocol）是一套让 Agent 调用外部工具的标准协议。接上 MCP 之后，Hermes Agent 能做的事突然变多了：

连本地数据库，直接查数据；
读写 GitHub 仓库、自动处理 Issue；
调用你自己写的 API；
精细控制文件系统。

安装 MCP 扩展：

1	uv pip install -e ".[mcp]"

配置 MCP 服务器，编辑 ~/.hermes/config.yaml：

mcp:
  servers:
    filesystem:
      command: "npx"
      args:
        - "-y"
        - "@modelcontextprotocol/server-filesystem"
        - "/path/to/your/workspace"
    github:
      command: "npx"
      args:
        - "-y"
        - "@modelcontextprotocol/server-github"

用起来就是一句话：

1	> 读一下我 GitHub 上最新的 5 条 Issue，挑出需要我本周处理的，总结发到飞书

MCP 背后的架构细节可以看 Hermes Agent 架构解析。

Cron 定时任务：7×24 自动执行

内置 Cron 调度的好处是，你不用再写一堆 shell 脚本。

查看已有定时任务：

1	ls ~/.hermes/cron/

手动编辑 ~/.hermes/cron/tasks.yaml：

tasks:
  - name: daily_news
    schedule: "0 9 * * *"        # 每天早上 9 点
    command: "总结今日 AI 新闻并发我"
    platform: telegram
    chat_id: "your-chat-id"

  - name: weekly_report
    schedule: "0 18 * * 5"       # 每周五晚 6 点
    command: "整理本周 GitHub Issue 进度，生成周报"
    platform: feishu

配好之后就不用管了，它会按时给你干活。更多 Cron 用法见 Hermes Agent Cron 定时任务实战。

多 Agent 编排：让角色各司其职

单 Agent 什么都干，难免力不从心。高手玩法是拆成几个分工明确的子 Agent：

agents:
  researcher:
    role: "调研员"
    tools: [web_search, firecrawl]
  writer:
    role: "作家"
    tools: [filesystem]
  editor:
    role: "校对员"
    tools: [filesystem]

然后在对话里直接调度：

1
2
3

> 让调研 Agent 收集最近一周 AI 行业大事件；
  让写作 Agent 整理成 800 字公众号推文；
  让校对 Agent 检查错别字和事实错误。

子 Agent 协作的机制，可以看 Hermes Agent 子 Agent 模式详解。

执行后端与安全

当 Hermes Agent 开始帮你执行终端命令，隔离环境就变得重要了——你肯定不希望它一条 rm -rf 把你桌面清了。

# Docker 容器隔离（推荐）
hermes config set terminal.backend docker

# 远程 SSH 模式
hermes config set terminal.backend ssh

安全配置的完整清单，我整理在 Hermes Agent 安全与权限配置。

数据备份：不要等丢了才后悔

~/.hermes/ 这个目录里塞了你所有会话历史、记忆、技能、配置。定期备份：

1	tar -czvf hermes-backup-$(date +%Y%m%d).tar.gz ~/.hermes/

备份覆盖的内容：

~/.hermes/sessions/ — 对话历史
~/.hermes/memories/ — 记忆数据
~/.hermes/skills/ — 技能文件
~/.hermes/config.yaml — 主配置

性能优化小技巧

监控日志（排障必备）：

1	tail -f ~/.hermes/logs/hermes.log

模型预热（降低首次调用延迟）：

1	hermes model warmup

容器化资源限制：

docker run -d \
  --name hermes-agent \
  --memory="2g" \
  --cpus="2" \
  -v ~/.hermes:/home/hermes/.hermes \
  ghcr.io/nousresearch/hermes-agent:latest \
  hermes

高手阶段验收标准

MCP 至少接通一个外部服务（GitHub 或 filesystem）；
至少一条 Cron 任务在稳定运行；
多 Agent 协作流程跑通过一次；
会做配置备份；
能看懂并手改 config.yaml 里的高级参数。

常见问题速查表

这些坑我或多或少都踩过，整理出来给你省点时间：

症状	处理办法
`hermes: command not found`	`source ~/.bashrc` 或检查 PATH 是否包含 `~/.hermes/bin`
安装后找不到命令	`ln -sf` 重建软链接到 `/usr/local/bin/`
Windows 装不上	先装 WSL2，再在 WSL 里跑安装脚本
API Key 未设置	`hermes model` 重新走配置
模型无响应	检查 API Key 额度和网络代理
更新后配置丢了	`hermes config check` 再 `hermes config migrate`
机器人不回复	看 `hermes gateway` 是否在跑，日志有没有报错
权限错误	核对 Bot Token 和平台权限授予
消息发不出	检查 chat_id 和适配器配置

遇到拿不准的问题，第一句永远是：

1	hermes doctor

它会告诉你缺什么、怎么修。

写在最后

Hermes Agent 这个项目的设计哲学挺有意思——它不追求「开箱即用的超级 AI」，而是承认 AI 需要时间学会你的工作方式，然后把这个学习过程做成一个系统化的闭环。

装好是 1 天的事，用熟是 1 周的事，让它成为你工作流里不可替代的一环，大概需要 1-2 个月。

值不值得投入这些时间？

我的答案是：如果你每天在 AI 对话上花超过 1 小时、经常重复类似的操作、同时在用多个平台收发信息，那它对你的杠杆会很大。

如果你只是偶尔问问 AI 怎么写代码，那老实说，直接用网页版 ChatGPT 可能更适合。

工具没有好坏，只有合不合适。

官方资源

GitHub 仓库：https://github.com/NousResearch/hermes-agent
官方文档：https://hermes-agent.nousresearch.com/docs/

延伸阅读：OpenClaw 社区资源

如果你在研究 AI Agent 与主流模型的工程化落地，姊妹站 OpenClaw 中文社区 也许有帮助：

目录

先说结论：Hermes Agent 不是「又一个」AI 助手

第一阶段：新手入门——让它先跑起来

目标

三个你必须理解的核心概念

一键安装

配置你的第一个模型

第一次对话

新手阶段必备命令

验收标准

第二阶段：中级进阶——让它「真的有用」

目标

Skill 系统：为什么它比普通 Agent 省 token

任务一：接入 Telegram

任务二：接入飞书 / 钉钉

任务三：打开常用工具集

任务四：验证跨会话记忆

任务五：主动触发一次 Skill 创建

验收标准

第三阶段：高手精通——搭自进化闭环

目标

MCP 扩展：让 Hermes Agent 操作一切

Cron 定时任务：7×24 自动执行

多 Agent 编排：让角色各司其职

执行后端与安全

数据备份：不要等丢了才后悔

性能优化小技巧

高手阶段验收标准

常见问题速查表

写在最后

官方资源

延伸阅读：OpenClaw 社区资源

参与讨论