技术深潜 2026-04-10 把 Hermes 变成 API 服务:用 FastAPI 包装推理接口 为什么要把模型包成 API本地跑 Hermes 做实验很方便,但一旦要给多个应用或多个用户使用,你就需要一个 API 服务了。 把 Hermes 包成 API 有几个好处: 统一接口 — 前端、后端、移动端都通过同一个 API 调用模型 ...