Hermes 4.3 与 Psyche 网络:去中心化训练真能行?
2025 年,Nous Research 做了一件很多人没预料到的事——他们没有继续用传统的集中式 GPU 集群来训练下一代 Hermes,而是选择了一条完全不同的路:用去中心化的 Psyche 训练网络来完成 Hermes 4.3 的训练...
2025 年,Nous Research 做了一件很多人没预料到的事——他们没有继续用传统的集中式 GPU 集群来训练下一代 Hermes,而是选择了一条完全不同的路:用去中心化的 Psyche 训练网络来完成 Hermes 4.3 的训练...
在大模型的发展历程中,有些模型因为参数量大而被记住,有些因为跑分高而被记住。Hermes 2 Pro 被记住的理由不太一样——它是开源社区第一批把 Function Calling(函数调用/工具调用)做到真正可用的模型之一。 今...
如果要在开源大模型领域选一个”连续剧”,Hermes 系列绝对排得上号。从 2023 年中到 2025 年,Ryan Teknium 带领的 Nous Research 团队一路迭代,把 Hermes 从一个小众微调模型做成了下载量超过 3...
当一个 AI 模型拒绝回答你的正常问题时,你会是什么感受? 可能你只是想问一个关于化学反应的问题,模型却说”我不能提供可能被用于制造危险物质的信息”。或者你想写一个虚构的犯罪小说场景,模型告诉你”我无法协助创作涉及暴力的内容”。 这种现象叫...
在大模型领域有句老话:”模型好不好,七分靠数据,三分靠算法。” 这话可能有点夸张,但数据的重要性确实怎么强调都不为过。 Hermes 系列能从一众微调模型中脱颖而出,训练数据的质量是最关键的因素之一。今天就来聊聊 Hermes 背后的数据工...
上下文窗口(Context Window)可能是普通用户最容易感知到的一个模型参数。你往对话框里粘贴一篇长文章,模型说”太长了处理不了”——这就是上下文窗口的限制。 Hermes 系列从最初的 2K 一路扩展到 512K,每次扩展背后都涉及...
2024 年 9 月,OpenAI 发布 o1 模型,整个行业第一次见识到了”让模型花时间想一想”能带来多大的提升。o1 在数学竞赛题上的表现让一堆研究者大呼看不懂——一个语言模型怎么能做对这么难的数学题? 答案就两个字:推理。 o1 在生...
每次有新模型发布,铺天盖地的跑分数据就来了:MATH-500 得了多少分、AIME 多少分、GPQA 多少分……一堆缩写看得人头大。 这些测试到底在测什么?Hermes 4 的那些分数代表什么水平?普通人应该怎么看待这些跑分? 这篇文章尽量...
先回答一个最基本的问题2026 年了,AI Agent 框架一抓一大把。AutoGPT、CrewAI、LangGraph……每隔几周就冒出一个新的。那 Hermes Agent 凭什么值得你花时间了解? 我的回答很直接:因为它会自己变强。 ...
别被「Agent 框架」这四个字吓到很多人一听到「AI Agent 框架」就觉得安装过程肯定很复杂——要装一堆依赖、配一堆环境变量、折腾半天 Docker。 Hermes Agent 不是这样的。它的安装体验更接近装一个 CLI 工具:一条...
从一个简单的问题开始当你对 Hermes Agent 说「帮我查一下当前服务器的内存使用情况」,从你按下回车到收到回复,中间到底发生了什么? 这个看似简单的过程,背后是一套精心设计的推理-执行循环。理解这套机制,能帮你更好地使用 Herme...
用一个类比开场想象你新入职一家公司,第一天什么都不熟悉,完成一个部署任务要查各种文档、问同事、反复试错,可能折腾大半天。但你是个有心人——做完之后,你写了一篇详细的操作笔记存在自己的知识库里。 三个月后,新来一个同事问你怎么做同样的部署。你...