Hermes 3 vs Llama 3.1 Instruct:社区微调真的能赢官方版本吗
Meta 发布 Llama 3.1 的时候,同步放出了 Instruct 版本,基本算是官方钦定的”开箱即用”方案。过了没多久,Nous Research 就在同一个基座上做了 Hermes 3。两个模型共享同一个基座(Llama 3.1)...
共 10 篇文章
Meta 发布 Llama 3.1 的时候,同步放出了 Instruct 版本,基本算是官方钦定的”开箱即用”方案。过了没多久,Nous Research 就在同一个基座上做了 Hermes 3。两个模型共享同一个基座(Llama 3.1)...
每次有开源模型发布新版本,社区里总会有人问同一个问题:和 GPT-4o 比怎么样?和 Claude 比呢? Hermes 4 是 Nous Research 最新发布的旗舰模型,基于 Llama 3.1 405B 做的微调,还引入了混合推理...
2025到2026年的开源模型格局,和两年前完全不是一个画风。那时候讨论开源模型基本就是在讨论 Llama,偶尔提一嘴 Mistral。现在?中国这边直接杀出了 Qwen 和 DeepSeek 两个重量级选手,加上老牌的 Hermes 系列...
AI Agent 从概念炒作到实际落地,中间差的就是一个靠谱的框架。2025年以来,Agent 框架的数量像雨后春笋一样冒出来,但真正经受住生产环境考验的并不多。 Hermes Agent 和 OpenClaw 是目前社区关注度最高的两个选...
讨论大模型的时候,很多人会直接比性能跑分,但容易忽略一个更底层的问题:这些模型的架构就不一样。架构的差异会直接影响模型在不同任务上的表现模式、推理速度和硬件需求。 今天拿三个代表性模型来聊聊这件事:Hermes 4 405B(Dense 架...
Function Calling(工具调用/函数调用)是让大模型从”聊天机器人”进化成”干活工具”的关键能力。能不能准确理解用户意图、正确选择工具、精确填写参数、妥善处理返回结果——这些决定了一个模型在 Agent 场景下能不能真...
Agent 框架这个赛道在过去两年经历了从”概念验证”到”实际可用”的跨越。2024年初大家还在讨论 Agent 到底是不是伪需求,到了2026年,至少在代码辅助、数据分析、工作流自动化这些场景上,Agent 已经证明了自己的价值。 框架之...
不是每个人都有一台8卡A100服务器。大部分个人开发者手里可能就一张 RTX 3090 或者 RTX 4090,显存16-24GB,要在这个硬件条件下跑大模型,7-8B 参数量基本就是天花板了。 好消息是,7-8B 这个量级的模型在过去一年...
做中文 AI 应用的时候,很多人有一个朴素的想法:中文场景当然该用中文模型。Yi(零一万物)和百川(百川智能)都是国内专注于中文的开源模型,训练数据和优化方向天然倾向中文。而 Hermes 基于 Llama 这个英文底座,中文只能算”附带”...
模型选好了,下一个问题就是:用什么框架来跑? 同一个 Hermes 模型,在不同的推理框架上跑出来的速度、资源占用、并发能力可能差好几倍。选错框架等于白白浪费硬件投入。 今天拿四个最主流的本地推理框架——Ollama、vLLM、llama....