开源 AI 的意义：为什么世界需要 Hermes 这样的项目

一个思想实验

假设有一天，全世界只有三家公司能做 AI。所有的模型都是闭源的，没人知道里面到底是怎么运作的。你想用 AI，就得交月费调 API；你想知道模型为什么给了这个回答，对不起，商业机密；你想在它的基础上做些定制化的东西，也不行，条款不允许。

这听起来像反乌托邦小说的设定，但如果没有开源 AI 运动，它可能就是我们正在走向的现实。

开源 AI 不是一种技术选择，它是一种关乎整个行业生态的路线选择。这篇文章聊聊为什么开源 AI 重要，以及为什么像 Hermes 这样的项目对整个 AI 生态不可或缺。

技术民主化：让 AI 不只是大公司的特权

训练一个前沿大模型需要多少钱？

GPT-4 的训练成本估计在一亿美元量级。Llama 3 405B 的训练据说用了超过 16000 张 H100 GPU。这种投入，全球能负担得起的公司一只手数得过来。

如果没有开源模型，小公司、创业团队、独立开发者、学术研究者就只能做 API 调用的「消费者」——受制于大公司的定价策略、使用条款、功能限制。

开源模型改变了这个格局：

Meta 开源了 Llama 系列，让任何人都能在自己的硬件上运行一个性能接近商业模型的大模型。

Nous Research 做了 Hermes 系列，在 Llama 等基座模型之上做高质量微调，让开源模型不仅能跑，而且好用。关于 Hermes 的详细介绍，可以看 Hermes 是什么。

社区开发者做了各种量化版本，让大模型能在消费级硬件上运行，把门槛从「你得有一堆 GPU」降到了「你有一台还行的笔记本就够」。

这条链路的每一环都在做同样的事情：降低门槛，让更多人能用上、用好 AI。

技术民主化不是一句口号。它意味着一个大学生可以在宿舍里用 Hermes 做自己的 AI 研究，一个创业者可以在不烧钱的情况下做出 AI 产品原型，一个发展中国家的开发者可以不受 API 调用的地域限制来构建自己的应用。

安全与可审计性：信任需要透明

你信任一个你看不到源码的 AI 系统吗？

闭源模型就像一个黑箱。你不知道它的训练数据里有没有偏见，不知道它的对齐过程是怎么做的，不知道它在什么情况下会出问题。你只能相信开发公司的声明，而这些声明往往语焉不详。

开源模型的透明性在安全方面有几个独特的价值：

可审计的训练过程

开源项目通常会公开训练数据的构成、微调的方法论、评估的指标。研究者可以复现结果、检验声明、发现潜在问题。

Hermes 3 的技术报告就详细披露了模型的训练流程和设计决策。如果你感兴趣可以看 Hermes 3 技术报告解读。

社区驱动的安全研究

当模型的权重是公开的时候，全世界的安全研究者都可以去研究它的弱点。红队测试、对抗攻击研究、偏见检测——这些工作不再局限于模型开发公司的内部团队。

几千个独立研究者的审计能力，远超任何单一公司的安全团队。这跟软件安全领域的经验完全一致——开源软件的安全漏洞被发现和修复的速度，长期来看比闭源软件快得多。

可验证的行为

你可以在自己的环境中测试开源模型对各种输入的反应，而不需要依赖开发公司提供的基准测试结果（这些结果可能经过挑选）。

你可以构建自己的评估基准，检验模型在你关心的特定场景中的表现，而不是被通用排行榜上的数字所误导。

学术进步：科学需要可复现性

科学研究的一个基本原则是可复现性——你发表的结果，别人要能按照你的方法复现出来。

在 AI 领域，如果核心模型是闭源的，大量的研究就变得不可复现。你在 GPT-4 上跑出来的实验结果，别人没法验证——因为没人知道你用的那个 API 背后的模型是不是跟三个月前一样（商业模型经常在不通知用户的情况下更新）。

开源模型为学术研究提供了稳定的基础设施：

固定的模型版本。Hermes 3 Llama 3.1 8B 就是 Hermes 3 Llama 3.1 8B，不会偷偷更新。你今天跑的实验，明年还能复现。

可以深入分析。你可以检查模型的每一层在做什么，分析注意力模式，研究内部表征。闭源模型你只能看输入和输出，中间过程完全是黑箱。

可以在上面做实验。微调、剪枝、蒸馏、量化——各种技术研究都需要访问模型权重。没有开源模型，这些研究根本无法开展。

大量的 AI 学术论文的实验都是在 Llama、Mistral 等开源模型上完成的。这些研究反过来又推动了整个领域的进步，包括对齐技术、推理优化、小模型能力提升等。

生态多样性：不要把鸡蛋放在一个篮子里

如果全世界都依赖同一家公司的 AI 服务，会发生什么？

2024 年 OpenAI 的管理层动荡就给了我们一个预警。当整个行业的核心基础设施集中在少数公司手中，任何一次公司内部的变故——无论是管理层换血、商业策略转向还是技术方向调整——都可能对数以万计的下游用户和企业造成冲击。

开源 AI 为这个生态提供了多样性和韧性：

供应商中立。你的应用基于开源模型构建，就不会被任何单一供应商绑定。API 价格涨了？换一个。服务条款变了？自己跑。公司倒了？模型权重还在你的硬盘上。

创新来源多元。不同的开源团队有不同的技术路线和设计哲学。Nous Research 专注于高质量微调和 Agent 能力，Mistral 专注于推理效率和小模型性能，Meta 专注于通用基座能力。这种多样性催生了更多的创新。

适应性更强。面对不同的语言、文化、行业需求，开源社区可以迅速做出本地化和行业化的适配。一个公司不可能照顾到所有人的需求，但一个全球化的社区可以。

Hermes 在开源生态中的定位

说了这么多开源 AI 的宏观意义，具体到 Hermes 这个项目，它在开源生态中扮演什么角色？

微调的标杆。Hermes 系列证明了高质量微调的价值——同样的基座模型，经过精心微调之后，在很多任务上可以超越更大的通用模型。这给整个社区树立了一个标杆：不一定要烧钱训练更大的模型，好的数据和好的微调策略同样重要。

Agent 能力的先驱。Hermes 3 是最早原生支持 Function Calling 和工具调用的开源模型之一。这个方向后来被验证为非常有价值，越来越多的模型开始跟进。关于 Agent 的概念和发展，可以看看 AI Agent 概念扫盲。

社区协作的样本。Nous Research 的运作方式——核心团队主导方向、社区贡献数据和反馈、完全开放权重和技术报告——为开源 AI 项目的组织形式提供了一个成功案例。

无审查的选择。在商业模型越来越倾向于保守的内容策略时，Hermes 提供了一个更开放的选择。这不是说它鼓励有害内容——而是给用户更多的控制权，让用户自己决定应用场景中的内容边界。

开源 AI 面临的挑战

开源 AI 不是没有问题和挑战。

资金可持续性

训练和微调模型需要大量的计算资源。开源项目的资金来源一直是个挑战。Nous Research 通过多种方式维持运营——包括提供商业化的部署服务和咨询——但这个模式能否长期可持续还有待验证。

滥用风险

开源意味着任何人都能使用模型，包括恶意使用者。有人可能用开源模型来生成虚假信息、做社会工程攻击、或者其他不良用途。

但这个论点同样适用于几乎所有技术——互联网、加密技术、3D 打印。技术本身是中性的，关键在于社会制度和法律框架的配套。

而且，开源的透明性实际上有助于开发对抗工具。你能看到模型是怎么工作的，就能更好地检测和防范恶意使用。

与商业模型的能力差距

坦白说，目前最强的商业模型在整体能力上仍然领先于最强的开源模型。这个差距在缩小，但还没有完全消失。

不过这个差距主要体现在通用排行榜上。在特定的垂直场景里，经过针对性微调的开源模型完全可以跟商业模型打平甚至胜出。这也是 Hermes 这类微调项目的价值所在——在特定方向上做到极致。

你能做什么

作为 AI 技术的使用者和开发者，你可以从以下几个方面支持开源 AI 生态：

使用开源模型。最直接的支持就是用它。用的人越多，社区越活跃，模型就会越来越好。

反馈问题。在使用中发现了模型的问题——输出质量不好、特定场景表现差、有偏见倾向——提交 issue 或者在社区里讨论。这些反馈是模型改进的重要输入。

贡献数据。如果你有高质量的标注数据或者评估数据集，贡献给开源社区。数据是模型改进的燃料。

分享经验。写文章、做教程、回答问题。帮助更多人上手开源模型，降低使用门槛。

在项目中选择开源方案。在商业项目中优先评估开源模型是否满足需求。如果满足，优先选择开源方案——这既降低了你的成本和风险，也为开源生态投了一票。

总结

开源 AI 的意义不仅仅在于省钱或者方便。它关乎技术的民主化、安全的透明度、科学的可复现性、生态的多样性。

Hermes 这样的项目之所以重要，不只是因为它是一个好用的模型，更因为它代表了一种技术发展的路径——开放、透明、社区驱动、持续迭代。

在 AI 技术即将深入影响每个人生活的时代，保持这条路径的活力，可能比我们现在意识到的更加重要。

有更多关于开源 AI 的想法，欢迎来 cocoloop 社区一起聊聊。