开源 AI 的意义:为什么世界需要 Hermes 这样的项目

从技术民主化、安全审计、学术进步、生态多样性等角度,论述开源 AI 的核心价值和 Hermes 在其中的独特位置。

目录

  1. 一个思想实验
  2. 技术民主化:让 AI 不只是大公司的特权
  3. 安全与可审计性:信任需要透明
    1. 可审计的训练过程
    2. 社区驱动的安全研究
    3. 可验证的行为
  4. 学术进步:科学需要可复现性
  5. 生态多样性:不要把鸡蛋放在一个篮子里
  6. Hermes 在开源生态中的定位
  7. 开源 AI 面临的挑战
    1. 资金可持续性
    2. 滥用风险
    3. 与商业模型的能力差距
  8. 你能做什么
  9. 总结

一个思想实验

假设有一天,全世界只有三家公司能做 AI。所有的模型都是闭源的,没人知道里面到底是怎么运作的。你想用 AI,就得交月费调 API;你想知道模型为什么给了这个回答,对不起,商业机密;你想在它的基础上做些定制化的东西,也不行,条款不允许。

这听起来像反乌托邦小说的设定,但如果没有开源 AI 运动,它可能就是我们正在走向的现实。

开源 AI 不是一种技术选择,它是一种关乎整个行业生态的路线选择。这篇文章聊聊为什么开源 AI 重要,以及为什么像 Hermes 这样的项目对整个 AI 生态不可或缺。

技术民主化:让 AI 不只是大公司的特权

训练一个前沿大模型需要多少钱?

GPT-4 的训练成本估计在一亿美元量级。Llama 3 405B 的训练据说用了超过 16000 张 H100 GPU。这种投入,全球能负担得起的公司一只手数得过来。

如果没有开源模型,小公司、创业团队、独立开发者、学术研究者就只能做 API 调用的「消费者」——受制于大公司的定价策略、使用条款、功能限制。

开源模型改变了这个格局:

Meta 开源了 Llama 系列,让任何人都能在自己的硬件上运行一个性能接近商业模型的大模型。

Nous Research 做了 Hermes 系列,在 Llama 等基座模型之上做高质量微调,让开源模型不仅能跑,而且好用。关于 Hermes 的详细介绍,可以看 Hermes 是什么

社区开发者做了各种量化版本,让大模型能在消费级硬件上运行,把门槛从「你得有一堆 GPU」降到了「你有一台还行的笔记本就够」。

这条链路的每一环都在做同样的事情:降低门槛,让更多人能用上、用好 AI

技术民主化不是一句口号。它意味着一个大学生可以在宿舍里用 Hermes 做自己的 AI 研究,一个创业者可以在不烧钱的情况下做出 AI 产品原型,一个发展中国家的开发者可以不受 API 调用的地域限制来构建自己的应用。

安全与可审计性:信任需要透明

你信任一个你看不到源码的 AI 系统吗?

闭源模型就像一个黑箱。你不知道它的训练数据里有没有偏见,不知道它的对齐过程是怎么做的,不知道它在什么情况下会出问题。你只能相信开发公司的声明,而这些声明往往语焉不详。

开源模型的透明性在安全方面有几个独特的价值:

可审计的训练过程

开源项目通常会公开训练数据的构成、微调的方法论、评估的指标。研究者可以复现结果、检验声明、发现潜在问题。

Hermes 3 的技术报告就详细披露了模型的训练流程和设计决策。如果你感兴趣可以看 Hermes 3 技术报告解读

社区驱动的安全研究

当模型的权重是公开的时候,全世界的安全研究者都可以去研究它的弱点。红队测试、对抗攻击研究、偏见检测——这些工作不再局限于模型开发公司的内部团队。

几千个独立研究者的审计能力,远超任何单一公司的安全团队。这跟软件安全领域的经验完全一致——开源软件的安全漏洞被发现和修复的速度,长期来看比闭源软件快得多。

可验证的行为

你可以在自己的环境中测试开源模型对各种输入的反应,而不需要依赖开发公司提供的基准测试结果(这些结果可能经过挑选)。

你可以构建自己的评估基准,检验模型在你关心的特定场景中的表现,而不是被通用排行榜上的数字所误导。

学术进步:科学需要可复现性

科学研究的一个基本原则是可复现性——你发表的结果,别人要能按照你的方法复现出来。

在 AI 领域,如果核心模型是闭源的,大量的研究就变得不可复现。你在 GPT-4 上跑出来的实验结果,别人没法验证——因为没人知道你用的那个 API 背后的模型是不是跟三个月前一样(商业模型经常在不通知用户的情况下更新)。

开源模型为学术研究提供了稳定的基础设施:

固定的模型版本。Hermes 3 Llama 3.1 8B 就是 Hermes 3 Llama 3.1 8B,不会偷偷更新。你今天跑的实验,明年还能复现。

可以深入分析。你可以检查模型的每一层在做什么,分析注意力模式,研究内部表征。闭源模型你只能看输入和输出,中间过程完全是黑箱。

可以在上面做实验。微调、剪枝、蒸馏、量化——各种技术研究都需要访问模型权重。没有开源模型,这些研究根本无法开展。

大量的 AI 学术论文的实验都是在 Llama、Mistral 等开源模型上完成的。这些研究反过来又推动了整个领域的进步,包括对齐技术、推理优化、小模型能力提升等。

生态多样性:不要把鸡蛋放在一个篮子里

如果全世界都依赖同一家公司的 AI 服务,会发生什么?

2024 年 OpenAI 的管理层动荡就给了我们一个预警。当整个行业的核心基础设施集中在少数公司手中,任何一次公司内部的变故——无论是管理层换血、商业策略转向还是技术方向调整——都可能对数以万计的下游用户和企业造成冲击。

开源 AI 为这个生态提供了多样性和韧性:

供应商中立。你的应用基于开源模型构建,就不会被任何单一供应商绑定。API 价格涨了?换一个。服务条款变了?自己跑。公司倒了?模型权重还在你的硬盘上。

创新来源多元。不同的开源团队有不同的技术路线和设计哲学。Nous Research 专注于高质量微调和 Agent 能力,Mistral 专注于推理效率和小模型性能,Meta 专注于通用基座能力。这种多样性催生了更多的创新。

适应性更强。面对不同的语言、文化、行业需求,开源社区可以迅速做出本地化和行业化的适配。一个公司不可能照顾到所有人的需求,但一个全球化的社区可以。

Hermes 在开源生态中的定位

说了这么多开源 AI 的宏观意义,具体到 Hermes 这个项目,它在开源生态中扮演什么角色?

微调的标杆。Hermes 系列证明了高质量微调的价值——同样的基座模型,经过精心微调之后,在很多任务上可以超越更大的通用模型。这给整个社区树立了一个标杆:不一定要烧钱训练更大的模型,好的数据和好的微调策略同样重要。

Agent 能力的先驱。Hermes 3 是最早原生支持 Function Calling 和工具调用的开源模型之一。这个方向后来被验证为非常有价值,越来越多的模型开始跟进。关于 Agent 的概念和发展,可以看看 AI Agent 概念扫盲

社区协作的样本。Nous Research 的运作方式——核心团队主导方向、社区贡献数据和反馈、完全开放权重和技术报告——为开源 AI 项目的组织形式提供了一个成功案例。

无审查的选择。在商业模型越来越倾向于保守的内容策略时,Hermes 提供了一个更开放的选择。这不是说它鼓励有害内容——而是给用户更多的控制权,让用户自己决定应用场景中的内容边界。

开源 AI 面临的挑战

开源 AI 不是没有问题和挑战。

资金可持续性

训练和微调模型需要大量的计算资源。开源项目的资金来源一直是个挑战。Nous Research 通过多种方式维持运营——包括提供商业化的部署服务和咨询——但这个模式能否长期可持续还有待验证。

滥用风险

开源意味着任何人都能使用模型,包括恶意使用者。有人可能用开源模型来生成虚假信息、做社会工程攻击、或者其他不良用途。

但这个论点同样适用于几乎所有技术——互联网、加密技术、3D 打印。技术本身是中性的,关键在于社会制度和法律框架的配套。

而且,开源的透明性实际上有助于开发对抗工具。你能看到模型是怎么工作的,就能更好地检测和防范恶意使用。

与商业模型的能力差距

坦白说,目前最强的商业模型在整体能力上仍然领先于最强的开源模型。这个差距在缩小,但还没有完全消失。

不过这个差距主要体现在通用排行榜上。在特定的垂直场景里,经过针对性微调的开源模型完全可以跟商业模型打平甚至胜出。这也是 Hermes 这类微调项目的价值所在——在特定方向上做到极致。

你能做什么

作为 AI 技术的使用者和开发者,你可以从以下几个方面支持开源 AI 生态:

使用开源模型。最直接的支持就是用它。用的人越多,社区越活跃,模型就会越来越好。

反馈问题。在使用中发现了模型的问题——输出质量不好、特定场景表现差、有偏见倾向——提交 issue 或者在社区里讨论。这些反馈是模型改进的重要输入。

贡献数据。如果你有高质量的标注数据或者评估数据集,贡献给开源社区。数据是模型改进的燃料。

分享经验。写文章、做教程、回答问题。帮助更多人上手开源模型,降低使用门槛。

在项目中选择开源方案。在商业项目中优先评估开源模型是否满足需求。如果满足,优先选择开源方案——这既降低了你的成本和风险,也为开源生态投了一票。

总结

开源 AI 的意义不仅仅在于省钱或者方便。它关乎技术的民主化、安全的透明度、科学的可复现性、生态的多样性。

Hermes 这样的项目之所以重要,不只是因为它是一个好用的模型,更因为它代表了一种技术发展的路径——开放、透明、社区驱动、持续迭代。

在 AI 技术即将深入影响每个人生活的时代,保持这条路径的活力,可能比我们现在意识到的更加重要。

有更多关于开源 AI 的想法,欢迎来 cocoloop 社区 一起聊聊。

参与讨论

对这篇文章有疑问或想法?cocoloop 社区有不少开发者在讨论 Hermes 相关话题,欢迎加入交流。

前往 cocoloop 社区 →