一个不太正经的开场
在硅谷那些光鲜亮丽的 AI 创业故事里,标准剧本是这样的:名校博士毕业,大厂混几年,拿到顶级 VC 的钱,租一个漂亮的办公室,开始招兵买马。
Nous Research 的故事完全不是这个套路。
它的起点是一个 Discord 聊天群,创始人当时甚至不是什么学术圈的人物,团队成员分布在全球各地,很多人互相没见过面。但就是这么一帮人,做出了开源社区里最受欢迎的模型系列之一—— Hermes。
这个故事之所以值得讲,不是因为它多么传奇,而是因为它代表了 AI 领域一种完全不同的可能性:你不需要数亿美元的融资和几千张 GPU,也能做出让整个社区认可的东西。
Ryan Teknium:一个非典型的 AI 创始人
从 Discord 到研究领袖
Ryan Teknium(网名 Teknium1)并不是传统意义上的 AI 研究者。他没有 Stanford 或 MIT 的博士学位,最早在公众视野中出现是在各种开源 AI 的 Discord 社区里。
2023 年初,大语言模型的开源运动刚刚起步。Meta 泄露(后来正式开源)了 Llama,Stanford 的 Alpaca 展示了用少量数据微调就能让模型变好用的可能性。整个社区一下子炸开了锅——原来不用数十亿的预训练成本,普通人也有机会参与模型训练。
Ryan 是最早开始认真做微调实验的一批人。但和很多人不同的是,他不满足于「把公开数据集灌进去跑一遍」就完事。他花了大量精力在数据质量上——手动审核训练数据、设计数据筛选管线、测试不同的数据配比方案。
这种对数据质量近乎偏执的追求,成为了 Nous Research 后来的核心竞争力。
早期的微调实验
2023年上半年,Ryan 和几个志同道合的人开始系统性地做微调实验。他们的第一个有影响力的成果是在 Llama 底座上训练的一个聊天模型,在当时的评测中表现优于很多同期的社区微调版本。
关键决策在这个时候就做了:一切工作完全开源。模型权重、训练数据、训练代码、实验记录,全部公开。
这和后来很多「伪开源」的做法形成了鲜明对比。有些机构号称开源,实际上只放出了模型权重,训练数据和方法论全部保密。Nous Research 从第一天起就选择了彻底透明。关于开源模型「到底开源了什么」这个话题,我在 开源模型到底「开源」了什么 那篇文章里有详细讨论。
从个人项目到正式机构
社区的力量
Ryan 的微调实验吸引了越来越多的关注,Discord 社区开始快速增长。一些有技术背景的社区成员主动贡献代码、提供数据、参与测试。
这种「社区驱动」的研发模式在传统 AI 研究中是很少见的。大厂的 AI 研究走的是自上而下的路线——管理层定方向,研究员执行,成果由公司拥有。Nous Research 的路线完全相反——社区提出需求,大家一起讨论方案,有能力的人自发贡献,成果属于所有人。
但纯粹的社区项目有一个明显的问题:缺乏持续性和专注度。大家都是业余时间在搞,今天兴头来了写几行代码,明天忙了可能就放下了。
Ryan 意识到这个问题,开始推动 Nous Research 从一个松散的社区项目向正式的研究机构转型。
正式成立
2023年中后期,Nous Research 正式注册为一家公司。团队核心成员包括:
- Ryan Teknium:创始人,主导数据策略和训练方法论
- Karan(Teknium 的早期搭档):负责基础设施和工程
- 社区中多位活跃贡献者转为正式团队成员
成立公司不是为了融资上市,而是为了能更有组织地推进研究。有了正式的架构,就可以申请计算资源、签合作协议、雇佣全职研究员。
获取计算资源
做 AI 研究最大的瓶颈之一是计算资源。训练一个像样的大模型需要大量 GPU 时间,这东西不便宜。
Nous Research 在这方面走了几条路:
- 社区捐赠和赞助:早期有不少社区成员和小型公司捐赠 GPU 时间
- 合作伙伴:和一些云计算提供商达成合作,以优惠价格获取算力
- 后续的融资:随着名气越来越大,也获得了一些投资
但即便如此,他们的计算资源和 OpenAI、Google 这些巨头比起来还是差了好几个数量级。这反过来倒逼了一个好习惯:每一次训练都要精打细算,不能浪费。这也是为什么 Nous Research 在数据质量上那么较真——当你只有有限的训练机会时,你会格外重视每一轮训练使用的数据。
Hermes 系列的诞生与成长
第一个 Hermes
Hermes 1 的发布是 Nous Research 的第一个标志性时刻。
当时的开源社区里充斥着各种质量参差不齐的微调模型,很多都是「一晚上训出来」的实验品。Hermes 1 的不同之处在于,它是经过反复迭代、严格数据筛选后的产物。
发布后的反馈很积极。用户发现 Hermes 1 在指令遵从、对话质量、回答的有用性等方面,都明显优于同期的其他社区微调版本。Hugging Face 上的下载量迅速攀升。
持续迭代
从 Hermes 1 开始,Nous Research 保持了稳定的迭代节奏。每当有新的强力底座模型发布,他们都会在相对较短的时间内推出对应的 Hermes 版本。
这种快速响应能力来源于他们已经建立起来的微调工具链和数据管线。底座换了,但核心的数据处理流程、训练方法论、评测体系都是沉淀下来的,可以快速复用。
到 Hermes 2 Pro 阶段,Nous Research 开始在模型中引入更实用的能力——函数调用、结构化输出等。这让 Hermes 从一个「好用的聊天模型」升级为一个「可以在生产环境中使用的工具」。
cocoloop社区的不少开发者就是在这个阶段开始大量使用 Hermes 的。我记得当时论坛上有人做了一个对比测试,发现 Hermes 2 Pro 在函数调用的准确率上甚至超过了一些商业模型的 API。
里程碑:Hermes 3 的发布
Hermes 3 基于 Llama 3.1,覆盖 8B 到 405B 全系列参数规模,是当时开源社区里最大规模的高质量微调项目之一。
这次发布引起了广泛关注,不仅仅是在开源社区内部。一些 AI 媒体和分析师也开始认真审视 Nous Research,将其视为开源 AI 领域的重要力量。
Hermes 3 的训练涉及了更复杂的方法——SFT 加上 DPO,数据规模和质量都上了一个台阶。Nous Research 还发布了详细的技术报告,阐述了他们的「个体对齐」(Individual Alignment)理念。
7.6 万人的 Discord 社区
说 Nous Research 的故事不能不说他们的社区,因为社区本身就是这个项目的根基。
社区的规模与构成
截至目前,Nous Research 的 Discord 服务器有超过 7.6 万名成员。这个数字放在整个 AI 领域也是很突出的——要知道,这不是什么泛泛的「AI 爱好者群」,而是一个以开源模型研究和开发为核心的专业社区。
社区成员的构成很多样:
- 独立开发者:在自己的项目中使用 Hermes 的人
- 研究人员:来自高校和研究机构,关注 Nous Research 的方法论
- 企业用户:在公司产品中部署 Hermes 的工程师
- 纯粹的爱好者:对开源 AI 感兴趣,来学习和讨论的人
社区参与研发
Nous Research 的社区不是那种只能围观的粉丝群。社区成员实际参与到了研发过程中:
- 数据贡献:社区成员贡献训练数据和数据筛选建议
- Bug 反馈:新版本发布后,社区成员是最快的测试者
- 应用场景反馈:真实使用场景中发现的问题和需求
- 文档和教程:社区成员自发编写使用文档
这种参与度在 AI 研究机构中是非常罕见的。大多数 AI 公司的社区互动仅限于「我们发布了新模型,你们来用」,而 Nous Research 的模式更接近于真正的协作开发。
开放的研讨文化
Discord 社区里经常会有深入的技术讨论。Ryan Teknium 本人也经常在社区里回答问题、分享想法、参与辩论。
有几次比较有意思的公开讨论,涉及到了模型对齐方向、数据策略、甚至是 Nous Research 的下一步计划。这种透明度在任何商业公司里都是难以想象的。
Nous Research 的独特定位
不是大厂,也不是小作坊
Nous Research 处在一个很特殊的位置:
它比个人开发者和小团队更有组织、更有资源,能持续产出高质量的成果;但它又不像 OpenAI、Anthropic、Google DeepMind 那样有数十亿美元的资金和数千名员工。
这种「中间地带」的定位反而成了优势:
- 足够灵活:不需要层层审批,看准方向就能快速行动
- 足够专注:不用追求什么都做,把微调这件事做到极致
- 足够开放:没有商业秘密的负担,可以把一切都公开
研究与实用并重
Nous Research 的另一个特点是研究和实际应用之间的平衡。
很多学术团队做出的模型好看不好用——论文发了一堆,但模型在实际场景中各种翻车。Nous Research 的每一个版本都是要经受社区用户真实使用检验的,这种压力倒逼了他们必须重视实用性。
反过来,他们也不是纯粹的「工程团队」。对新训练方法的探索、对对齐问题的思考、对数据科学的研究,都有相当的深度。Hermes 3 的技术报告就展示了他们在对齐理念上的独到见解。
面对的挑战
光说好的不行,也得聊聊难处。
计算资源的永恒焦虑
这一点前面提过了,但值得再强调。随着模型越来越大、训练方法越来越复杂,计算资源的需求是指数级增长的。Nous Research 在这方面始终面临压力。
人才竞争
AI 领域的人才竞争异常激烈。大厂可以开出七位数的年薪,Nous Research 很难在薪资上直接竞争。好在,开源理念本身就是一种筛选机制——真正被吸引过来的人,往往是认同开源价值观的人,这反而保证了团队的凝聚力。
商业化探索
纯粹做开源很难维持长期运营。Nous Research 也在探索商业化的路径,包括企业级服务、定制化微调等。如何在坚持开源的同时实现商业可持续,是一个需要长期平衡的问题。
对整个行业的影响
Nous Research 的存在证明了几件事:
第一,开源 AI 研究是可行的。 你不需要是 Google 才能做出好模型。高质量的数据 + 正确的方法论 + 专注的团队,可以弥补资源上的差距。
第二,社区驱动的研究模式有其独特价值。 七万多人的社区提供了大厂内部团队无法获得的多样性视角和即时反馈。
第三,对齐不必等同于过度限制。 Hermes 的「个体对齐」理念为整个行业提供了另一种思路。
在cocoloop社区里,Nous Research 经常被拿来作为「小团队做大事」的典型案例讨论。确实,在这个越来越资本密集的赛道上,他们用行动证明了另一种可能。
从 Discord 群到 AI 前沿
回到开头的那个问题:一群 Discord 聊天群里的人,怎么就做出了开源社区最火的模型之一?
答案其实并不复杂:
- 找对了切入点(高质量微调而非从零预训练)
- 坚持了正确的理念(数据质量优先、完全开源)
- 建立了真正的社区(不是粉丝群,而是协作网络)
- 保持了持续迭代的节奏(不掉队,不摆烂)
这些听起来都不是什么惊天动地的策略,但能同时做到并坚持下来的团队,在这个浮躁的行业里其实并不多。
Nous Research 的故事还在继续。随着 Hermes 4.3 和后续版本的推出,他们在开源 AI 领域的影响力仍在扩大。对于任何关注大模型发展的人来说,这是一个值得持续跟踪的团队。
如果你想深入了解 Hermes 模型本身,可以从 Hermes 是什么 这篇开始读,会对整个模型系列有一个完整的认识。