语义搜索入门:用 Hermes 搭配嵌入模型实现智能检索
关键词搜索的局限传统的关键词搜索(比如 Elasticsearch 的 BM25)有一个根本性的问题:它只匹配字面文字,不理解语义。 用户搜”怎么解决内存溢出”,关键词搜索只能匹配包含”内存溢出”这几个字的文档。但”OOM 错误处理方法””...
共 12 篇相关文章
关键词搜索的局限传统的关键词搜索(比如 Elasticsearch 的 BM25)有一个根本性的问题:它只匹配字面文字,不理解语义。 用户搜”怎么解决内存溢出”,关键词搜索只能匹配包含”内存溢出”这几个字的文档。但”OOM 错误处理方法””...
一个模型打天下?不现实如果你只是自己用 Hermes 聊聊天、写写代码,选一个模型就够了。但在实际的产品或服务里,不同类型的请求对模型能力的要求天差地别: 用户问”今天星期几” — 8B 绰绰有余 用户说”帮我把这段代码从 Python ...
2025到2026年的开源模型格局,和两年前完全不是一个画风。那时候讨论开源模型基本就是在讨论 Llama,偶尔提一嘴 Mistral。现在?中国这边直接杀出了 Qwen 和 DeepSeek 两个重量级选手,加上老牌的 Hermes 系列...
讨论大模型的时候,很多人会直接比性能跑分,但容易忽略一个更底层的问题:这些模型的架构就不一样。架构的差异会直接影响模型在不同任务上的表现模式、推理速度和硬件需求。 今天拿三个代表性模型来聊聊这件事:Hermes 4 405B(Dense 架...
Function Calling(工具调用/函数调用)是让大模型从”聊天机器人”进化成”干活工具”的关键能力。能不能准确理解用户意图、正确选择工具、精确填写参数、妥善处理返回结果——这些决定了一个模型在 Agent 场景下能不能真...
Agent 框架这个赛道在过去两年经历了从”概念验证”到”实际可用”的跨越。2024年初大家还在讨论 Agent 到底是不是伪需求,到了2026年,至少在代码辅助、数据分析、工作流自动化这些场景上,Agent 已经证明了自己的价值。 框架之...
做中文 AI 应用的时候,很多人有一个朴素的想法:中文场景当然该用中文模型。Yi(零一万物)和百川(百川智能)都是国内专注于中文的开源模型,训练数据和优化方向天然倾向中文。而 Hermes 基于 Llama 这个英文底座,中文只能算”附带”...
为什么你需要一个「自己的」学习助手市面上的 AI 助手多到数不过来,ChatGPT、Claude、Gemini……随便挑一个都能用。那为什么还要费劲自己搭一个? 原因很现实: 第一,数据隐私。你的学习笔记、研究资料、项目文档,传到别人的服务...
内容创作者的焦虑做内容创作的人都有一个共同的痛点:产出速度跟不上需求。 写公众号的需要日更,做技术博客的要保持频率,运营社交媒体的更是恨不得一天发十条。但写作这件事就是慢,构思慢、起笔慢、改稿慢、翻译更慢。 AI 写作工具确实能帮上忙,但大...
开发者的时间都去哪了做过几年开发的人心里清楚,真正写核心业务逻辑的时间可能只占每天工作的 30% 左右。剩下的时间呢? 改 bug、写文档、review 别人的代码、处理日志告警、写测试用例、搞 CI/CD 配置……这些事情每一件...
谁说玩 AI 一定要烧钱一提到跑大模型,大部分人脑子里浮现的画面是:机房里一排排 A100 显卡,风扇嗡嗡作响,电表刷刷转。 但实际情况是,很多 AI 应用场景根本不需要这么大的算力。你只是想有一个 24 小时在线的 AI 助手,能处理一些...
客服场景为什么适合 AI如果你问我 AI 在企业落地最成熟的场景是什么,我会毫不犹豫地回答:客服。 原因很简单——客服工作的特征天然适合 AI 处理: 重复率高。大部分客户问的问题高度集中在少数几个类别里。退换货怎么操作、物流到哪了、密码怎...