入门百科 2026-04-14 Hermes 的「个体对齐」哲学:它为什么不轻易拒绝你 从一个让人抓狂的体验说起你有没有遇到过这种情况: 你问 AI 一个完全正常的问题,比如「帮我写一个小说里的反派角色独白」,结果 AI 回复你: 「作为一个AI语言模型,我不能生成可能被视为有害或冒犯性的内容……」 或者你问「感冒了应该吃...
科普拓展 2026-04-08 RLHF 到底在干嘛:人类反馈强化学习的前世今生 一个简单的问题你有没有想过:为什么同样是大语言模型,GPT-3 用起来就像跟一个自说自话的人聊天,而 ChatGPT 用起来就像跟一个靠谱的助手对话? 技术上它们的底子差不多——都是 Transformer 架构、都是海量数据训练出来的。但...