大模型怎么「思考」的:Transformer 架构通俗解读
从一个问题开始你有没有想过,当你问 ChatGPT 一个问题的时候,它到底是怎么「理解」你的话并且生成回答的? 很多人的直觉是:AI 大概是像人一样,从头到尾读你的问题,理解意思,然后组织语言回答。 实际上完全不是这样。大模型的「思考」方式...
共 5 篇文章
从一个问题开始你有没有想过,当你问 ChatGPT 一个问题的时候,它到底是怎么「理解」你的话并且生成回答的? 很多人的直觉是:AI 大概是像人一样,从头到尾读你的问题,理解意思,然后组织语言回答。 实际上完全不是这样。大模型的「思考」方式...
一个简单的问题你有没有想过:为什么同样是大语言模型,GPT-3 用起来就像跟一个自说自话的人聊天,而 ChatGPT 用起来就像跟一个靠谱的助手对话? 技术上它们的底子差不多——都是 Transformer 架构、都是海量数据训练出来的。但...
一个让人哭笑不得的故事2023 年,美国一位律师在法庭上引用了 ChatGPT 提供的六个判例来支持他的论点。听起来没什么问题,直到对方律师和法官发现——这六个判例全是编造的。案件名称、法院、判决日期、判决内容,全是 AI 现编的。 这位律...
一个思想实验假设有一天,全世界只有三家公司能做 AI。所有的模型都是闭源的,没人知道里面到底是怎么运作的。你想用 AI,就得交月费调 API;你想知道模型为什么给了这个回答,对不起,商业机密;你想在它的基础上做些定制化的东西,也不行,条款不...
Agent 到底是什么「Agent」这个词在 AI 圈子里已经被用烂了。每个新产品都说自己是 Agent,每篇技术博客都在讨论 Agent 架构,连招聘信息里都开始要求「有 Agent 开发经验」。 但你要是问十个人 Agent 是什么,可...