Skip to content

2.为什么AI会“胡说八道”?——RAG

小故事

“小白,你过来一下!”

老板的狮子吼从办公室里传出来,震得整个技术部都抖了三抖。小白,作为技术部主管,心里咯噔一下,屁颠屁颠地跑了过去。

“小白啊,不是说现在AI很智能,无所不知吗?”老板的脸上写满了不满,他指着电脑屏幕,上面是某个大模型的对话界面。

“我问它我们公司的xxx产品怎么用,它只会说‘我是一个语言模型,无法提供具体产品信息’。”

“我又问它某个会议资料上提到的东西,它居然胡编乱造,给我搞了个子虚乌有的概念出来!”

小白尴尬地挠了挠头,心里明白这是怎么回事。他清了清嗓子,试图用最通俗的语言解释大模型的原理:“老板,是这样的,大模型就像一个超级学霸,它学的是网上的公开知识,但它没上过咱们公司的‘内部课’,所以不了解咱们的‘家事’。”

老板一听,不耐烦地打断了他:“别跟我讲什么‘内部课’!要数据是吧,好!”

说着,老板从抽屉里掏出一个U盘,重重地拍在桌上。“这里是我们公司近十年的所有资料,都在这里了。你现在,就让这个AI把这个U盘给‘吃了’!”

小白瞪大了眼睛:“老板,这……这不行啊。大模型不是这么玩的呀!”

“我不管!我不管什么怎么玩!这么简单的事情,你明天必须给我把这个U盘接进去,让它回答我的问题!”老板一锤定音,不给小白任何反驳的机会。

小白被赶出办公室,脑袋里嗡嗡作响。他看着手里的U盘,突然灵光一闪。

U盘?这不是大模型的 “场外援助” 吗?这不就是 RAG 吗?

大模型为什么会“胡说八道”?

在小白想出对策之前,让我们先来解密一下,为什么“无所不知”的大模型,也会有“胡说八道”的时候。

其实,这和它的学习方式有关。大模型就像一个超级“学霸”,通过“死记硬背”海量数据来学习。但它学到的只是“知识点”,而不是“理解”。它无法实时获取最新的信息,也无法对你的私人信息了如指掌。

这就会导致三个常见的问题:

知识时效性: 它的训练数据是旧的,它不知道最近公司开了新会、出了新产品。

知识专有性: 它不知道你公司内部的报告,也分不清哪份资料是你们的“独家机密”。

幻觉(Hallucination): 当它回答不上来时,为了“圆”一个回答,它会自己编造不存在的事实。

这些问题,都像是一根根刺,扎在小白和老板们的心头。

RAG 技术,究竟是什么“魔法”?

故事讲完了,我们来看看小白是怎么解决这个难题的。

他想到的 RAG,是 Retrieval-Augmented Generation 的缩写,直译过来就是“检索增强生成”。这听起来很拗口,但把它拆解开来就很好理解了。

它就像给大模型请了一位 “场外援助”,这个援助就是我们公司的内部资料库。简单来说,RAG 的工作流程可以分为三步,就像小白解决老板难题的三个步骤:

  1. “检索”: 当老板提出问题时,大模型不会直接回答,而是像一个侦探一样,先去公司的“U 盘”(也就是我们公司的内部知识库)里,快速找到所有和这个问题相关的资料。
  2. “增强”: 侦探把找到的这些资料,作为“证据”,连同老板的问题一起打包交给大模型。
  3. “生成”: 大模型拿到这些新鲜、准确的资料后,再结合它原本的知识,生成一个既有“干货”又有“文采”的答案。这个答案不是凭空捏造的,而是 有据可依 的。

RAG 的“超能力”与“老板的烦恼”

小白第二天就带着一个满意的方案交给了老板。老板一边听,一边点头。当小白讲到 RAG 的优点时,老板的眼睛都亮了,因为他发现小白说的每一条,都精准地戳中了他之前使用 AI 的痛点。

1. 解决“知识时效性”问题:

小白:“老板,您看,我们之前开新产品发布会,或者更新了产品定价,大模型都不知道。但有了 RAG,我们只要把最新的资料放进那个‘U 盘’里,它立刻就能学到新东西。以后您问它最新的产品信息,它再也不会说不知道了。”

2. 解决“知识专有性”问题:

小白:“还有,您之前问它公司的会议资料,它就乱编。现在,它有了我们内部的资料库,就像拥有了一个公司的‘记忆库’。您问任何关于公司内部流程、产品数据、历史报告的问题,它都能精准回答,比谁都清楚。”

3. 减少“胡说八道”:

小白:“老板,您之前说它‘胡编乱造’,这个在技术上叫‘幻觉’。大模型之所以会‘胡说八道’,是因为它知识不够,又想回答您的所有问题。而有了 RAG,它在回答之前,都会先去‘U 盘’里找‘证据’,有理有据,自然就不会瞎编了。”

老板听完,高兴地拍了拍小白的肩膀,连声称赞:“小白啊,你这个‘U 盘’接得好啊!这下它才真的像我们公司的‘员工’了!”

RAG 的“小脾气”和应用场景

当然,RAG 也不是完美的,它也有自己的“小脾气”。比如,它对资料库的质量有很高的要求,如果你的“U 盘”里放的是错误的资料,它也会给出错误的答案。此外,如何准确地检索到最相关的资料,也是一个技术挑战。

尽管如此,RAG 依然是目前最有效、最流行的 AI 应用方案之一,它让大模型从一个“只会瞎猜的学霸”,变成了一个“有理有据的知识专家”。

如今,RAG 已经广泛应用于:

  • 智能客服: 不再是只会说“请联系人工客服”的机器人,它可以根据产品手册、FAQ,准确回答用户问题。
  • 企业内部知识库: 员工可以直接问 AI“上个月的销售数据在哪份报告里?”或者“新人入职流程是什么?”,AI 都能精准作答。
  • 个人学习助手: 把你的所有学习笔记和书籍都放进去,AI 就能帮你整理、总结,甚至解答你没弄懂的问题。

总而言之,RAG 就像是给大模型装上了一个可随时更新的“外接硬盘”,让它从一个“只知其一”的学霸,进化为一个“博闻强识”的知识专家。

参考文献:

https://www.ibm.com/think/topics/retrieval-augmented-generation

https://aws.amazon.com/what-is/retrieval-augmented-generation/

https://cloud.google.com/use-cases/retrieval-augmented-generation?hl=en