📚
你问 ChatGPT:"我们公司上个月的销售额是多少?"
它会一本正经地编一个数字给你
因为它的知识在训练时就冻结了——你公司的数据它根本没见过
怎么让 AI 回答它"不知道"的问题,还不瞎编?
↓ 答案叫 RAG,3 分钟搞懂
🤖 AI

RAG

Retrieval-Augmented Generation · 检索增强生成

RAG 就是给 AI 配了一个图书管理员——先查资料,再回答。
🧒 极简版🧑 场景版🎓 精准版

🧒 极简版

想象你在考试,但这次允许翻书

不用 RAG 的 AI = 闭卷考试:只能靠记忆回答,记不住就瞎编。
用了 RAG 的 AI = 开卷考试:回答之前先翻书找到相关内容,然后根据书上的内容来回答。

答案更准确,而且能告诉你"这个答案出自哪本书第几页"

🧑 场景版

你是客服经理,公司有 500 页产品手册。你想让 AI 帮你回答客户问题。

问题:AI 从没读过你的产品手册——它的训练数据里没有。

RAG 的做法:
1. 把 500 页手册切成小块存进"知识库"
2. 客户问"这个产品支持蓝牙吗?"
3. 系统先去知识库搜索和"蓝牙"相关的段落
4. 把找到的段落塞给 AI 当参考资料
5. AI 根据这些参考资料来回答——不用猜,有据可查

🎓 精准版

RAG = Retrieval-Augmented Generation,由 Meta AI(2020)提出。

技术架构:
· Indexing:文档 → 切片 → Embedding → 存入向量数据库
· Retrieval:用户 Query → Embedding → 向量相似度搜索 → Top-K 相关片段
· Generation:将检索到的片段注入 Prompt → LLM 生成带引用的回答

核心优势:不需要重新训练模型(Fine-tuning 成本高),只需要把知识存入检索库,即插即用。

🧪 动手试试:有没有 RAG 的区别

同一个问题,看 AI 在"闭卷"和"开卷"模式下的回答差异

用户问:"我们公司的退货政策是什么?15 天内可以退吗?"
❌ 无 RAG · AI 靠记忆回答
一般来说,大多数公司提供 7-30 天的退货政策。如果您的公司遵循行业惯例,15 天内应该是可以退货的。建议您查看公司官网或联系客服确认具体条款。

⚠️ 问题:AI 在猜!它根本不知道你公司的政策,但说得像真的一样。

🔄 RAG 怎么工作的?

点击每一步查看详情

用户提问发送问题
🔍检索搜索知识库
📄获取资料找到相关片段
📎组装 Prompt问题+资料打包
🧠AI 生成回答带引用的准确回答
用户问了一个问题——比如"退货政策是什么?"这个问题会被发送到 RAG 系统。

📦 拆开看

点击卡片翻转

📚知识库点我翻转 ↻
把公司文档、产品手册、FAQ 等切成小块,转为数学向量,存入向量数据库。就像图书馆把书分类上架。📖 图书馆的书架
🔍检索器点我翻转 ↻
根据用户的问题,去知识库里找最相关的几个片段。不是关键词匹配,而是"语义搜索"——理解意思去找,不是逐字匹配。👩‍💼 图书管理员
🧠生成器点我翻转 ↻
收到问题 + 参考资料后,AI 根据资料生成回答。有资料可查,就不会瞎编。还能注明"这个答案来自哪个文档"。📝 开卷考试的学生

⚠️ 别搞混

❌ 很多人以为
RAG 就是给 AI "喂数据"让它学会。
✅ 其实是
RAG 不修改模型本身——它只是在回答时临时给 AI 看参考资料。就像开卷考试不会让你更聪明,只是给你翻书的权利。
❌ 很多人以为
有了 RAG,AI 就不会编造信息了。
✅ 其实是
RAG 大幅减少幻觉,但如果检索到的资料本身不准确、或者检索没找到相关内容,AI 仍然可能编造。RAG 减少幻觉,不消灭幻觉。

📏 类比的边界

⚠️开卷考试翻的是纸质书,RAG 用的是"语义搜索"——按意思找而不是按关键词找,比翻书高效得多。
⚠️考试翻书能看到完整章节,RAG 只检索最相关的几个片段——可能遗漏上下文。

🔗 相关概念

✅ 秒测

1RAG 的核心原理是什么?
A. 重新训练模型,让它学会新知识
B. 回答前先检索相关资料,带着资料回答
2RAG 和 Fine-tuning(微调)的最大区别是什么?
A. 没区别,都是让 AI 学新知识
B. RAG 不改模型只加参考资料,Fine-tuning 是修改模型本身
3有了 RAG,AI 就完全不会编造信息了吗?
A. 是的,有资料参考就不会编了
B. 不是,检索质量差或资料不全时仍可能编造

手机端可长按图片保存到相册