📚

你问 ChatGPT："我们公司上个月的销售额是多少？"
它会一本正经地编一个数字给你。
因为它的知识在训练时就冻结了——你公司的数据它根本没见过。
怎么让 AI 回答它"不知道"的问题，还不瞎编？

↓ 答案叫 RAG，3 分钟搞懂

🤖 AI

RAG

Retrieval-Augmented Generation · 检索增强生成

RAG 就是给 AI 配了一个图书管理员——先查资料，再回答。

🎚️ 理解深度

🧒 极简版🧑 场景版🎓 精准版

🧒 极简版

想象你在考试，但这次允许翻书。

不用 RAG 的 AI = 闭卷考试：只能靠记忆回答，记不住就瞎编。
用了 RAG 的 AI = 开卷考试：回答之前先翻书找到相关内容，然后根据书上的内容来回答。

答案更准确，而且能告诉你"这个答案出自哪本书第几页"。

🧑 场景版

你是客服经理，公司有 500 页产品手册。你想让 AI 帮你回答客户问题。

问题：AI 从没读过你的产品手册——它的训练数据里没有。

RAG 的做法：
1. 把 500 页手册切成小块存进"知识库"
2. 客户问"这个产品支持蓝牙吗？"
3. 系统先去知识库搜索和"蓝牙"相关的段落
4. 把找到的段落塞给 AI 当参考资料
5. AI 根据这些参考资料来回答——不用猜，有据可查

🎓 精准版

RAG = Retrieval-Augmented Generation，由 Meta AI（2020）提出。

技术架构：
· Indexing：文档 → 切片 → Embedding → 存入向量数据库
· Retrieval：用户 Query → Embedding → 向量相似度搜索 → Top-K 相关片段
· Generation：将检索到的片段注入 Prompt → LLM 生成带引用的回答

核心优势：不需要重新训练模型（Fine-tuning 成本高），只需要把知识存入检索库，即插即用。

🧪 动手试试：有没有 RAG 的区别

同一个问题，看 AI 在"闭卷"和"开卷"模式下的回答差异

用户问："我们公司的退货政策是什么？15 天内可以退吗？"

❌ 无 RAG · AI 靠记忆回答

一般来说，大多数公司提供 7-30 天的退货政策。如果您的公司遵循行业惯例，15 天内应该是可以退货的。建议您查看公司官网或联系客服确认具体条款。

⚠️ 问题：AI 在猜！它根本不知道你公司的政策，但说得像真的一样。

🔄 RAG 怎么工作的？

点击每一步查看详情

❓用户提问发送问题

🔍检索搜索知识库

📄获取资料找到相关片段

📎组装 Prompt问题+资料打包

🧠AI 生成回答带引用的准确回答

用户问了一个问题——比如"退货政策是什么？"这个问题会被发送到 RAG 系统。

📦 拆开看

点击卡片翻转

📚知识库点我翻转 ↻

把公司文档、产品手册、FAQ 等切成小块，转为数学向量，存入向量数据库。就像图书馆把书分类上架。📖 图书馆的书架

🔍检索器点我翻转 ↻

根据用户的问题，去知识库里找最相关的几个片段。不是关键词匹配，而是"语义搜索"——理解意思去找，不是逐字匹配。👩‍💼 图书管理员

🧠生成器点我翻转 ↻

收到问题 + 参考资料后，AI 根据资料生成回答。有资料可查，就不会瞎编。还能注明"这个答案来自哪个文档"。📝 开卷考试的学生

⚠️ 别搞混

❌ 很多人以为

RAG 就是给 AI "喂数据"让它学会。

✅ 其实是

RAG 不修改模型本身——它只是在回答时临时给 AI 看参考资料。就像开卷考试不会让你更聪明，只是给你翻书的权利。

❌ 很多人以为

有了 RAG，AI 就不会编造信息了。

✅ 其实是

RAG 大幅减少幻觉，但如果检索到的资料本身不准确、或者检索没找到相关内容，AI 仍然可能编造。RAG 减少幻觉，不消灭幻觉。

📏 类比的边界

⚠️开卷考试翻的是纸质书，RAG 用的是"语义搜索"——按意思找而不是按关键词找，比翻书高效得多。

⚠️考试翻书能看到完整章节，RAG 只检索最相关的几个片段——可能遗漏上下文。

🔗 相关概念

✅ 秒测

1RAG 的核心原理是什么？

A. 重新训练模型，让它学会新知识

B. 回答前先检索相关资料，带着资料回答

2RAG 和 Fine-tuning（微调）的最大区别是什么？

A. 没区别，都是让 AI 学新知识

B. RAG 不改模型只加参考资料，Fine-tuning 是修改模型本身

3有了 RAG，AI 就完全不会编造信息了吗？

A. 是的，有资料参考就不会编了

B. 不是，检索质量差或资料不全时仍可能编造

手机端可长按图片保存到相册

RAG