🧒 极简版
想象你在考试,但这次允许翻书。
不用 RAG 的 AI = 闭卷考试:只能靠记忆回答,记不住就瞎编。
用了 RAG 的 AI = 开卷考试:回答之前先翻书找到相关内容,然后根据书上的内容来回答。
答案更准确,而且能告诉你"这个答案出自哪本书第几页"。
🧑 场景版
你是客服经理,公司有 500 页产品手册。你想让 AI 帮你回答客户问题。
问题:AI 从没读过你的产品手册——它的训练数据里没有。
RAG 的做法:
1. 把 500 页手册切成小块存进"知识库"
2. 客户问"这个产品支持蓝牙吗?"
3. 系统先去知识库搜索和"蓝牙"相关的段落
4. 把找到的段落塞给 AI 当参考资料
5. AI 根据这些参考资料来回答——不用猜,有据可查
🎓 精准版
RAG = Retrieval-Augmented Generation,由 Meta AI(2020)提出。
技术架构:
· Indexing:文档 → 切片 → Embedding → 存入向量数据库
· Retrieval:用户 Query → Embedding → 向量相似度搜索 → Top-K 相关片段
· Generation:将检索到的片段注入 Prompt → LLM 生成带引用的回答
核心优势:不需要重新训练模型(Fine-tuning 成本高),只需要把知识存入检索库,即插即用。