RAG 全攻略：传统 RAG / Graph RAG / Agentic RAG 详解

Dec 8, 2025 · 3 min read ·

AI RAG 知识库大模型检索增强

Note

本文转载自人人都是产品经理，原标题《RAG 全攻略：传统RAG / Graph RAG/Agentic RAG 详解，一文读懂 RAG》，作者对 RAG 技术进行了全面深入的解析。本文在此基础上进行重新整理，以便个人学习和记录。

RAG 核心认知：是什么、有哪些形态

RAG（检索增强生成）就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时，只基于你提供的真实知识生成答案，既避免瞎编，又能精准对接具体需求。

核心理念 — RAG 定义

什么是 RAG

简单说，RAG（检索增强生成）就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时，只基于你提供的真实知识（比如公司文档、专业资料、实时数据）生成答案，既避免瞎编，又能精准对接具体需求。让模型生成的内容更准确、更具时效性、更可追溯。

Pros

• 回答更准确
• 内容可追溯
• 时效性强
• 成本可控

Cons

• 依赖检索质量
• 延迟增加
• 知识库维护复杂场景挑战

RAG 三大核心形态

传统 RAG

将大模型需要的各种知识先进行向量化存储到数据库里面，然后用户询问的时候从数据库找相近的知识，检索出来之后进行重排序（rerank），获取最终的检索结果，将检索结果作为背景知识给到 LLM 生成回复。

Graph RAG

核心是”知识图谱”—— 把分散的信息变成一张”关系网”。每个关键信息都是”节点”，它们之间的关联是”连线”。这种结构让 AI 能看懂信息背后的逻辑，能顺着关系网找到完整的因果链。

Agentic RAG

给 AI 加了一个”自主智能体”，就像让 AI 有了自己的思维：能自己拆解复杂问题、动态调整找答案的方式、调用各种工具，还能从经验中学习。

传统 RAG：简单直接的”检索 – 总结”流程

数据准备：给 AI 整理”知识库”

文档切分策略

长文档需要拆成小片段（Chunk），常见的拆法有以下 5 种：

固定大小切分：按字数 / 段落拆（比如每 200 字一块），会留部分重叠内容避免拆断语义。

优点：简单易实现

缺点：可能在句子中途切分，破坏语义

语义切分：按意思拆，通过计算”余弦相似度”判断 —— 如果两段内容的相似度高就合并，相似度大幅下降就拆分。

优点：能保留完整语义

缺点：阈值判断需要根据文档调整

递归切分：先按章节 / 段落拆，若片段还是太长就继续细分。

优点：兼顾语义完整性和大小限制

缺点：实现成本稍高

按结构切分：跟着文档的标题、章节走（比如”介绍""注意事项”各成一块），保持文档逻辑。

优点：保持文档逻辑

缺点：部分片段可能超过 AI 的 Token 限制

让 AI 帮忙切分：直接让大模型按语义逻辑拆。

优点：准确率最高

缺点：计算成本最高

查询优化：前置关键步骤

重要性

查询优化是 RAG 效果的关键。很多时候用户问的不是真正的需求，需要先理解”用户到底想问什么”。

常见策略：

Query Expansion：把一个问题扩展成多个角度的问法
Query Decomposition：把复杂问题拆成多个简单子问题
Query Rewriting：重写问法，用更精准的表达替代模糊表述
HyDE：让 AI 先”猜”一个答案，再用这个假设答案去找相关文档

检索与重排序

检索流程：Embedding（向量化）→ Vector Database（向量数据库）→ Top-K Retrieval（Top-K 检索）→ Rerank（重排序）→ Context Assembly（上下文组装）→ LLM Generation（LLM 生成）

流程说明 — 检索链路

关键技术：

Embedding：将文本转为向量表示
向量数据库：存储向量化后的知识片段
Top-K 检索：找到最相关的 K 个片段
Rerank：对检索结果重新排序，提高相关性

Graph RAG：知识图谱增强生成

核心优势

Graph RAG 的核心是”知识图谱”，能把分散的信息变成一张”关系网”，让 AI 能看懂信息背后的逻辑。

知识图谱的构建：

从文档中识别关键实体（如人名、设备名、物料名等）。

抽取实体之间的关系（如”操作""生产""被用于”等）。

将实体和关系组织成图谱结构。

基于图谱进行语义理解和关联查询。

核心能力：

链接预测

根据历史数据判断因果关系，实现从”事后分析”到”事前预警”的升级。

智能检索优化

就算提问模糊，也能理解概念相似性，返回更全面的结果。

Agentic RAG：主动思考与问题解决

如果说传统 RAG 是”被动检索 + 总结”，Agentic RAG 就是”主动思考 + 解决问题”。

核心区别 — 主动 vs 被动

多智能体协作架构：

团队协作

Agentic RAG 的强大离不开多智能体的分工协作：

规划者：负责拆解复杂问题
检索者：专门找资料
校验者：检查答案准确性
执行者：调用工具执行任务
协作者：协调整体工作

典型应用场景：

比如”三个月内规划一场兼顾老人和孩子的欧洲游，预算 10 万”，会先拆分成”选目的地、查交通、订酒店、算预算”等小任务。

逐个找信息、调用工具核实（地图查路线、预订平台看实时房源），最后整合出详细行程。

记住用户反馈（如”某个景点人太多”），下次优化方案。

上下文工程：RAG 的底层逻辑支撑

方法论

RAG 是上下文工程（Context Engineering）的具体落地形式。上下文工程的核心是通过设计、构建和管理输入给 AI 的”上下文信息”，引导 AI 生成高质量答案。

流程对比：

传统 RAG	上下文工程
仅检索文本	整合多维度信息
固定检索方式	先优化查询意图
单一文本处理	多模态上下文处理
简单拼接	最优结构组装

多模态支持：通过”多模态上下文处理器”把音视频等非文本数据转成文本。

RAG 技术选型建议