返回文章列表

RAG 全攻略:传统 RAG / Graph RAG / Agentic RAG 详解

· 3 min read ·
AI RAG 知识库 大模型 检索增强
RAG 全攻略:传统 RAG / Graph RAG / Agentic RAG 详解
Note

本文转载自 人人都是产品经理,原标题《RAG 全攻略:传统RAG / Graph RAG/Agentic RAG 详解,一文读懂 RAG》,作者对 RAG 技术进行了全面深入的解析。本文在此基础上进行重新整理,以便个人学习和记录。

RAG 核心认知:是什么、有哪些形态

RAG(检索增强生成)就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时,只基于你提供的真实知识生成答案,既避免瞎编,又能精准对接具体需求。

核心理念 RAG 定义

什么是 RAG

简单说,RAG(检索增强生成)就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时,只基于你提供的真实知识(比如公司文档、专业资料、实时数据)生成答案,既避免瞎编,又能精准对接具体需求。让模型生成的内容更准确、更具时效性、更可追溯。

Pros
  • 回答更准确
  • 内容可追溯
  • 时效性强
  • 成本可控
Cons
  • 依赖检索质量
  • 延迟增加
  • 知识库维护复杂场景挑战

RAG 三大核心形态

传统 RAG

将大模型需要的各种知识先进行向量化存储到数据库里面,然后用户询问的时候从数据库找相近的知识,检索出来之后进行重排序(rerank),获取最终的检索结果,将检索结果作为背景知识给到 LLM 生成回复。

Graph RAG

核心是”知识图谱”—— 把分散的信息变成一张”关系网”。每个关键信息都是”节点”,它们之间的关联是”连线”。这种结构让 AI 能看懂信息背后的逻辑,能顺着关系网找到完整的因果链。

Agentic RAG

给 AI 加了一个”自主智能体”,就像让 AI 有了自己的思维:能自己拆解复杂问题、动态调整找答案的方式、调用各种工具,还能从经验中学习。


传统 RAG:简单直接的”检索 – 总结”流程

数据准备:给 AI 整理”知识库”

文档切分策略

长文档需要拆成小片段(Chunk),常见的拆法有以下 5 种:

固定大小切分:按字数 / 段落拆(比如每 200 字一块),会留部分重叠内容避免拆断语义。

优点:简单易实现

缺点:可能在句子中途切分,破坏语义

语义切分:按意思拆,通过计算”余弦相似度”判断 —— 如果两段内容的相似度高就合并,相似度大幅下降就拆分。

优点:能保留完整语义

缺点:阈值判断需要根据文档调整

递归切分:先按章节 / 段落拆,若片段还是太长就继续细分。

优点:兼顾语义完整性和大小限制

缺点:实现成本稍高

按结构切分:跟着文档的标题、章节走(比如”介绍""注意事项”各成一块),保持文档逻辑。

优点:保持文档逻辑

缺点:部分片段可能超过 AI 的 Token 限制

让 AI 帮忙切分:直接让大模型按语义逻辑拆。

优点:准确率最高

缺点:计算成本最高

查询优化:前置关键步骤

重要性

查询优化是 RAG 效果的关键。很多时候用户问的不是真正的需求,需要先理解”用户到底想问什么”。

常见策略

  • Query Expansion:把一个问题扩展成多个角度的问法
  • Query Decomposition:把复杂问题拆成多个简单子问题
  • Query Rewriting:重写问法,用更精准的表达替代模糊表述
  • HyDE:让 AI 先”猜”一个答案,再用这个假设答案去找相关文档

检索与重排序

检索流程:Embedding(向量化)→ Vector Database(向量数据库)→ Top-K Retrieval(Top-K 检索)→ Rerank(重排序)→ Context Assembly(上下文组装)→ LLM Generation(LLM 生成)

流程说明 检索链路

关键技术

  • Embedding:将文本转为向量表示
  • 向量数据库:存储向量化后的知识片段
  • Top-K 检索:找到最相关的 K 个片段
  • Rerank:对检索结果重新排序,提高相关性

Graph RAG:知识图谱增强生成

核心优势

Graph RAG 的核心是”知识图谱”,能把分散的信息变成一张”关系网”,让 AI 能看懂信息背后的逻辑。

知识图谱的构建

从文档中识别关键实体(如人名、设备名、物料名等)。

抽取实体之间的关系(如”操作""生产""被用于”等)。

将实体和关系组织成图谱结构。

基于图谱进行语义理解和关联查询。

核心能力

链接预测

根据历史数据判断因果关系,实现从”事后分析”到”事前预警”的升级。

智能检索优化

就算提问模糊,也能理解概念相似性,返回更全面的结果。


Agentic RAG:主动思考与问题解决

如果说传统 RAG 是”被动检索 + 总结”,Agentic RAG 就是”主动思考 + 解决问题”。

核心区别 主动 vs 被动

多智能体协作架构

团队协作

Agentic RAG 的强大离不开多智能体的分工协作:

  • 规划者:负责拆解复杂问题
  • 检索者:专门找资料
  • 校验者:检查答案准确性
  • 执行者:调用工具执行任务
  • 协作者:协调整体工作

典型应用场景

比如”三个月内规划一场兼顾老人和孩子的欧洲游,预算 10 万”,会先拆分成”选目的地、查交通、订酒店、算预算”等小任务。

逐个找信息、调用工具核实(地图查路线、预订平台看实时房源),最后整合出详细行程。

记住用户反馈(如”某个景点人太多”),下次优化方案。


上下文工程:RAG 的底层逻辑支撑

方法论

RAG 是上下文工程(Context Engineering)的具体落地形式。上下文工程的核心是通过设计、构建和管理输入给 AI 的”上下文信息”,引导 AI 生成高质量答案。

流程对比

传统 RAG上下文工程
仅检索文本整合多维度信息
固定检索方式先优化查询意图
单一文本处理多模态上下文处理
简单拼接最优结构组装

多模态支持:通过”多模态上下文处理器”把音视频等非文本数据转成文本。


RAG 技术选型建议

Pros
  • 传统 RAG:简单直接,适合基础场景
  • Graph RAG:复杂关系分析,精准推理
  • Agentic RAG:复杂任务,多步规划
Cons
  • 传统 RAG:依赖检索质量
  • Graph RAG:图谱构建成本高
  • Agentic RAG:系统复杂度高
选型建议
  • 简单问答场景 → 传统 RAG
  • 需要理解实体关系 → Graph RAG
  • 复杂任务规划 → Agentic RAG
  • 生产级应用 → 考虑混合架构,结合多种 RAG 形态

转载注明:

# // CONTENTS