RAG 全攻略:传统 RAG / Graph RAG / Agentic RAG 详解
本文转载自 人人都是产品经理,原标题《RAG 全攻略:传统RAG / Graph RAG/Agentic RAG 详解,一文读懂 RAG》,作者对 RAG 技术进行了全面深入的解析。本文在此基础上进行重新整理,以便个人学习和记录。
RAG(检索增强生成)就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时,只基于你提供的真实知识生成答案,既避免瞎编,又能精准对接具体需求。
什么是 RAG
简单说,RAG(检索增强生成)就是给 AI 模型装了一个”专属知识库 + 精准搜索引擎”。AI 在回答问题时,只基于你提供的真实知识(比如公司文档、专业资料、实时数据)生成答案,既避免瞎编,又能精准对接具体需求。让模型生成的内容更准确、更具时效性、更可追溯。
将大模型需要的各种知识先进行向量化存储到数据库里面,然后用户询问的时候从数据库找相近的知识,检索出来之后进行重排序(rerank),获取最终的检索结果,将检索结果作为背景知识给到 LLM 生成回复。
核心是”知识图谱”—— 把分散的信息变成一张”关系网”。每个关键信息都是”节点”,它们之间的关联是”连线”。这种结构让 AI 能看懂信息背后的逻辑,能顺着关系网找到完整的因果链。
给 AI 加了一个”自主智能体”,就像让 AI 有了自己的思维:能自己拆解复杂问题、动态调整找答案的方式、调用各种工具,还能从经验中学习。
长文档需要拆成小片段(Chunk),常见的拆法有以下 5 种:
固定大小切分:按字数 / 段落拆(比如每 200 字一块),会留部分重叠内容避免拆断语义。
优点:简单易实现
缺点:可能在句子中途切分,破坏语义
语义切分:按意思拆,通过计算”余弦相似度”判断 —— 如果两段内容的相似度高就合并,相似度大幅下降就拆分。
优点:能保留完整语义
缺点:阈值判断需要根据文档调整
递归切分:先按章节 / 段落拆,若片段还是太长就继续细分。
优点:兼顾语义完整性和大小限制
缺点:实现成本稍高
按结构切分:跟着文档的标题、章节走(比如”介绍""注意事项”各成一块),保持文档逻辑。
优点:保持文档逻辑
缺点:部分片段可能超过 AI 的 Token 限制
让 AI 帮忙切分:直接让大模型按语义逻辑拆。
优点:准确率最高
缺点:计算成本最高
查询优化是 RAG 效果的关键。很多时候用户问的不是真正的需求,需要先理解”用户到底想问什么”。
常见策略:
检索流程:Embedding(向量化)→ Vector Database(向量数据库)→ Top-K Retrieval(Top-K 检索)→ Rerank(重排序)→ Context Assembly(上下文组装)→ LLM Generation(LLM 生成)
关键技术:
Graph RAG 的核心是”知识图谱”,能把分散的信息变成一张”关系网”,让 AI 能看懂信息背后的逻辑。
知识图谱的构建:
从文档中识别关键实体(如人名、设备名、物料名等)。
抽取实体之间的关系(如”操作""生产""被用于”等)。
将实体和关系组织成图谱结构。
基于图谱进行语义理解和关联查询。
核心能力:
根据历史数据判断因果关系,实现从”事后分析”到”事前预警”的升级。
就算提问模糊,也能理解概念相似性,返回更全面的结果。
如果说传统 RAG 是”被动检索 + 总结”,Agentic RAG 就是”主动思考 + 解决问题”。
多智能体协作架构:
Agentic RAG 的强大离不开多智能体的分工协作:
典型应用场景:
比如”三个月内规划一场兼顾老人和孩子的欧洲游,预算 10 万”,会先拆分成”选目的地、查交通、订酒店、算预算”等小任务。
逐个找信息、调用工具核实(地图查路线、预订平台看实时房源),最后整合出详细行程。
记住用户反馈(如”某个景点人太多”),下次优化方案。
RAG 是上下文工程(Context Engineering)的具体落地形式。上下文工程的核心是通过设计、构建和管理输入给 AI 的”上下文信息”,引导 AI 生成高质量答案。
流程对比:
| 传统 RAG | 上下文工程 |
|---|---|
| 仅检索文本 | 整合多维度信息 |
| 固定检索方式 | 先优化查询意图 |
| 单一文本处理 | 多模态上下文处理 |
| 简单拼接 | 最优结构组装 |
多模态支持:通过”多模态上下文处理器”把音视频等非文本数据转成文本。
转载注明: