Agentic RAG
在 Modular RAG 阶段,我们通过解构“检索-重排-生成”各个模块,并引入查询重写与多路召回,解决了基础 RAG 的线性瓶颈。然而,即便是在模块化的架构下,系统依然是“被动”执行预设流程。面对法律咨询、医疗决策等极具专业深度的垂直领域时,传统的 Modular RAG 依然面临“语义断层”的挑战:当用户提问过于口语化而知识库条文过于专业时,即便是经过模块化重写,若初始检索分值低于阈值,系统往往会直接放弃或产生幻觉。
本篇文档将带你实施 Agentic RAG 智能体优化策略。通过在 Modular RAG 的基础上引入自主决策循环与自我纠错机制,我们在 《中华人民共和国民法典》 数据集的复杂逻辑测试中,实现了从“固定模块流”向“智能体自主推理”的跨越。
一、架构概览
- 数据层:
- 核心数据集:采用 《中华人民共和国民法典》。该数据具有严谨的逻辑层级和极高的专业术语密度,是验证智能体“语义重写”与“法理推理”能力的绝佳素材。
- 私有数据接入:系统具备高度的灵活性,支持上传行业规范、专家共识等 PDF,通过 SSH 通道(SCP)实现快速数据流转,即可实现从公共知识到行业私有知识的无缝切换。
- 解析策略:放弃会导致语义碎裂的机械切片,采用 SentenceSplitter 结合法律条文层级进行结构化解析,确保单个 Chunk 的语义完 整性,为智能体提供高质量的“认知素材”。
- 推理层:
- 核心引擎:采用 vLLM 托管 Qwen3-8B,承担复杂的法理分析与查询重写任务。
- 数据存储与检索层:
- 高效向量库:集成 Milvus Lite。采用嵌入式部署范式,通过 Python 原生加载本地 .db 文件。
- 嵌入模型:调用内置库加载 Qwen3-Embedding-8B,利用其 4096 维语义空间捕捉复杂的法理关联。
- 逻辑编排层:
- 自主决策工作流:超越 Modular RAG 的固定顺序,基于事件驱动架构实现“判定-反思-纠错-重搜”的闭环。
- 循环迭代范式:
- 自信度评估:引入 BGE-Reranker-v2-m3。不再盲目接受检索结果,而是根据精排分值(Threshold=0.35)判定“知识是否足以回答”。
- 自主纠错重写:若检索质量不达标,Agent 自动反思并将口语提问转化为标准法律术语(语义飞跃),重新触发检索。 思维链生成:通过输出 “think” 标签展示 Agent 的内部推导过程。
- 评估与溯源层:
- 实验验证:针对 Agentic 架构特有的“纠错重试”环节,对比原始检索与重写检索的分值跃升,量化智能体的“避坑”能力。
- 证据链透明化:在输出答案的同时,强制展示原始法条原文及 Rerank 置信度分值,并配合流式 “think” 标签展示推理链路,严控幻觉。
- 流程图:
-
文档
-