迈向Agentic RAG!清华大学最新综述:一文讲清RAG-Reasoning系统
大语言模型虽然具备强大的生成能力但仍受困于两大瓶颈知识幻觉与复杂推理不足。传统RAG技术虽能增强事实性却难以应对多步推理纯推理方法又常因缺乏事实支撑而失真。清华大学等研究机构的学者系统地对检索-推理系统进行了详细研究首先梳理了两种单向增强方法推理增强型RAG通过多步推理优化检索流程和RAG增强型推理利用检索知识填补逻辑漏洞。随后重点探讨了新兴的协同检索-推理框架推理过程主动指导检索策略而新检索到的知识又持续优化推理流程。这一趋势也进一步体现在最新的Deep Research类产品中强调检索与推理的紧密耦合以增强解决复杂问题的能力。本文的综述不仅填补了该领域系统化研究的空白也为构建更高效、多模态适应、可信且以人为中心的检索-推理系统提供了重要参考为后续技术发展指明了路径。01推理增强型RAG传统RAG先检索文档再结合查询生成答案但这类方法往往难以处理复杂推理。通过在检索、整合与生成各阶段融入推理能力可提升信息匹配精度减少幻觉增强回答准确性。1检索优化检索优化利用推理来提高结果的相关性和质量。现有方法主要分为三类推理感知的查询重构通过重构原始查询来更好地获取与推理相关的上下文。首先查询分解将复杂问题拆解为更简单的子查询然后查询改写将模糊查询转化为更清晰的表述部分研究采用强化学习训练改写模型以匹配生成器的推理需求最后查询扩展通过思维链推理增强查询的语义丰富度。检索策略与规划检索优化的两大技术路线包括采用推理模型预先生成完整检索蓝图的全局规划采用单步预测机制动态判断是否需要检索的自适应决策。检索模型增强现有研究通过两种方式增强检索器推理能力利用知识图谱GNN-RAG采用图神经网络编码知识图谱实现隐式多跳推理或符号规则RuleRAG等结构化知识指导检索或将CoT****显式推理与查询结合提升多跳问答的中间知识召回。2整合优化通过引入推理机制来评估相关性并融合多源证据从而避免无关内容干扰最终生成效果。其核心方法可分为两类相关性评估与过滤通过深层次推理评估检索片段与查询的相关性。如SEER采用评估专家机制筛选高质量证据Yoran等人使用NLI模型过滤非蕴含内容并通过混合上下文微调LLM来抑制噪声干扰。信息合成与融合识别相关片段后需将其融合为连贯证据集。BeamAggR基于概率推理聚合子问题答案组合DualRAG通过推理增强查询渐进聚合信息CRP-RAG构建推理图以处理节点级知识生成前动态选择最佳知识路径。3生成优化传统RAG系统即便获取检索内容仍会因缺乏推理生成不实内容。当下研究主要采用两种优化方案上下文感知合成策略通过选择性上下文利用和构建显式推理路径来确保生成内容的相关性并降低噪声。基于证据的生成控制通过推理验证机制确保输出紧扣检索证据。如事实验证方法评估生成内容与证据的一致性引用生成方法通过关联内容与来源提升可信度忠实推理方法要求每一步均基于证据避免引入未经验证信息。02RAG增强型推理在推理过程中整合外部知识或上下文中的知识有助于大语言模型减少幻觉并弥补逻辑漏洞。1外部知识检索通过整合网络内容、数据库信息和外部工具来增强推理能力有效填补知识空白。定向检索技术将推理步骤锚定在已验证的外部证据上使语言模型能够可靠处理复杂查询显著提升事实准确性。2上下文检索利用模型的内部经验或从示例和训练数据中检索到的样例来引导推理。该方法提供相关范例指导模型模仿推理模式从而提升回答新问题时的准确性和逻辑连贯性。03检索-推理协同范式许多现实问题如开放域问答和科学发现需迭代式检索与推理使新证据不断优化推理反之亦然。单次检索或推理难以充分支持复杂任务。通过多步交互式协同系统可逐步提升信息相关性与查询理解。现有方法主要聚焦两个方向1推理工作流推理工作流可分为基于链、基于树和基于图的结构体现出从线性推理向多分支复杂推理范式的技术演进。**基于链**链式推理架构如CoT通过线性思维链进行推理但仅依赖大语言模型的参数化知识容易产生错误传播。为此研究者通过在推理步骤间加入检索操作来优化最新进展还引入了验证与过滤机制以提升鲁棒性。**基于树**通常采用“思维树”ToT或蒙特卡洛树搜索MCTS框架。ToT 将思维链扩展为显式构建确定性推理树从而并行探索多条逻辑路径。相比之下基于 MCTS 的方法采用概率树搜索依据启发式概率动态优先探索高潜力路径。**基于图**Walk-on-Graph方法主要依赖图学习技术实现检索与推理的协同。相比之下Think-on-Graph方法直接将图结构整合到大语言模型推理循环中通过模型自主引导实现动态迭代的检索-推理过程。2智能体编排根据智能体架构分类现有研究可划分为两大方向单智能体单智能体系统将知识检索融入大语言模型的推理循环中使其能够在解决问题的每一步动态查找信息并在需要时主动寻找相关证据。具体实现包括使用提示策略使大模型显式交替执行推理和工具调用通过基于指令或合成数据集的监督微调SFT方法以及强化学习驱动通过奖励信号优化智能体行为的方法最近研究进一步推出在动态环境下及端到端的强化学习训练。多智能体RAG与推理任务中的多智能体协作研究催生了两类典型架构集中式架构通过工作者-管理者模式整合集体智能与分布式架构利用角色专精智能体的互补能力。04挑战与机遇协同式检索-推理系统的未来研究致力于提升推理和检索能力以满足现实世界对准确性、效率、可信度和用户对齐的需求。下面概述关键挑战与机遇推理效率协同式检索-推理系统虽擅长复杂推理但因迭代检索与多步推理易致显著延迟。未来需通过潜在推理、思维蒸馏、长度惩罚等策略优化推理效率并探索模型压缩技术发展高效的轻量级系统。检索效率在检索方面需结合预算感知的查询规划与记忆感知的缓存机制减少冗余访问通过自适应检索控制依据不确定性信号动态调整检索时机与规模降低无效操作。这些技术推动系统从静态RAG向现实约束下的动态、自调节高效检索演进。人机协作检索-推理应用多具个性化用户往往难以明确需求或处理结果。未来系统需建模不确定意图支持迭代澄清并设计可自适应用户水平与偏好的智能体。智能体架构与能力协同式检索-推理的核心是智能体架构系统能自主分配角色并调用工具或检索策略。未来研究应聚焦于构建支持动态选工具、检索规划与自适应协同的智能体框架。多模态检索现有协同式检索-推理系统多限于文本任务但实际应用亟需多模态内容的检索与融合。未来研究应增强多模态大模型的跨模态对齐与推理能力发展混合模态思维链以支持现实交互并构建统一的多模态检索器实现对图像、表格、文本等异构数据的联合嵌入。检索可信度协同式检索-推理系统易受污染知识的攻击确保检索可信对推理可靠性至关重要。水印等技术可提升可追溯性但亟需更动态自适应的方法应对模型演进与新型攻击。不确定性量化与鲁棒生成已单独探索未来应整合以增强系统可信与鲁棒性并扩展基准至多维可信度评估。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

后端开发中的安全防护:不可忽视的细节

后端开发中的安全防护:不可忽视的细节

在当今互联网时代,后端开发不仅是构建高效、稳定系统的核心,更是保障用户数据与企业资产安全的关键环节。随着网络攻击手段的不断演进,安全防护已不再是可有可无的附加功能,而是后端开发中不可忽视的细节。忽视这些细节&#xff0…

2026/6/22 20:44:52阅读更多 →
Windows 11 LTSC恢复微软商店:3步搞定精简版系统应用生态

Windows 11 LTSC恢复微软商店:3步搞定精简版系统应用生态

Windows 11 LTSC恢复微软商店:3步搞定精简版系统应用生态 【免费下载链接】LTSC-Add-MicrosoftStore Add Windows Store to Windows 11 24H2 LTSC 项目地址: https://gitcode.com/gh_mirrors/ltscad/LTSC-Add-MicrosoftStore 你是否在使用Windows 11 LTSC版本…

2026/6/22 20:44:52阅读更多 →
如何快速搭建跨平台游戏串流服务器:Sunshine终极实战指南

如何快速搭建跨平台游戏串流服务器:Sunshine终极实战指南

如何快速搭建跨平台游戏串流服务器:Sunshine终极实战指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想要在任何设备上畅玩PC游戏?Sunshine开源游戏串流…

2026/6/22 20:44:52阅读更多 →
打破生态壁垒:如何在Windows电脑上免费接收苹果AirPlay投屏?

打破生态壁垒:如何在Windows电脑上免费接收苹果AirPlay投屏?

打破生态壁垒:如何在Windows电脑上免费接收苹果AirPlay投屏? 【免费下载链接】airplay2-win Airplay2 for windows 项目地址: https://gitcode.com/gh_mirrors/ai/airplay2-win 你是否曾羡慕苹果用户之间流畅的无线投屏体验,却因为使用…

2026/6/22 22:25:15阅读更多 →
异构调度:基于最大独立集的多卡 GPU 亲和度调度算法

异构调度:基于最大独立集的多卡 GPU 亲和度调度算法

异构调度:基于最大独立集的多卡 GPU 亲和度调度算法 一、异构 GPU 调度面临的挑战与痛点 大模型和深度学习对 GPU 算力的需求持续增长。实际部署中,Kubernetes 集群常混合不同型号的 GPU 硬件。即使是同一型号,因物理插槽位置和主板设计差异…

2026/6/22 22:25:15阅读更多 →
突破抢票瓶颈:智能高效的B站会员购自动化解决方案

突破抢票瓶颈:智能高效的B站会员购自动化解决方案

突破抢票瓶颈:智能高效的B站会员购自动化解决方案 【免费下载链接】biliTickerBuy b站会员购购票辅助工具 项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy 你是否曾在热门漫展开票时,面对秒空的票务系统感到无力?当…

2026/6/22 22:25:15阅读更多 →
RCFG:基于奖励加权的推理时策略优化,提升大模型生成质量与安全性

RCFG:基于奖励加权的推理时策略优化,提升大模型生成质量与安全性

1. 项目概述:当“引导”遇上“奖励”,推理时策略优化的新思路最近在折腾大语言模型和扩散模型的应用时,我一直在思考一个问题:我们费尽心思训练出一个模型,但在实际推理(生成)时,往往…

2026/6/22 22:25:15阅读更多 →
HC12/Star12汇编器命令行选项详解与嵌入式工程实践

HC12/Star12汇编器命令行选项详解与嵌入式工程实践

1. 项目概述与汇编器核心价值在嵌入式开发的底层世界里,汇编器扮演着“翻译官”与“建筑师”的双重角色。它不像高级语言编译器那样抽象,而是直接面对处理器的指令集和内存布局,将我们人类可读的助记符(如LDAA,STAA,BRA&#xff0…

2026/6/22 22:25:15阅读更多 →
大语言模型在幽默理解上的系统性偏差研究

大语言模型在幽默理解上的系统性偏差研究

1. 当AI遇上黑色幽默:从Cards Against Humanity看LLM的幽默困境最近在玩一个有趣的实验:让五个最先进的大语言模型(GPT-5.2、Gemini 3 Flash、Claude Opus 4.5、Grok 4和DeepSeek-V3.2)玩美国流行的派对游戏《Cards Against Human…

2026/6/22 22:20:14阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/22 6:01:42阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/22 1:15:34阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/22 5:42:46阅读更多 →
Codex本地AI编码代理与CC Switch协议适配实战

Codex本地AI编码代理与CC Switch协议适配实战

1. Codex不是“另一个VS Code插件”,而是本地AI编码代理的临界点Codex这个名字,现在被太多人误读了。它不是ChatGPT那个早已停更的旧模型代号,也不是某个新出的VS Code扩展图标——它是2024年中后期悄然浮出水面的一类本地化AI编码代理&#…

2026/6/22 0:04:18阅读更多 →
从MSP430到Flexis QE128:8/32位MCU无缝迁移与低功耗设计实战

从MSP430到Flexis QE128:8/32位MCU无缝迁移与低功耗设计实战

1. 项目概述:当8位MCU遇到性能瓶颈,我们如何优雅升级?在嵌入式开发领域,尤其是电池供电的便携式设备、工业传感器节点或智能家居终端中,我们常常面临一个经典的两难选择:是选择功耗极低但性能有限的8位微控…

2026/6/22 0:04:18阅读更多 →
大语言模型空间推理能力提升:TEXT2SPACE数据集与ASCII增强技术解析

大语言模型空间推理能力提升:TEXT2SPACE数据集与ASCII增强技术解析

1. 项目缘起:当大语言模型“看”不懂空间 最近在折腾大语言模型(LLM)的各种应用时,我发现一个挺有意思的现象:你让模型写首诗、写代码、甚至做逻辑推理,它可能都表现得有模有样。但一旦涉及到需要理解“空间…

2026/6/22 0:04:18阅读更多 →