RAG 的关键从来不是向量——是你能不能把对的内容捞出来
RAG 的关键从来不是向量——是你能不能把对的内容捞出来“咱们做个 AI 知识库吧。”团队里只要有人提这么一句接下来的动作几乎是条件反射搭一个向量数据库把文档切成小块灌进去让 AI 按相似度去捞。好像不上向量就不算做了 AI。可你的资料其实就那么几类结构清清楚楚。一套向量库搭下来检索效果还经常不如直接翻目录。钱花了活没干漂亮问题到底出在哪出在第一步就想错了。AI 要帮你干活前提是先从你成百上千个文档里找到那几条真正有用的。这件事有个词叫 RAG。而十有八九你一听到 RAG脑子里立刻蹦出来的就是那个词——向量数据库。这恰恰是要掰扯的第一个误区。RAG 的关键从来不是向量。是你能不能把对的内容捞出来。一、一提 RAG 就想到向量库你已经把手段当目的了为什么大家会有这种条件反射因为现在但凡讲 RAG 的教程、文章、开源项目几乎都是同一套动作文档切块、灌进向量库、按相似度召回。看多了所有人脑子里就刻下一个等式——RAG向量库。可这个等式从一开始就是错的。向量只是 RAG 的一种实现手段不是 RAG 本身。把用了向量当成做对了 RAG就像把买了跑鞋当成已经在跑步——工具到位了正事一步没动。更麻烦的是这种错位会让你彻底忽略真正该想的问题RAG 到底要解决什么只有想清楚这个你才知道向量该不该上、什么时候上。二、RAG 的内核检索增强生成命门在检索到对的先回到这三个字母本身。RAG全称是检索增强生成Retrieval-Augmented Generation。拆开看就三步先检索把相关资料找出来再用这些资料增强模型的输入最后让模型生成回答。很多人盯着生成觉得 AI 聪不聪明决定了一切。也有很多人盯着用什么库、什么模型。但真正的命门是中间那个动作——检索。更准确地说是能不能检索到对的内容。这话听起来像废话其实不是。你想想模型本身并不知道你的资料。它能回答好你的问题靠的不是它有多懂你而是你在它回答之前把对的那几条资料喂到了它嘴边。你喂对了再普通的模型也能答得像模像样。你喂错了——或者喂了一大堆里面只有一两条有用——再强的模型也救不回来。它只会从一堆杂音里挑出几句看着像答案的话然后一本正经地说错。所以 RAG 好不好用不取决于你用了哪种技术范式而取决于一件事你能不能稳定地、可靠地把 AI 这一步真正需要的那条内容捞出来。三、什么叫检索到对的内容厨子要的是一根葱打个比方。把 AI 想象成一个厨子。它手艺不错但它的冰箱是空的——它不知道你家有什么菜。每做一道菜它都得让你去拿料。它说“给我一根葱。”你递上一根葱。它三两下菜就成了。这叫检索到对的内容。但换个场景。它还是说给我一根葱。你怕拿少了不够用干脆把整个冰箱搬到它面前——葱、姜、蒜、昨天的剩菜、过期的酸奶全堆在案板上。你觉得自己很负责料给得足足的。可厨子傻眼了它得先从这一堆里翻出那根葱翻的过程中还可能顺手抓错把香菜当成葱扔进锅里。这道菜大概率糊。这就是检索最反直觉的一点捞上来的不是越多越好是越准越好。很多知识库不好用不是因为资料太少恰恰是因为每次检索都捞回来一大堆看着相关、其实没用的东西。AI 被这些杂音淹没反而抓不住重点。你给它的不是一根葱是一整个冰箱。记住这个画面。后面讲向量、讲目录都用这把尺子来量你这套方法到底是稳定地递上一根葱还是经常端来一整个冰箱四、大多数场景一个好目录就能稳定递上那根葱那怎么才能稳定地递上一根葱答案可能让你意外对绝大多数人、绝大多数场景来说不需要向量按业务维度建一个好目录就够了。举个具体的例子。假设你要给一个团队整理知识库里面有产品文档、技术方案、对接接口说明、历史问题记录、规章制度。一种做法是把所有文档切成小块全灌进向量库。用户问退款接口怎么调系统去算哪些文本块跟这句话语义接近。它可能捞回来退款接口文档也可能捞回来一篇讲退款政策的制度文件——因为这两个在语义上都挺接近。准不准全看运气和调参。另一种做法是先想清楚一件事这些资料人是怎么分类的产品文档归产品接口说明归技术对接问题记录按模块归档。建一套这样的目录就像图书馆的分类号。用户问退款接口怎么调顺着目录定位到技术对接 → 支付模块 → 退款接口直接翻到那一篇。哪种更可能递上那根葱显然是后一种。因为目录这件事的本质不是存资料而是把人对业务的理解变成了一条条检索路径。你按业务维度分好的每一个类目其实就是一条检索逻辑。AI 不用去猜哪段文字语义接近它顺着你定义好的结构一层层走到正确的位置。五、光有目录还不够得先给 AI 一张地图但这里藏着一个很多人会踩的坑。目录建好了文件夹分得清清楚楚AI 就能用了吗不能。你把它直接丢进这堆文件夹里它跟一个第一天来的新人没两样——面前一排柜子不知道哪个抽屉装什么只能一个个拉开翻。要么翻半天要么干脆翻错柜子。它缺的是一张地图。所以结构化检索真正的关键一步是在目录之外单独写一份描述这套目录长什么样的文档——有哪几个大类、每一类装的是什么、大概放在哪。说白了就是给整个知识库画一张大纲一张目录的目录。AI 来找东西不是一头扎进文件夹乱翻而是先读这张地图看懂全局判断这次任务该往哪一类走再钻进去。而且这张地图可以分层。大类下面如果还很复杂那一类里再放一份更细的小地图描述它内部的结构。AI 顺着大地图找到方向进了某一类再读那一类的小地图接着往下直到精确定位到要的那一篇——才把完整内容调出来看。这套先看地图、再逐层深入的机制有个名字叫渐进式披露不一次把所有资料都摊给 AI而是它走到哪一层才披露那一层的信息。它和你在图书馆找书的过程一模一样先看大厅的分区指示牌走到对应区域再看货架编号最后才走到那一格、抽出那本书。没人会把全馆的书都搬到面前再挑。这么做的好处有两个。一个是准。AI 每一步只看当前这层必要的信息不会被几百份无关文档淹没——还是那句话递一根葱不是端一冰箱。另一个是稳。整个过程可追溯它走到哪一层、为什么进这个类目你都看得见错了也知道错在哪一步。六、这套土办法凭什么比向量靠谱可能有人会说目录加大纲听着这么土怎么会比向量库还好恰恰是这个土藏着三样向量给不了的东西。它能解释。AI 找到一条内容你能清楚地知道它为什么是这一条——因为它就在支付模块这个类目下地图怎么指、它怎么走一步步都看得见。换成向量捞回来一段文字你问它为什么是这段得到的答案是因为它的向量距离最近。这话没法跟人解释也没法审计。它能改。发现某类问题 AI 老找错地方你直接去调目录、改大纲、把那篇文档挪到正确的类目下就行改完立刻见效。向量库里你想精准干预这个问题应该优先匹配这篇非常别扭往往得重新切片、重新灌库折腾半天还不一定准。它跟着业务长。业务怎么分模块、怎么划边界目录和大纲就怎么写。业务变了跟着改一行就行检索逻辑永远和真实业务对齐。向量不一样它脱离业务语义——只懂文字像不像不懂你这家公司的业务边界到底在哪。所以这真不是土不土的问题。可解释、可修改、可审计恰恰是一套严肃系统最离不开的东西。它递上来的是一根葱而且你知道它为什么递的是葱。说到底整套方法就闭环了人按业务把目录和大纲定义清楚秩序AI 顺着地图一层层检索在秩序里找资料每一步都能解释为什么是这一条可审计。这正是人定义秩序AI 在秩序里生长体系负责验证在检索这件事上的样子。这种结构化检索 渐进式披露的协作方式也沉淀在了开源的agent-workflows里配合framework的工程底座你可以直接拿去用。七、那向量什么时候才该上讲到这得说句公道话向量不是没用它是被滥用了。向量真正该上场的是这么一种场景——海量、模糊、说不清类目。什么意思比如一个面向全网的搜索产品文档量是千万级、上亿级内容五花八门你根本没法、也来不及给它建一套清晰的人工目录和大纲。用户的提问又特别口语化、特别模糊“那个能把照片变清楚的工具叫啥”这种问题没有现成的类目能对上。这时候向量的按语义模糊匹配才真正发挥价值——它不需要精确路径能在一片混沌里捞回来一批大致相关的候选。注意这是一种用模糊换覆盖的取舍你放弃了精确和可解释换来了在海量、无结构数据里还能找到点东西的能力。只有当你的场景确实到了人工目录维护不过来的规模这笔交易才划算。而且更进一步——就算到了这种规模向量也不该是你每个项目自己手搓一套。它最好的形态是被封装成一个 MCP对外提供接入。这里得提一个东西叫 MCP——你可以把它理解成一种标准化的能力接口。海量向量检索这种又重、又专业、又吃资源的能力最合理的方式是由专门的平台做好封装成一个标准接口谁需要谁接进来调用而不是每个做知识库的团队都从头搭一套向量库、自己切片、自己调参、自己维护。说到底给做产品的人一句实在话先老老实实把结构化目录和大纲维护好。只有当数据真的到了平台级海量、又没法结构化的程度才考虑向量而且优先接别人封装好的 MCP别自己造轮子。八、写在最后回到开头那个问题你的资料那么多AI 怎么才能找到需要的信息答案不是上一个向量库。答案是先把怎么才能检索到对的内容这件事想清楚再选技术。想清楚了一个好目录就够想不清楚再贵的向量库也只是换了个姿势端冰箱。RAG 的内核从来不是向量是检索检索的命门也不是找得多是找得准。技术只是手段能不能稳定递上那根葱才是真问题。未来真正会用 AI 的人不一定是懂多少检索算法的人而是能先想清楚AI 这一步到底需要哪条内容、再把资料组织成它够得着的样子的人。下一篇聊个新问题一个 AI 能干的活终究有限当任务复杂到它一个人忙不过来怎么把活拆给一个AI 团队——多个 Agent 怎么分工、怎么交接、谁来兜底这事儿比你想的更像管理一个真实的团队。关于 ArchAIHarness这篇文章是「看懂 AI 与智能体」专栏的一部分由ArchAIHarness持续输出。ArchAIHarness 是一套面向 AI 时代软件工程的人机协同架构哲学与公开工程资产主张架构师定义秩序AI 在秩序中生长。人立法AI 执行体系审计。如果你也希望 AI 在明确的架构边界内协作而不是在混沌中碰运气欢迎到 GitHub 上看看我们在做什么组织主页github.com/ArchAIHarness — 了解完整理念与资产全景本专栏zhuanlan-ai-and-agents— 所有文章的源码与发布记录实践指南docs— 架构哲学、工程方法和落地指南开源工具agent-workflows— 可复用的 AI 协作 Agents、Skills 与 Tools工程样例framework— DDD AI 协作的工程底座展示如何在开发中融合 AIEngineered by Architects · Empowered by AI · Audited by Discipline

相关新闻

Ubuntu 18.04下Ansible自动化部署Apache实战指南

Ubuntu 18.04下Ansible自动化部署Apache实战指南

1. 这不是“又一个Ansible教程”,而是我在生产环境里踩了7次坑后写下的Apache部署实录你搜到这个标题,大概率正卡在某个环节:可能是刚学Ansible,对着官方文档抄playbook却报错“module not found”;也可能是运维老手&a…

2026/6/23 9:02:49阅读更多 →
DigitalOcean云上Kubernetes稳定性实战指南

DigitalOcean云上Kubernetes稳定性实战指南

1. 这不是一份说明书,而是一份航海日志:为什么“Navigator’s Guide”这个标题里藏着DigitalOcean上最真实的客户成功逻辑“Navigator’s Guide: DigitalOcean, Customer Success, and You”——光看标题,你可能会以为这是一份泛泛而谈的云平…

2026/6/23 8:57:49阅读更多 →
AMD 提前为 RX 7000 系列 GPU 推 FSR 4.1 升级,更多游戏与设备将迎画质流畅双提升!

AMD 提前为 RX 7000 系列 GPU 推 FSR 4.1 升级,更多游戏与设备将迎画质流畅双提升!

RX 7000 系列 GPU 提前畅享 FSR 4.1 升级 今日,AMD 正式为 Radeon RX 7000 系列 GPU 推出 FSR 4.1 升级。这使得搭载采用 RDNA 3 图形架构旧款显卡的电脑,能在游戏中体验到画质提升和游戏更流畅等显著改进。此前 AMD 在 5 月承诺 7 月提供支持&#xff0…

2026/6/23 8:57:49阅读更多 →
Kinetis SDK QSPI驱动架构解析与实战:从初始化到XIP模式优化

Kinetis SDK QSPI驱动架构解析与实战:从初始化到XIP模式优化

1. QSPI驱动核心架构与设计思路拆解在嵌入式开发中,与外部存储器和高速外设通信是家常便饭。传统的SPI(Serial Peripheral Interface)接口虽然简单可靠,但其半双工或全双工单数据线的模式,在需要高速、大数据量传输的…

2026/6/23 10:28:32阅读更多 →
GIRB框架:解决模型概率失真,实现精准业务决策

GIRB框架:解决模型概率失真,实现精准业务决策

1. 项目概述:为什么我们需要GIRB?在机器学习项目的落地过程中,我们常常会面临一个令人头疼的“最后一公里”问题:模型离线评估的指标(比如AUC、准确率)看起来非常漂亮,但一旦上线,业…

2026/6/23 10:28:32阅读更多 →
年度必看!2026AI论文写作工具榜单(覆盖 99% 论文写作需求)

年度必看!2026AI论文写作工具榜单(覆盖 99% 论文写作需求)

本文精选13 款2026 年实测 AI 论文工具,按全流程全能型、垂直领域专精型、润色降重专家、文献管理助手四大类别排序,覆盖从选题到定稿全链路,适配本科 / 硕博 / 期刊全场景,附选型速查表与避坑指南,帮你快速找到最佳拍…

2026/6/23 10:28:32阅读更多 →
Java项目AI插件选型指南:TRAE、Copilot与Lingma深度对比

Java项目AI插件选型指南:TRAE、Copilot与Lingma深度对比

1. 为什么Java开发者在IDEA里装AI插件,反而更常删掉重装?IntelliJ IDEA Java 这套组合,在国内中大型后端团队里几乎是默认配置。但最近半年,我陆续给6个不同规模的Java项目组做开发环境巡检,发现一个反直觉现象&#…

2026/6/23 10:28:32阅读更多 →
完整学习LLM(二):大模型到底是什么

完整学习LLM(二):大模型到底是什么

这个问题看起来简单. 但真要说清楚,其实不容易. 因为它很容易被讲得特别玄. 比如有人会说它在思考. 也有人会说它只是概率接龙. 这两个说法都有一点道理,但如果只记这两句话,还是很难落到项目里. 所以这篇我想换一个角度: 先不急着讲论文.先拿普通程序和大模型对比一下. …

2026/6/23 10:28:32阅读更多 →
编程技能地图:一张定位认知断层的能力导航图

编程技能地图:一张定位认知断层的能力导航图

1. 这不是“技能清单”,而是一张能让你少走三年弯路的编程能力导航图很多人学编程卡在“学了就忘、用了就懵、面试答不出”的死循环里——不是不努力,是根本没搞清自己到底缺哪块拼图。我带过三十多个转行学员,几乎所有人第一次画出自己的Ski…

2026/6/23 10:23:31阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/23 7:04:52阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/23 1:55:32阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/23 5:55:37阅读更多 →
2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南。OpenClaw是开源的个人AI助手,Hermes Agent则是一个能自我进化的AI智能体框架。阿里云提供计算巢、轻量服务器及无影云电脑三种部署OpenClaw 与 Hermes Agent的方案、百炼Token Plan兼容主流…

2026/6/23 0:00:38阅读更多 →
2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

模块一:行业背景——百亿赛道爆发,北京市场的特殊性与选型困局2026年,电子沙盘行业已走过“要不要做”的讨论,进入“找谁做、怎么做”的深水区。据行业研究机构数据,2025年国内电子沙盘市场规模已突破85亿元&#xff0…

2026/6/23 0:00:38阅读更多 →
音视频场景下的 Java 开发者面试:技术与挑战

音视频场景下的 Java 开发者面试:技术与挑战

面试互联网大厂:从音视频场景看 Java 开发者的技能与挑战 在互联网大厂求职的面试中,Java 开发者往往需要面对严苛的技术问题。今天,我们将通过一位名叫燕双非的搞笑程序员与严肃的面试官之间的对话,看看在音视频场景下&#xff0…

2026/6/23 0:00:38阅读更多 →