我在RuyiBookCourse里接入硅基流动RAG:电子书不是拆成Markdown就结束了
OKOK大家好欢迎大家来到大鹏 AI 教育我是张大鹏。这篇文章记录我在RuyiBookCourse里思考 RAG 能力的一次真实决策。前面我已经把这个项目从一个“电子书资料目录”整理成了一个可以继续开发的本地产品项目。现在项目里有解析代码有课程输出目录也有真实的电子书章节 Markdown。但做到这一步以后我反而更清楚地意识到一件事电子书不是拆成 Markdown 就结束了。如果一个项目只能把 EPUB、PDF 拆成一堆章节文件它更像整理工具。如果它能围绕这些章节回答问题、生成学习路线、辅助写课、追溯来源它才开始接近我想要的“电子书转课程”产品。这就是我为什么要考虑给RuyiBookCourse接入 RAG。我现在真正缺的是什么RuyiBookCourse目前已经能处理一些真实资料。比如数据分析\Python 数据分析\英文版 数据分析\学习 D3.js\英文版这些目录里放的不是示例文本而是从电子书里解析出来的章节 Markdown。这已经很有价值。但我在使用过程中遇到的问题也很明显。我想问Python 数据分析这本书适合怎么学D3.js 里 scales 和 axes 哪个应该先讲哪些章节适合改造成练习课如果我要做数据分析课程应该先讲 pandas 还是可视化当前项目里有哪些书已经解析好了这些问题不应该每次都靠我手动打开文件、翻目录、复制粘贴给 AI。如果每次都这样AI 只是临时帮忙不是项目能力。我希望的是项目自己可以查询自己的文档。为什么我没有直接把所有 Markdown 丢给大模型最简单的办法是把所有 Markdown 都塞进提示词。但我没有这么做。原因很直接。第一电子书内容会越来越多。现在只是几本书后面可能是几十本、上百本。一本书十几章、几十章全部塞进上下文不是长期方案。第二用户的问题通常只需要局部内容。我问 D3.js 的比例尺不需要把 Python 数据分析、统计检验、机器学习章节全部带进去。第三课程化需要引用来源。如果 AI 给我一个学习建议我要知道它来自哪本书、哪一章、哪个 Markdown 文件。没有来源课程内容就会变成“看起来合理”但不够可追踪。所以我更倾向于 RAG。RAG 的核心不是让模型记住所有资料而是先从本地文档里找出最相关的片段再让模型基于这些片段回答。为什么我先看硅基流动这个项目是本地产品但我不想一开始就把模型服务做得很重。如果从第一天就自己部署 embedding、rerank、chat 模型工程负担会立刻上来模型下载显存要求推理服务Windows 本地兼容并发和缓存后续模型更新这些事情都重要但不是第一阶段最重要。第一阶段我更关心的是把产品链路跑通。硅基流动适合这个阶段是因为它提供了模型 API可以让我先把 RAG 的业务流程跑起来。我更关心的是Markdown - chunk - embedding - retrieval - rerank - answer with citations而不是一开始就陷入模型部署。项目里的.env已经可以保存本地 API Key。但这里有一个底线博客和代码里都不能写出真实 key。.env只留在本地并且必须在.gitignore里。我会怎么设计第一版 RAG我的判断是RuyiBookCourse第一版 RAG 不应该先做成一个庞大的 Web 知识库。它应该先做成本地 CLI 能力。比如uv run bookcourse rag index uv run bookcourse rag status uv run bookcourse rag queryPython 数据分析这本书应该怎么学uv run bookcourse rag clean这样做有几个好处。第一它符合项目现在的形态。当前项目已经有uv run bookcourse probe uv run bookcourse study-md uv run bookcourse study-validate uv run bookcourse convert新增 RAG 命令不会破坏现有节奏。第二它适合 AI 自动化。AI 可以先执行rag index再执行rag query最后把结果用于课程大纲、博客、讲义和练习生成。第三它方便以后扩展。CLI 跑通以后再做 Web UI、后台管理、课程问答页面都有底层能力可以复用。我会怎么组织索引我不会只把纯文本丢进向量库。因为电子书转课程最重要的不是“能搜到”而是“知道搜到的内容是什么”。每个 chunk 至少应该带这些信息book_title subject version chapter_title chapter_file chunk_index source_path这样 AI 回答时才能说清楚这个观点来自哪本书哪一章哪个文件。对课程生产来说这一点非常关键。我不会急着做什么我暂时不会急着做一个很重的平台。比如一开始就接复杂权限、多用户、在线文档管理、可视化工作流这些都不是当前阶段的核心。RuyiBookCourse现在最重要的是把几个底层动作做扎实电子书解析稳定章节 Markdown 干净chunk 规则可控检索结果可追溯回答能引用来源这些能力稳定以后再谈平台化才有意义。我的下一步我的下一步不是写一个漂亮的知识库页面。我的下一步是把 RAG 做进项目命令里。先让它能索引数据分析目录下已经解析好的章节 Markdown。再让它能回答真实问题。最后让它服务课程生产。如果这条链路跑通RuyiBookCourse就不只是“电子书转 Markdown”。它会开始变成一个真正能辅助我学习、备课、写作和做课程的本地知识产品。参考资料硅基流动快速开始https://docs.siliconflow.com/en/userguide/quickstart硅基流动模型列表https://www.siliconflow.com/models硅基流动 Rerank APIhttps://docs.siliconflow.cn/en/api-reference/rerank/create-rerank

相关新闻

从AI工具到生产力流程:gstack生态如何实现AI工作流工程化

从AI工具到生产力流程:gstack生态如何实现AI工作流工程化

最近在折腾 AI 原生工作流,发现一个挺有意思的现象:很多开发者,包括我自己,都卡在了一个看似简单、实则关键的环节——如何把一个“能跑起来”的 AI 工具,变成一个“能稳定用起来”的生产力流程。你肯定也遇到过&#…

2026/6/29 20:26:42阅读更多 →
如何查看主从同步的状态

如何查看主从同步的状态

一、最核心命令(在从库执行,Windows Navicat / CMD都能用) 登录从库MySQL,执行这条命令: SHOW SLAVE STATUS\G注意:结尾是反斜杠G,不要用分号。重点看这两行,决定同步是否正常&#…

2026/6/29 20:26:42阅读更多 →
Win11Debloat:让Windows 11重获新生的终极优化工具

Win11Debloat:让Windows 11重获新生的终极优化工具

Win11Debloat:让Windows 11重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and custo…

2026/6/29 20:26:42阅读更多 →
Splunk Enterprise高危漏洞CVE-2024-36991深度剖析与复现指南

Splunk Enterprise高危漏洞CVE-2024-36991深度剖析与复现指南

1. 项目概述:一次对Splunk Enterprise高危漏洞的深度剖析最近在安全圈里,Splunk Enterprise爆出的这个任意文件读取漏洞(CVE-2024-36991)讨论度挺高。作为一款广泛使用的企业级数据分析和监控平台,Splunk一旦出现这种基…

2026/6/29 22:52:52阅读更多 →
大表备份后数据回刷:知识点、设计思路与 SQL 详解

大表备份后数据回刷:知识点、设计思路与 SQL 详解

大表备份后数据回刷:知识点、设计思路与 SQL 详解 一、核心概念 1.1 大表备份(Archive) 当业务表数据量增长到千万甚至亿级时,历史数据会拖慢查询和写入性能。常见做法是将满足条件的旧数据从主表迁移到备份表或备份库&#xff0c…

2026/6/29 22:52:52阅读更多 →
软件供应链协同中的信息共享机制

软件供应链协同中的信息共享机制

软件供应链协同中的信息共享机制 在数字化时代,软件供应链已成为企业数字化转型的核心支撑。随着软件开发的复杂性和全球化协作的深入,信息孤岛、安全风险以及协作效率低下等问题日益凸显。如何通过高效的信息共享机制实现供应链协同,成为行…

2026/6/29 22:52:52阅读更多 →
QMCDecode:QQ音乐加密格式转换终极指南,3步解锁音乐播放自由

QMCDecode:QQ音乐加密格式转换终极指南,3步解锁音乐播放自由

QMCDecode:QQ音乐加密格式转换终极指南,3步解锁音乐播放自由 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录…

2026/6/29 22:52:52阅读更多 →
Python图形界面开发:从PySide2入门到实战发布

Python图形界面开发:从PySide2入门到实战发布

1. 为什么选择PySide2开发图形界面? 如果你用Python开发桌面应用,迟早会遇到一个灵魂拷问:到底该选哪个GUI库?市面上主流的方案有Tkinter、wxPython、PyQt5和PySide2。我刚开始做Python GUI开发时,也在这个问题上纠结…

2026/6/29 22:52:52阅读更多 →
三步将真人舞蹈变成3D虚拟偶像动画的终极方案

三步将真人舞蹈变成3D虚拟偶像动画的终极方案

三步将真人舞蹈变成3D虚拟偶像动画的终极方案 【免费下载链接】OpenMMD OpenMMD is an OpenPose-based application that can convert real-person videos to the motion files (.vmd) which directly implement the 3D model (e.g. Miku, Anmicius) animated movies. 项目地…

2026/6/29 22:47:50阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/29 3:27:55阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/29 2:19:08阅读更多 →
如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南

如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南

如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南 【免费下载链接】DeepBump Normal & height maps generation from single pictures 项目地址: https://gitcode.com/gh_mirrors/de/DeepBump 还在为3D建模中的纹理制作而烦恼吗?…

2026/6/29 0:01:47阅读更多 →
OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单!

OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单!

OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单! 【免费下载链接】OCAuxiliaryTools Cross-platform GUI management tools for OpenCore(OCAT) 项目地址: https://gitcode.com/gh_mirrors/oc/OCA…

2026/6/29 0:01:47阅读更多 →
终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像

终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像

终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder 你是否厌倦了Windows 11系统自带的20…

2026/6/29 0:01:47阅读更多 →