本文分类:news发布日期:2026/5/5 10:18:52
打赏

相关文章

RAGFlow 系列教程 第十二课:混合检索引擎 -- 从索引到召回

系列: RAGFlow v0.25.0 源码深度解析 作者: 耿雨飞 前置知识: 已完成第十一课"文本分块策略详解"的学习 导读 在 RAG 系统中,检索质量直接决定生成质量——如果检索阶段无法召回正确的知识片段,后续的 LLM 生成只能"巧妇难为无米之炊"。纯向量搜索虽然擅…

自蒸馏技术(SDPO)在强化学习中的应用与优化

1. 自蒸馏技术的前世今生2019年我在调试一个Atari游戏AI时,发现模型在训练后期会出现明显的性能震荡——明明已经学会的策略突然退化得像个新手。这个问题困扰了我整整两周,直到看到Hinton团队那篇关于知识蒸馏的开创性论文。传统蒸馏需要预训练好的教师…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部