开源项目WPS AI插件察元AI文档助手:段落截取:长度、重叠与策略枚举
摘要getChunkSettings 从 globalSettings 读取 chunkSettings并对 chunkLength、overlapLength 做上下界夹取。splitStrategy 支持 paragraph、sentence、char影响 documentChunker 的分割行为。关键词chunk;overlap;paragraph扩展阅读与维护提示本篇围绕「段落截取长度、重叠与策略枚举」组织材料。仓库内与主题最直接相关的检索词包括chunk、overlap、paragraph。建议在阅读正文所列片段后用 IDE 全局搜索这些符号沿 import 与调用栈向上追问「谁在什么时机调用」而不是只记住单文件路径。摘要所概括的要点为getChunkSettings 从 globalSettings 读取 chunkSettings并对 chunkLength、overlapLength 做上下界夹取。splitStrategy 支持 paragraph、sentence、char影响 documentChunker 的分割行为。落地到排障时可把现象粗分为三类交叉验证配置是否按预期写入持久化介质WPS COM 上下文是否可用例如是否缺少 ActiveDocument以及网络与证书策略是否拦截了 fetch。本篇涉及的模块通常只覆盖其中一两类需要与相邻篇目拼成完整拼图。教程文件名「13-chunkSettings-fenduan-yu-zhongdie.md」仅用于导航与排序不等价于源码模块名。若正文中的行号与本地分支不一致多半因合并导致行偏移此时应以函数名、导出名为锚重新检索团队若维护了生成脚本可在变更大段源码后重新运行以保持摘录大致对齐。本文刻意避免对产品能力做营销式承诺所述行为均以当前仓库可见实现为准。若组织策略要求离线或内网模型应在网关、证书与代理层收口而不是假设加载项能绕过浏览器安全模型。若你同时阅读 docs/chayuan-llm-chain-series可先对照其中的总体链路图理解「请求从 UI 到 chatApi」的次序再回到本教程看数据结构、默认值与修改风险面两者互补不重复堆砌功能列表。正文1. 默认值与读取未配置时返回 4000 字块长与 200 重叠的默认组合。阅读源码摘录时请把它当作「定位入口」而非完整实现同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前建议用最小文档手工走一遍相关助手或对话框并观察任务清单与日志中的字段是否与预期一致再决定是否做数据迁移或配置重置。// src/utils/chunkSettings.js 第8-28行constDEFAULT_CHUNK_LENGTH4000constDEFAULT_OVERLAP_LENGTH200constMIN_CHUNK_LENGTH500constMAX_CHUNK_LENGTH16000constMIN_OVERLAP0constMAX_OVERLAP_RATIO0.5/** * 获取段落截取配置 * returns {{ chunkLength: number, overlapLength: number, splitStrategy: string }} */exportfunctiongetChunkSettings(){constsettingsloadGlobalSettings()constrawsettings.chunkSettingsif(!raw||typeofraw!object){return{chunkLength:DEFAULT_CHUNK_LENGTH,overlapLength:DEFAULT_OVERLAP_LENGTH,splitStrategy:paragraph}}2. 合法策略非法值回退到 paragraph避免持久化损坏导致运行期异常。阅读源码摘录时请把它当作「定位入口」而非完整实现同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前建议用最小文档手工走一遍相关助手或对话框并观察任务清单与日志中的字段是否与预期一致再决定是否做数据迁移或配置重置。// src/utils/chunkSettings.js 第29-44行constchunkLengthclamp(parseInt(raw.chunkLength,10)||DEFAULT_CHUNK_LENGTH,MIN_CHUNK_LENGTH,MAX_CHUNK_LENGTH)constmaxOverlapMath.floor(chunkLength*MAX_OVERLAP_RATIO)constoverlapLengthclamp(parseInt(raw.overlapLength,10)||DEFAULT_OVERLAP_LENGTH,MIN_OVERLAP,maxOverlap)constsplitStrategy[paragraph,sentence,char].includes(raw.splitStrategy)?raw.splitStrategy:paragraphreturn{chunkLength,overlapLength,splitStrategy}}

相关新闻

森利威尔 SL8530B 3.2V-60V 宽压输入 内置 MOS 管 支持 PWM 调光恒流方案

森利威尔 SL8530B 3.2V-60V 宽压输入 内置 MOS 管 支持 PWM 调光恒流方案

一、方案简介这款升压 DC-DC 恒流驱动芯片集成 60V 功率 MOS,采用固定关断时间控制架构,2.6V 超低起振、最高 60V 宽压输入,搭配 ESOP8 散热封装,外围电路精简,可直接驱动大功率 LED 灯串,自带 PWM 调光与全…

2026/6/27 22:42:19阅读更多 →
破局异构计算与协议壁垒:基于 Docker 与 GB28181/RTSP 的开源企业级 AI 视频管理平台架构解析

破局异构计算与协议壁垒:基于 Docker 与 GB28181/RTSP 的开源企业级 AI 视频管理平台架构解析

一、 引言:智能安防时代的集成痛点 在传统的视频物联项目开发中,技术团队经常面临两大核心技术泥潭: 设备接入难、协议碎片化:海康用私有协议或旧版国标,大华用RTSP,某些老旧IPC只支持ONVIF。流媒体服务器…

2026/6/27 22:42:19阅读更多 →
电商运营的“打杂”困境:从执行者到操盘手的完整进阶路径

电商运营的“打杂”困境:从执行者到操盘手的完整进阶路径

开篇:你是在做运营,还是在给运营打杂? 做电商三年,我观察过一个现象:同样入行的两个人,三年后一个人的工资涨了三倍,成了运营经理;另一个人还在做同样的工作,每天上架、回…

2026/6/27 22:42:19阅读更多 →
Page Agent:驻留网页的 GUI 代理,多场景轻松集成!

Page Agent:驻留网页的 GUI 代理,多场景轻松集成!

Page Agent:驻留在网页中的 GUI 代理借助自然语言控制网页界面。🌐 英文 | 中文 🚀 演示 | 📖 文档 | 📢 Hacker News 讨论 | 𝕏 在 X 上关注[page - agent - demo - 0227.mp4](未给出链接&…

2026/6/28 0:08:01阅读更多 →
2026保姆级教程:PDF转Excel免费好用软件,电脑本地无水印在线工具全操作指南

2026保姆级教程:PDF转Excel免费好用软件,电脑本地无水印在线工具全操作指南

日常办公经常需要把报表、票据 PDF 导出成 Excel 表格,2026 年市面上可用的转换工具分为微信小程序、在线网页工具、电脑本地软件、Office 自带功能四大类,每一类都有适配不同设备 Windows、Mac 的操作方案,涵盖免费无水印、离线本地处理、批…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
ps矫正图片倾斜怎么弄?ps矫正图片倾斜的方法

ps矫正图片倾斜怎么弄?ps矫正图片倾斜的方法

日常摄影与平面设计里,画面倾斜是十分普遍的问题。不管是拍摄时手部抖动、相机摆放歪斜,或是后期排版调整需要,精准修正倾斜画面都是一项必备实操能力。Photoshop提供了多种工具与方法,能够适配各类使用场景。以下从基础到进阶&am…

2026/6/27 23:57:26阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →