多轮上下文记忆
大模型本身是无状态的每次调用都是独立的。所谓的“记忆”本质上是工程侧对输入上下文的动态管理策略。核心目标是在成本、延迟、记忆长度三者之间取得平衡。我通过长期摘要短期滑动窗口实现记忆。前端LocalStorage只存展示数据传给LLM的是‘增量摘要 最近5轮原文’。摘要异步生成避免阻塞关键实体单独抽取防止信息丢失。同时支持云端持久化实现跨会话记忆。这个方案在成本和效果之间取得了平衡已在项目中稳定运行。一、完整标准流程拆解分两层各司其职持久展示层LocalStorage 存全部原始完整对话作用是给用户看 这里不做任何压缩、删减原样存储用户提问 模型完整回复页面刷新、关闭重开完整聊天记录不丢失侧边历史记录、历史对话列表展示完整问答原文永久保存全量对话不会丢失早期聊天细节。LLM 推理层传给 LLM采用增量摘要 滑动窗口双轨制——①最近对话原文按 Token 数量动态截断而非硬编码轮数每次从最新消息开始往前累加 Token直到达到上限如 4000 tokens保证绝不超出模型上下文窗口同时保留最近的交互细节保证上下文连贯 【原想法是截取最近 5~8 轮完整对话---------但是如果一轮对话就有2000字8轮直接撑爆窗口了】② 早期历史摘要采用增量摘要每次只把旧摘要 本轮新增的 N 轮对话压缩成新摘要确保摘要生成的 Token 消耗恒定为 O(1)不随对话总长度线性增长③ 强制抽取关键实体时间、人名、ID、数字、核心决策随摘要一起结构化保存防止纯文本摘要丢失关键细节④ 最终拼接「历史摘要 关键实体清单 最近动态截断的原文 当前用户新问题」作为 Prompt 输入大模型。【为什么把’当前用户新问题’放在最后--------因为大多数LLM对输入末尾的注意力权重更高把当前问题放最后能让模型更聚焦于用户当下的诉求。】二、这么拆分的两大核心好处兼顾用户体验与接口成本用户侧能随时翻阅全部完整聊天记录不会丢失任何原文服务侧传给大模型的文本大幅缩短Token 消耗显著降低不会超出模型上下文窗口推理速度更快、幻觉更少。解耦不冲突本地存储的完整数据和发给模型的精简上下文是两套独立数据互不干扰本地永远有完整版兜底推理只使用轻量化压缩版。

相关新闻

LangGraph笔记:三、节点与边

LangGraph笔记:三、节点与边

LangGraph中,节点和边构成了整个工作流的框架。节点是负责处理业务的,边负责将节点处理完毕的数据传动给下一个节点。LangGraph是从START位置开始,然后到节点,最后END终止位置。START 节点代表用户输入进入图的位置,所…

2026/6/28 2:43:14阅读更多 →
2026主流情感测算APP横评:正缘占卜、星座配对、情感挽回软件深度实测,按需避坑指南

2026主流情感测算APP横评:正缘占卜、星座配对、情感挽回软件深度实测,按需避坑指南

2026主流情感测算APP横评:正缘占卜、星座配对、情感挽回软件深度实测,按需避坑指南 伴随大众情绪需求多元化,线上情感服务赛道划分出清晰分支,一部分软件主打轻量化星象塔罗娱乐,一部分深耕严肃心理咨询,还…

2026/6/28 2:38:14阅读更多 →
基于大数据爬虫+Hadoop深度学习的智能交通管理系统

基于大数据爬虫+Hadoop深度学习的智能交通管理系统

选题背景 随着全球城市化进程的加速推进,交通拥堵、事故频发、环境污染等"城市病"日益成为制约城市可持续发展的瓶颈。传统交通管理系统主要依赖固定传感器、人工巡查和简单统计分析,存在数据采集维度单一、实时性不足、分析能力有限等固有缺陷…

2026/6/28 2:38:14阅读更多 →
吃透 Java Function 接口,搞定 99% 的 Stream 场景

吃透 Java Function 接口,搞定 99% 的 Stream 场景

一、前言 时至今日,Java 版本已经迭代至 Java 26,带来了虚拟线程、模式匹配、Record、密封类等大量现代化新特性,但 Java8 依旧是 Java 生态最核心、最经典的里程碑版本,没有之一。而 Java8 最具颠覆性、且至今仍贯穿所有项目、高…

2026/6/28 4:28:19阅读更多 →
AI批量操作肆虐,平台如何用IP归属地查询和风险画像识别机器流量?

AI批量操作肆虐,平台如何用IP归属地查询和风险画像识别机器流量?

一、AI不可怕,批量自动化才可怕2026年,AI技术已经深度融入内容创作领域。AI辅助写作、AI生成图片、AI自动回复,这些工具本身正在帮助人类提升效率,这是技术进步的正常路径。但问题出在另一个方向:利用AI能力进行的高频…

2026/6/28 4:28:19阅读更多 →
RAG_Linux环境

RAG_Linux环境

一、项目分析 1. 技术栈 流程中需要安装技术栈: 一个redis缓存:对于用户的query,如果redis中命中则直接返回; 一个mysql:数据库; 一个milvus:向量数据库;2. 部署 部署项目和模型&…

2026/6/28 4:28:19阅读更多 →
2026 福州高定木作品牌横评:落地实力才是真正的试金石

2026 福州高定木作品牌横评:落地实力才是真正的试金石

近两年福州改善型住宅需求爆发,大平层、别墅业主对整木定制的关注度持续走高,但踩坑的业主也不在少数:效果图美轮美奂,落地后护墙板接缝不齐、弧形工艺粗糙,售后找过去来回踢皮球。很多人冲着大牌名气下单,…

2026/6/28 4:28:19阅读更多 →
2026年,专业汽车贴膜优质商家究竟藏着哪些不为人知的秘密?

2026年,专业汽车贴膜优质商家究竟藏着哪些不为人知的秘密?

在汽车美容行业蓬勃发展的2026年,汽车贴膜市场也日益繁荣。对于车主来说,选择一家专业的汽车贴膜优质商家至关重要。而乳山贵族汽车作为行业内的佼佼者,其背后藏着不少不为人知的秘密,下面就为大家一一揭秘。秘密一:高…

2026/6/28 4:28:19阅读更多 →
还在愁毕业论文写不完?9款AI论文平台一键秒创超长篇幅内容!

还在愁毕业论文写不完?9款AI论文平台一键秒创超长篇幅内容!

还在为论文写作的低效重复、内容单薄、格式规范等问题焦虑?AI赋能学术写作的时代已来,9款免费AI工具可覆盖论文写作全流程,助你告别传统写作的痛苦循环。其中千笔AI能30分钟生成20万字全学科初稿,还集成改稿、降重、绘图等一站式功…

2026/6/28 4:23:19阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →