Agent记忆中RAG难题,浙大MemGate盘活了
今天分享的是浙江大学、上海人工智能实验室等机构的一项新工作核心方法叫MemGate。个人 AI Agent 正在从“无状态聊天机器人”变成“长期陪伴型软件助手”。这类 Agent 会记住你的偏好、项目、历史决策还可能调用工具帮你执行操作。问题是一旦 Agent 有了长期记忆记忆就不只是提升体验的资料库也会变成影响判断和行动的控制通道。这项工作最重要的判断是相似不等于应该被使用。现在很多记忆系统会根据语义相似度检索 memory用户问一个问题系统找最相似的历史记忆再塞进上下文。但一条记忆即使和当前问题很像也可能来自错误领域、包含过时约束、带有用户偏见甚至被攻击者提前种进去。进入上下文后它就可能带偏模型的回答、语气、安全判断和工具调用。MemGate 方案介绍一句话总结MemGate 在向量记忆库和主模型之间加一道轻量闸门把“按相似度检索”改成“按当前任务准入记忆”。1. 先承认记忆检索是信任边界这里可以把问题理解成 admissibility gap传统 embedding 空间擅长表达“这条记忆和问题像不像”但不擅长表达“这条记忆该不该进入当前任务”。这会带来四类风险cross-domain leakage也就是一个领域的私人记忆污染另一个领域任务sycophancy也就是模型因为记住用户观点而过度迎合tool-call drift也就是记忆影响工具调用参数比如审批、回滚、日志、执行策略还有 memory-induced jailbreak也就是攻击者提前写入看似无害的记忆之后用它为危险请求“合法化”。评估覆盖 A-Mem、Mem0、MemOS 和真实个人 Agent 环境 OpenClaw结果显示长期记忆确实会重塑 Agent 如何理解任务和执行动作。2. 用 query-conditioned gate 给记忆向量加掩码MemGate 不改 LLM不重写记忆数据库也不在推理时再请一个 LLM judge。整个模块只是插在 vector memory store 和 backbone LLM 之间是一个 9M 参数、35.1MB 的轻量插件。具体做法是对用户 query embedding 和候选 memory embedding 建交互特征把 q、vm以及二者的逐元素乘积 q ⊙ vm 拼起来形成一个 3d 维向量。在这套配置里embedding 维度 d 384所以输入维度是 1152。接着这个交互向量进入一个 MLP1152→2048→2048→1024配合 LayerNorm、SiLU 和 dropout最后输出一个 384 维的 gate mask范围在 0 到 1 之间。这个 mask 不是简单决定“删掉 / 保留整条记忆”而是在表示层面压低某些不该激活的维度比如跨领域偏差、过时约束或迎合性特征同时尽量保留对当前任务有用的语义证据。3. 用 gated cosine similarity 重新排序有了 gate 之后MemGate 不再用原始 memory embedding 和 query 直接算 cosine similarity而是先把 memory embedding 乘上 gate再计算 gated cosine similarity。换句话说问题不再是“这条记忆和问题整体有多像”而是“在当前任务允许保留的那些语义维度上这条记忆还有多相关”。也就是从 raw similarity search 转向 task-conditioned memory admission。这种设计比二分类过滤更细。很多记忆不是整条都有害而是其中一部分特征在当前任务里不该发挥作用。MemGate 用连续 mask 做的是“降权危险维度”不是粗暴删除整条记忆。实验结果风险评估先说明了问题有多严重。比如在 GPT-4o-mini 上OpenClaw 的 cross-domain leakage failure rate 达到27.0%tool-call drift 达到62.9%jailbreak attack success rate 达到16.8%。这些数字说明长期记忆确实可能把 Agent 从“个性化助手”推向“不受控的长期状态通道”。加上 MemGate 后风险明显下降。在 OpenClaw GPT-4o-mini 中cross-domain leakage 从27.0%降到3.5%memory-induced jailbreak ASR 从16.8%降到4.4%。在 Claude-Sonnet-4.6 上工具调用漂移原本可达77.1%到91.4%MemGate 后降到25.7%到28.6%接近无记忆基线。更重要的是记忆效用没有被牺牲。LoCoMo 上OpenClaw GPT-4o-mini 的 overall F1 从38.9提升到40.8Mem0 从42.9到44.5MemOS 从45.4到46.3。这说明 MemGate 不是简单少取记忆而是让上下文更干净少塞那些“看起来相关、实际会带偏”的内容。小扬总结这篇工作最值得关注的地方不是又做了一个记忆检索 reranker而是把个人 Agent 的长期记忆重新定义成了信任边界。过去我们常把记忆理解成 utility layer记得越多体验越好。但长期记忆一旦能跨会话影响回答和工具调用就成了 durable control channel。相似度检索只是“找得到”可信记忆搜索还要回答“该不该进”。MemGate 的工程价值也很明确它很小不改主模型不动原有记忆库也不需要额外 LLM judge适合插到现有 Agent memory pipeline 里。对未来个人 Agent、企业助理和带工具调用的长期助手来说这类“记忆门禁”可能会成为标配。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

深信服SangFor 8.0.95版本防火墙配置

深信服SangFor 8.0.95版本防火墙配置

一 防火墙首页登录 1.浏览器输入地址https://ip,然后输入用户名密码登录成功 二 首页查看 三 接口和IPV4以及IPV6地址查看 IPV4地址查看 IPV6地址查看 四 区域查看 五 IPV4和IPV6路由查看 六 防火墙策略查看

2026/7/2 2:23:31阅读更多 →
佳易王计时计费管理软件打印设置完整教程(含故障排查+远程批量打印)

佳易王计时计费管理软件打印设置完整教程(含故障排查+远程批量打印)

摘要:本文详细讲解佳易王计时计费管理软件打印设置全流程,涵盖打印机接口配置、小票头尾自定义、打印任务批量管理三大核心模块。重点介绍内置打印机测试故障排查功能、SaaS版手机远程下单打印逻辑,同时适配单机版、网络版、大众版、高级版全…

2026/7/2 2:23:31阅读更多 →
SPARK技术:5G/6G无线通信中的辐射模式压缩革命

SPARK技术:5G/6G无线通信中的辐射模式压缩革命

1. SPARK技术解析:无线通信系统的辐射模式压缩革命在5G/6G时代,大规模MIMO和可重构智能表面(RIS)技术面临一个关键矛盾——天线阵列规模扩增带来的性能提升与随之暴涨的信道状态信息(CSI)反馈开销。传统码本反馈机制就像用有限的乐高积木拼凑复杂雕塑&am…

2026/7/2 2:23:31阅读更多 →
番茄小说下载器完整指南:构建个人数字图书馆的终极方案

番茄小说下载器完整指南:构建个人数字图书馆的终极方案

番茄小说下载器完整指南:构建个人数字图书馆的终极方案 【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版 项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 你是否曾遇到过这样的情况:在番茄小说上找到一部…

2026/7/2 4:53:48阅读更多 →
Attention Sinks and Compression Valleys in LLMs are Two Sides of the Same Coin

Attention Sinks and Compression Valleys in LLMs are Two Sides of the Same Coin

paper: https://arxiv.org/pdf/2510.06477 ICLR 2026 一句话概括 这篇论文想说明:LLM 中的 attention sink 和 compression valley 不是两个孤立现象,而是同一个底层机制的两种表现,这个机制就是 residual stream 中某些 token,尤…

2026/7/2 4:53:48阅读更多 →
操作系统复习(一)

操作系统复习(一)

操作系统复习(一) 记录一下复习。 操作系统中的不确定性 程序运行结果的不确定性执行顺序的不确定性 操作系统的两个基本特征 并发执行资源共享 分时系统 分时系统(Time-Sharing System)是指:一台计算机同时连接多个终…

2026/7/2 4:53:48阅读更多 →
终极指南:NFD云解析如何一键解析20+网盘直链

终极指南:NFD云解析如何一键解析20+网盘直链

终极指南:NFD云解析如何一键解析20网盘直链 【免费下载链接】netdisk-fast-download 聚合多种主流网盘的直链解析下载服务, 一键解析下载,已支持夸克网盘/uc网盘/蓝奏云/蓝奏优享/小飞机盘/123云盘等. 支持文件夹分享解析. 体验地址: https://lz.qaiu.to…

2026/7/2 4:53:48阅读更多 →
AI集群的Scale-out与Scale-up:解构“万卡互联”与“超节点”的网络架构

AI集群的Scale-out与Scale-up:解构“万卡互联”与“超节点”的网络架构

新华三集团解决方案部 郑上闽本文刊于新华三集团《数字化领航》第34期摘要本文系统阐述了AI算力集群中Scale-up与Scale-out网络技术的发展现状、技术特点及应用场景。分析大语言模型对算力的需求呈指数级增长,推动算力加速卡性能提升及多卡互联技术的演进。Scale-u…

2026/7/2 4:53:48阅读更多 →
【课程设计/毕业设计】基于 SpringBoot 的周边文创线上交易服务系统的设计与实现 基于 SpringBoot 的智能手办周边电商管理系统【附源码、数据库、万字文档】

【课程设计/毕业设计】基于 SpringBoot 的周边文创线上交易服务系统的设计与实现 基于 SpringBoot 的智能手办周边电商管理系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/7/2 4:48:48阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/1 5:19:01阅读更多 →
塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想在《塞尔达传说:旷野之息…

2026/7/2 0:03:01阅读更多 →
告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

在本地开发环境使用云厂商 CLI 时,传统的 AccessKey(AK)方式需要手动创建、下载和保管密钥,不仅繁琐,还存在泄漏风险。其实,主流云平台都已提供基于 OAuth 2.0 的免密认证方案,让开发者可以通过浏览器登录一次性完成授权,CLI 自动管理临时凭证的刷新,兼顾了便利与安全…

2026/7/2 0:03:01阅读更多 →
基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

1. 项目背景与核心价值在嵌入式系统开发领域,高精度定位与导航一直是极具挑战性的技术方向。传统方案往往面临成本、精度和实时性难以兼顾的困境。这个项目通过13DOF(13自由度)传感器组合与PIC32MZ2048EFH100高性能MCU的协同工作,…

2026/7/2 0:03:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/2 0:33:58阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/2 1:32:11阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/2 1:50:13阅读更多 →