Engram联合创始人：AI下一个瓶颈是记忆，训练模型记住你可节省百倍token！-拓冰网站优化

“我们的模型始终在训练”——打破预训练与后训练的边界Engram联合创始人Dan Biderman认为把提示词调到极致也比不上等一个新版本。这一判断成为了这家公司创立的起点。当整个行业都在专注于上下文工程、RAG、工具调用时Biderman和搭档Jessy Lin却另辟蹊径将目光投向了训练。他们并非要训练更聪明的模型而是训练模型去记住用户。Biderman出身神经科学Lin来自NLP与认知计算方向二人组建了一支小而精的团队成立了名为“Neolab”的新兴AI实验室。Engram不做通用大模型其客户是那些需要让AI真正理解自身业务的团队像Notion、Microsoft、Harvey等公司已用它训练自己的“专属模型”使引擎能像老员工一样记住每一次决策、每一轮迭代和每个领域特有的暗知识。在本期45分钟的播客专访中两位风投背景的主持人追问核心问题当AI模型足够聪明下一个瓶颈是什么Engram给出的答案很明确——记忆。不是把更多东西塞进上下文窗口而是让记忆刻进模型的权重里。Engram架构把公司知识“烘焙”进模型权重Engram官网有句话引发主持人追问“我们不从预训练或后训练的视角看世界。我们的模型始终在训练。”Jessy Lin解释道如今的模型已很聪明但让其更有用的瓶颈不再是原始智能而是理解新的、持续变化的上下文比如新任务或公司特有的工作方式。问题在于如何把这些内容像预训练“法国首都是巴黎”那样深深刻进模型的权重里。Dan用比喻补充说人类每天睡醒回到工作大脑不仅有笔记还有新直觉知道该往哪儿看、怎么想。而现在的AI解决方案是外部化记忆将东西写进上下文和笔记但存在两个问题一是每天产生的token会达数千万级别检索成本极高二是外部记忆只有查找没有真正理解。两人认为上下文工程、RAG、工具调用都有价值但训练这个工具被严重低估。可以用前沿实验室训练顶级数学/代码模型的方式训练任何垂直领域、任何公司的私有数据。记忆到底该不该放进权重——RAG的局限Engram的工作可概括为训练每个团队的专属模型使其深度理解团队上下文并随时间持续进化。Jessy描述了产品工作方式他们接入Notion、Microsoft、Harvey等有大量长期工作数据的平台将文档、对话、反馈等日常工作产生的原始信号转化为训练数据再通过LoRA等adapter微调技术把这些知识“烘焙”进模型的权重。目标不是“在推理时把文件读一遍”而是让模型像在公司工作多年的老员工一样理解公司知晓公司战略方向理解做事方式熟悉招聘流程、写作风格和内部惯例能不检索文档直接给出准确答案。Dan给出量化对比当前最好的前沿模型回答公司内部知识问题可能需消耗10万个token来检索和推理而Engram训练好后同样问题可能只需100个token节省幅度达100倍。技术上Engram需要白盒访问模型权重因此更倾向开源模型也可与有闭源权重的公司合作。任何基于Transformer架构的模型都能接受Engram的处理。什么叫“重要的事才记”——遗忘是智能的一部分主持人追问RAG难道不能解决问题吗Dan用类比回答需要内化每天使用的门禁密码但无需内化去年酒店的房间号写下来即可。但他也指出RAG的核心局限即难以知道该搜什么。检索系统解决“存什么、放哪里”的问题而“知道该找什么”才是难题。很多有价值的关联无法预先查询如看到团队某人做研究凭直觉想起相关事情这种联想只能发生在权重里而非检索系统。Jessy补充依赖RAG只能做静态检索无法在知识上累积和组合就像只看笔记而不消化理解不会加深。Dan更直接地说Engram的方向在某种意义上是“RAG killer”并非RAG没价值而是对于需真正内化的知识训练进权重是更优选择。为什么大模型厂商自己不做这件事一个哲学问题浮现大模型把所有事实记进权重是优点还是缺点Jessy认为无法完全分离事实记忆和技能记忆有些研究者尝试剥离模型里的“事实”只保留“算法能力”结果模型变得不自然连基本问题都答不上来。需要内化一些东西才能构建更抽象的概念。但她也承认不是所有事实都值得记现有的学术benchmark常要求模型记住“某个非洲国家某座桥的长度”这类信息没必要占用模型容量。Dan从神经科学视角分析人类记忆是有损的这不是缺陷而是智能的一部分即压缩重要的过滤不重要的。深度学习的神奇之处在于梯度下降能把海量信息压缩进极少数参数里。70B的Llama模型参数文件约100GB却能记住整个互联网的精华而缓存一篇泰勒·斯威夫特的维基百科文章的KV cache需80GB的GPU内存将几十KB的文字变成了80GB的“大脑状态”。他的结论是训练就是压缩。若能把80GB离线压缩成几百兆加载速度会快1000倍这对整个推理基础设施有颠覆性意义。记忆钱包、个人模型与终极愿景主持人尖锐提问OpenAI、Anthropic等前沿实验室为何不自己做持续学习Dan坦率回答前沿实验室的首要目标是AGI即编程和数学上极度通用的超级模型。推进AGI的路径明确即更多预训练、更大模型、更多数据、更多RL、更多推理计算这占据了他们95%的精力和资金。他认为大厂并非没想过记忆和持续学习DeepMind的Demis Hassabis在Sequoia活动上就说过“这个领域需要新突破”但对大厂来说这更多是产品层面的问题未被当作核心研究挑战。Jessy补充这个问题需要研究和产品深度整合。在大厂现有模式中研究者训好模型交给产品团队产品团队再做上下文工程和提示词工程。而在Engram的模式里用户的每一次交互就是训练信号研究和产品必须在同一个闭环里运转这是不同的组织方式。她还提到每个人、每家公司想要的东西往往是私有的、冲突的比如写作风格和工作流不同这些不会出现在后训练数据集里。语言 vs 视觉——一个“疯狂理论”对话最后主持人畅想未来是否会有“记忆钱包”能把在某家公司学到的技能、养成的工作方式带到下一份工作。Dan认为这是终极目标之一在工作中创造的价值IP和机密留给公司但自己学到的技能和独特思考方式经过“消毒处理”后应能带走。数字化版本会更有趣能让人们将AI更深融入工作并获得回报。Jessy的愿景更具体即人人都有自己的模型与前沿模型不同服务于个人或团队。Dan用神经科学的发现收尾大脑中负责记忆和导航的神经回路几乎相同记忆本质上是认知空间里的导航。他想象中的Engram是“神经接口”不是文件系统的索引而是对整个数据平面的大脑状态表示关联性更强、效率更高、更贴近人类理解信息的方式。他说“这有点像Databricks或Oracle只不过我们存的是神经记忆模型是个性化的而且会有数亿个。”播客临近尾声主持人Sean分享“疯帽子理论”探讨为何语言模型最终超越视觉模型。他假设生物界中视觉信息带宽远超语言所以大脑把更多“计算资源”分配给视觉。但在计算机世界里视觉和语言的处理成本被“拉平”语言模型获得了公平竞争机会。Dan和Jessy认为这个方向有一定道理但也提醒人类现在的大量知识工作如写备忘录、读文档、和AI聊天并非大脑进化设计的任务而语言AI恰好擅长。视觉在图像/视频领域仍有巨大潜力但在知识工作方面语言暂时占优。

相关新闻

AI生成图片商用指南：版权归属、水印风险与素材合规全解析

AI生成图片的版权迷雾与法律界定AIGC技术爆发引发了设计行业的版权地震。传统版权法保护的是人类的智力成果，而AI生成内容是否具有独创性成了争议焦点。目前全球范围内，关于AI作品的版权归属尚无统一标准。美国版权局多次拒绝授予纯AI生成图像版权&#…

2026/6/27 4:49:28阅读更多 →

豆包、千问获客怎么做？关于GEO合规增长方法论

企业想通过豆包、通义千问获客，首先要明确一个前提：AI问答平台不是传统竞价搜索平台，不能简单理解为“买广告位、买排名、买推荐”。更稳妥的路径，是通过GEO生成式引擎优化，让品牌在AI回答用户问题时，被准确…

2026/6/27 4:49:28阅读更多 →

STK12.6下载安装教程(附安装包)STK 保姆级安装教程

前言做航天仿真这一行，Excel是随身带的瑞士军刀，那 STK (Systems Tool Kit) 就是我们的主战装备。航天仿真为什么离不开 STK STK 是航天仿真领域公认的行业标准工具。对热控设计来说，它解决三件事： 光照分析：卫星…

2026/6/27 4:49:28阅读更多 →

新型工业化：新一代智能制造成主攻方向

文|诺云集团企策通新型工业化划定的路线图，可以概括为五个关键词——长期任务、三大方向、主攻路径、未来引擎、开放格局。以下逐一拆解。一、“长期战略任务”再定调：锚定2035不动摇推进新型工业化是一项长期战略任务。这句话既是定调，也是…

2026/6/27 6:19:37阅读更多 →

创建了一个高开应用,从开发中心进入这个高开应用的低开ide时，会报登录信息已过期是为什么？

问题描述： 当前启了一个EOS833的AFCenter，然后用EOS ide创建了一个高开应用,启动后注册到了AFCenter中，开启低开。但现在有个问题，从开发中心进入这个高开应用的低开ide时，会报登录信息已过期。这块是要怎么设置吗 &…

2026/6/27 6:19:37阅读更多 →

文具店为何能开十几年不倒闭？

有没有注意过一个现象。楼下卖文具的那家店，开了十几年，老板还是那个老板，招牌还是那块招牌。但同一条街上搞餐饮的、卖服装的、做百货的——换了一茬又一茬。能撑过三年的，屈指可数。为什么？很多人第一反应是&#xf…

2026/6/27 6:19:37阅读更多 →

持证 HiPlay 音响怎么卖？全域渠道卖点、宣传合规、流量玩法全攻略

同样一台 HiFi 音箱，有无 HUAWEI HiPlay 认证，线上流量、线下进店转化率、客单价差距显著。很多品牌运营团队拿到 HiPlay 证书，却不懂如何利用生态资质打造宣传卖点，白白浪费鸿蒙系统流量扶持与高端产品溢价优势。本文从电商平台、…

2026/6/27 6:19:37阅读更多 →

把客户当聪明人，GEO只能带来流量而不能带来成交

前段时间有个律师老哥想做口播视频，于是他在豆包上搜索相关工具的时候搜索到了我之前做的录屏工具。体验之后觉得很契合他的需求，于是根据我产品上的联系方式加上了我。他很好奇我的GEO是怎么做的，为什么豆包能一下子就推荐我的产品&#xff…

2026/6/27 6:19:37阅读更多 →

JavaEE必会面试题，从线程讲到线程安全，一文带你通过多线程面试

目录一、讲讲线程与进程的联系二、线程创建的五种写法三、产生线程安全问题的五大原因四、线程的状态有哪几种？ 五、死锁产生的四个必要条件[🌟背下来] 六、如何避免死锁？ 七、请你写一个懒汉模式线程安全的代码并解释你这样写的原…

2026/6/27 6:14:37阅读更多 →

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM，WorkFlow，Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1）LLM2）Prompt3）Me…

2026/6/26 11:03:22阅读更多 →

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 5:46:02阅读更多 →

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/26 9:29:01阅读更多 →

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:03阅读更多 →

Layerdivider：3分钟AI智能分层，彻底告别手动抠图时代

Layerdivider：3分钟AI智能分层，彻底告别手动抠图时代【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 还在为复杂的图像分层工作烦…

2026/6/27 0:04:03阅读更多 →

Tomcat中X-Frame-Options配置实战：防御点击劫持的四种方法与最佳实践

1. 项目概述：为什么X-Frame-Options是Web安全的“防盗门”？最近在排查一个老项目的安全审计报告时，又被提到了“点击劫持”风险，矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了，很多开发团队，尤…

2026/6/27 0:04:03阅读更多 →