Vector Quantization for Recommendation 笔记
嵌入表的内存爆炸随着物品和用户规模激增完整的嵌入表Embedding Table会占用数百 GB 甚至 TB 级显存远超单机容量迫使系统采用复杂的参数服务器带来高昂的通信开销语义空间利用不足庞大的嵌入表参数中大量长尾物品的嵌入向量训练不充分而表示能力却受限于表的大小难以在有限的计算资源下进一步提升模型的表达力传统解法如特征哈希虽然能压缩内存但会带来严重的哈希冲突损失语义信息。这催生了对更高效、更灵活的向量表示方法的需求Vector Quantization正是其中一类重要方法组合式编码与码本向量量化在推荐中的核心思想是不再为每个物品学习一个独立的嵌入向量而是学习多组共享的码本codebook每个物品的最终表示由其所属码本中基向量的组合来构成。这套框架和 NLP 中的 BPE 分词或 VQ-VAE 思路相似Product Quantization想象你有一个 1024 维的向量PQ 的处理方式是切分成子空间把 1024 维向量横向切割成 8 段每段 128 维。这 8 个 128 维的小向量构成 8 个独立的子空间子空间码本为每个子空间独立训练一个码本。假如码本大小 K256那么每个子空间码本包含 256 个 128 维的基底向量8 个子空间共有 8 个独立码本独立量化原向量的第1段前128维只在第1号码本内寻找最近邻得到一个索引比如 15第2段下一个128维只在第2号码本内寻找得到一个索引比如 203……依此类推最终表示一个完整的 1024 维物品向量被表示为一个 8 元组的索引序列 比如Residual Quantization同样用 1024 维向量RQ 的处理方式是不分段而是用多级码本进行迭代式逼近第一级粗量化用第一级码本全局唯一1024 维假设K256对整个向量做最近邻查找找到第一个码字 c1计算残差求出第一级量化后的残差余量 r1 原始向量 - c1。这个残差代表了第一级没能捕捉的细节信息第二级残差量化用第二级码本专门学习如何量化残差也是 1024 维对残差 r1 进行最近邻查找得到第二个码字 c2迭代计算新的残差 再用第三级码本去量化它……如此重复 L 级最终表示与重建物品被表示为一个 L 元组的索引序列 。重建时直接把对应索引的各个码字加起来即可最终向量 ≈VQ 的学习向量量化VQ的学习通常不是一个独立的任务而是和推荐模型的最终目标如点击率预估联合训练的。其核心挑战在于“选码”操作在码本中找最近邻是不可导的梯度无法通过离散的索引回传到编码器。围绕这一点主流的学习方式分成了两大类直通估计器STE这是VQ-VAE中最经典的方法也是推荐系统中联合训练最常用的方式前向传播对于一个输入的稠密向量 比如物品经过某层网络后的表示在大小为 K 的码本中找到距离最近的码字。假设第 k 个码字 距离向量 最近那么量化后的向量就是 但是在实际上只需要存储索引 k 就行了反向传播由于 argmin 这个操作是不可导的因此 STE 会假装寻找最近邻这一步不存在直接把 的梯度作为 的梯度原封不动地拷贝给编码器的输出这相当于在反向传播时把整个量化操作近似为一个恒等映射 。只要量化误差不太大这个梯度近似就能引导编码器往正确的方向更新。为了让这个近似有效训练时会在推荐主损失如交叉熵上额外增加两个 VQ 专用的辅助损失减小码本和输入的稠密向量 之间的距离所以码本内容也是在不断更新的码本损失Commitment Loss只更新码本不更新编码器。让选中的码字 靠近编码器输出 达到训练码本的目的。形式为 其中 表示 stop gradient即 在这里被截断梯度编码器约束损失Codebook Loss 的对偶只更新编码器不更新码本。约束编码器的输出不要离码字太远避免量化误差过大。形式为 其中 对 截断梯度两者的权重通常由一个超参数 β 控制典型值如 β 0.25软量化 Gumbel-Softmax软量化就是把离散选择变成可导的连续近似代表性方法是Gumbel-Softmax不再做硬最近邻查找而是计算输入 与所有码字 的相似度如内积得到 logits然后通过 Gumbel-Softmax 产生一个近似 one-hot 的软分配向量最终的量化向量就是所有码字的软分配加权和此时前向和反向都是连续可导的在推荐中的应用嵌入层压缩直接用 VQ 技术替换传统的巨型嵌入表作为内存高效的嵌入层。这是最直接的应用适用于召回和精排阶段的特征表达semantic ID 生成将物品的完整嵌入经过 RQ 量化后得到的多级码本索引序列如可视作该物品的 semantic ID。这种离散 ID 能直接接入大语言模型成为连接推荐系统和生成式 LLM 的桥梁用于端到端的生成式推荐

相关新闻

语雀知识库一键导出到本地 Markdown,终于不用一篇篇复制了

语雀知识库一键导出到本地 Markdown,终于不用一篇篇复制了

语雀知识库一键导出到本地 Markdown,终于不用一篇篇复制了 万能导 Wandao:让知识没有边界。 只要是你有权限正常阅读的内容,都可以一键导出为本地 Markdown,并支持跨平台迁移笔记。 目前支持知识星球、语雀、飞书 Wiki、阿里云知识…

2026/6/28 9:28:39阅读更多 →
5分钟永久保存:小说下载器终极指南解决你的阅读焦虑

5分钟永久保存:小说下载器终极指南解决你的阅读焦虑

5分钟永久保存:小说下载器终极指南解决你的阅读焦虑 【免费下载链接】novel-downloader 一个可扩展的通用型小说下载器。 项目地址: https://gitcode.com/gh_mirrors/no/novel-downloader 你是否曾经遇到过这样的情况:追更的小说突然被网站下架&a…

2026/6/28 9:28:39阅读更多 →
如何用JPEGView快速图像查看器提升你的图片浏览效率:专业工具实战指南

如何用JPEGView快速图像查看器提升你的图片浏览效率:专业工具实战指南

如何用JPEGView快速图像查看器提升你的图片浏览效率:专业工具实战指南 【免费下载链接】jpegview Fork of JPEGView by David Kleiner - fast and highly configurable viewer/editor for JPEG, BMP, PNG, WEBP, TGA, GIF and TIFF images with a minimal GUI. Basi…

2026/6/28 9:28:39阅读更多 →
边界损失:解决医学图像分割不平衡问题的5个关键优势

边界损失:解决医学图像分割不平衡问题的5个关键优势

边界损失:解决医学图像分割不平衡问题的5个关键优势 【免费下载链接】boundary-loss Official code for "Boundary loss for highly unbalanced segmentation", runner-up for best paper award at MIDL 2019. Extended version in MedIA, volume 67, Jan…

2026/6/28 10:58:45阅读更多 →
2026年山东双喷喷UV卷材打印哪家强?大炫喷画了解一下

2026年山东双喷喷UV卷材打印哪家强?大炫喷画了解一下

在广告物料制作行业,山东双喷喷UV卷材打印早已成为品牌展示、商超促销、展会布置中不可或缺的核心工艺。山东作为制造业大省,广告加工产业正朝着高精度、高效率方向升级,而一批专业化工厂在其中扮演着关键角色。位于淄博的山东大炫喷画正是这…

2026/6/28 10:58:45阅读更多 →
10大实用技巧:用SRWE实现高效窗口分辨率自定义

10大实用技巧:用SRWE实现高效窗口分辨率自定义

10大实用技巧:用SRWE实现高效窗口分辨率自定义 【免费下载链接】SRWE Simple Runtime Window Editor 项目地址: https://gitcode.com/gh_mirrors/sr/SRWE 在数字工作与娱乐日益多元化的今天,窗口管理已成为影响效率与体验的关键因素。SRWE&#x…

2026/6/28 10:58:45阅读更多 →
免费医学影像转换神器dcm2niix:DICOM转NIfTI完整指南

免费医学影像转换神器dcm2niix:DICOM转NIfTI完整指南

免费医学影像转换神器dcm2niix:DICOM转NIfTI完整指南 【免费下载链接】dcm2niix dcm2nii DICOM to NIfTI converter: compiled versions available from NITRC 项目地址: https://gitcode.com/gh_mirrors/dc/dcm2niix 医学影像研究者和临床医生经常面临一个共…

2026/6/28 10:58:45阅读更多 →
如何用microeco轻松搞定微生物组数据分析:新手完全指南

如何用microeco轻松搞定微生物组数据分析:新手完全指南

如何用microeco轻松搞定微生物组数据分析:新手完全指南 【免费下载链接】microeco An R package for downstream data analysis of microbiome omics data 项目地址: https://gitcode.com/gh_mirrors/mi/microeco 还在为复杂的微生物组学数据分析发愁吗&…

2026/6/28 10:58:45阅读更多 →
TrafficMonitor插件终极指南:在桌面任务栏打造全能监控中心

TrafficMonitor插件终极指南:在桌面任务栏打造全能监控中心

TrafficMonitor插件终极指南:在桌面任务栏打造全能监控中心 【免费下载链接】TrafficMonitorPlugins 用于TrafficMonitor的插件 项目地址: https://gitcode.com/gh_mirrors/tr/TrafficMonitorPlugins 还在为频繁切换软件查看系统状态而烦恼吗?Tra…

2026/6/28 10:53:45阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →