百度:渐进多令牌预测加速文档解析
标题P-MTP: Efficient Document Parsing via Multi-Token Prediction with Progressive Depth Scaling来源arXiv, 2606.24447v1️文章简介研究问题如何解决视觉语言模型在文档解析任务中因自回归解码导致的推理延迟高及多令牌预测深层优化不稳定的问题主要贡献论文提出P-MTP框架通过渐进课程损失和置信度门控动态起草机制实现文档解析高达5倍加速且精度无损。重点思路采用轻量级串行共享MLP作为多令牌预测模块在单次前向传播中循环生成多个前瞻令牌平衡了建模能力与计算开销。设计渐进课程损失用于训练包含序列路径约束和回溯目标约束根据累积概率自适应加权抑制远距离预测的梯度噪声。利用上述动态权重机制实现从易到难的自动优化过渡使模型能稳定扩展至9层甚至更深的预测深度避免传统静态权重的局限。提出置信度门控动态起草策略用于推理依据实时累积联合概率自适应调整起草长度在高确信度时延长预测低确信度时及时截断。建立可靠性感知的阈值校准方法将推理置信度阈值与训练终端损失及预测深度关联确保推理行为与训练时的课程学习动态一致。分析总结在PubTabNet等基准测试中P-MTP在保持TEDS分数与基线持平的情况下实现了最高5.24倍的推理加速验证了深层前瞻预测的有效性。消融实验表明动态权重策略显著优于固定权重或静态衰减权重且序列约束与回溯约束的协同作用是提升接受率和加速比的关键。相比固定深度起草置信度门控动态起草在不同预测深度下均提升了平均接受长度有效减少了无效计算进一步推高了吞吐量。该方法具有良好的通用性与扩展性在InternVL、Qwen3-VL等不同基座模型及公式、表格、通用文档解析任务上均取得显著加速效果。模型规模缩放实验显示随着参数量增加方法的平均接受长度单调上升证明大模型更强的长程依赖捕获能力有利于多令牌预测。个人观点论文不同于以往依赖静态权重的做法设计了轨迹感知的动态损失权重将训练时的课程学习思想延伸至推理阶段通过置信度门控实现了“按需预测”。

相关新闻

第27篇:数据合规审计:从“承诺合规”到“证明合规”

第27篇:数据合规审计:从“承诺合规”到“证明合规”

能力血缘追踪提供不可篡改审计日志,TEE远程证明提供硬件级验证——当审计师问“请证明”,你不再需要解释,只需要展示 一、一份让审计师摇头的审计材料 某企业年度数据合规审计。审计师翻完厚厚一叠材料,抬头看向对面的CIO。[1] …

2026/7/5 13:32:28阅读更多 →
第26篇:数据分类分级:DISC架构下的数据敏感度标记体系

第26篇:数据分类分级:DISC架构下的数据敏感度标记体系

核心数据绝不出域、重要数据经审批有限流动、一般数据按策略流动——分类分级标签随数据生命周期动态附着 一、一份被忽略的分类分级清单 某企业的数据分类分级项目已经完成了三年。那份Excel清单被存档在合规部门的共享盘里,文件名是“数据分类分级清单_V3.0_最终…

2026/7/5 13:32:28阅读更多 →
AI 落地顾问怎么验收:一份任务卡和交付物清单

AI 落地顾问怎么验收:一份任务卡和交付物清单

AI 落地顾问怎么验收:一份任务卡和交付物清单 很多企业找 AI 落地顾问时,容易把问题问成:这个人懂不懂模型,会不会搭 Agent,有没有案例。 这些问题有必要,但不足以验收。 真正应该验收的是:顾问…

2026/7/5 13:32:28阅读更多 →
DataMapper Core核心组件解析:Identity Map如何确保对象唯一性与内存优化

DataMapper Core核心组件解析:Identity Map如何确保对象唯一性与内存优化

DataMapper Core核心组件解析:Identity Map如何确保对象唯一性与内存优化 【免费下载链接】dm-core DataMapper - Core 项目地址: https://gitcode.com/gh_mirrors/dm/dm-core DataMapper Core是一个轻量级的对象关系映射(ORM)框架&am…

2026/7/5 16:42:49阅读更多 →
Swift开发者必看:Objective-C-RegEx-Categories桥接与使用指南

Swift开发者必看:Objective-C-RegEx-Categories桥接与使用指南

Swift开发者必看:Objective-C-RegEx-Categories桥接与使用指南 【免费下载链接】Objective-C-RegEx-Categories NSRegularExpression extensions that make regular expressions easier in Objective-C, Swift, iOS, OSX 项目地址: https://gitcode.com/gh_mirror…

2026/7/5 16:42:49阅读更多 →
ENFUGUE API开发指南:如何集成AI图像生成到你的应用

ENFUGUE API开发指南:如何集成AI图像生成到你的应用

ENFUGUE API开发指南:如何集成AI图像生成到你的应用 【免费下载链接】app.enfugue.ai ENFUGUE is an open-source web app for making studio-grade images and video using generative AI. 项目地址: https://gitcode.com/gh_mirrors/ap/app.enfugue.ai ENF…

2026/7/5 16:42:49阅读更多 →
Topit:终极macOS窗口管理方案,彻底改变你的多任务工作方式

Topit:终极macOS窗口管理方案,彻底改变你的多任务工作方式

Topit:终极macOS窗口管理方案,彻底改变你的多任务工作方式 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 在macOS系统中,你…

2026/7/5 16:42:49阅读更多 →
Andromeda开发者工具完全指南:REPL、LSP与性能分析

Andromeda开发者工具完全指南:REPL、LSP与性能分析

Andromeda开发者工具完全指南:REPL、LSP与性能分析 【免费下载链接】andromeda JS runtime lolz 项目地址: https://gitcode.com/gh_mirrors/andromeda18/andromeda 想要快速提升JavaScript和TypeScript开发效率吗?Andromeda作为一款基于Rust构建…

2026/7/5 16:42:49阅读更多 →
sw-test核心代码解密:cacheFirst策略如何提升Web应用性能

sw-test核心代码解密:cacheFirst策略如何提升Web应用性能

sw-test核心代码解密:cacheFirst策略如何提升Web应用性能 【免费下载链接】sw-test Service Worker test repository. This is a very simple demo to show basic service worker features in action. 项目地址: https://gitcode.com/gh_mirrors/sw/sw-test …

2026/7/5 16:37:48阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/5 1:30:27阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/5 3:48:10阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/5 3:48:09阅读更多 →