传音TEX AI团队AI消除算法技术成果入选ECCV 2026
传音控股TEX AI团队联合上海交通大学最新产学研成果“AI消除算法”近日成功被计算机视觉领域国际顶级会议ECCV 2026 European Conference on Computer Vision接收。ECCV与CVPR、ICCV长期被认为是计算机视觉领域最具影响力的国际顶级学术会议之一每两年举办一届。本届会议共有10,473篇论文进入评审流程最终2,883篇论文被接收接收率为27.5%。该研究成果聚焦智能手机影像领域中的重要AI能力——AI目标消除AI Object Removal突破传统扩散模型推理效率瓶颈在保持高质量生成效果的同时大幅降低模型推理成本为生成式AI技术在移动终端影像场景中的规模化应用提供了新的技术路径。未来该技术将应用于传音手机图库AI消除能力以及智能助手AI修图产品为全球用户带来更加自然、高效、智能的影像编辑体验。从“多步生成”到“单步推理”突破AI消除效率瓶颈随着智能手机影像能力不断升级用户对于照片编辑的要求也从简单的滤镜、美化提高到基于生成式AI的智能编辑AI正在重新定义移动影像体验。其中AI目标消除作为生成式影像的重要应用方向可以帮助用户快速去除照片中的路人、杂物、文字等干扰内容并自动恢复自然背景。当前基于扩散模型的生成式编辑方法虽然具备优秀的视觉生成能力但通常依赖多轮迭代去噪过程推理耗时较长难以满足手机影像场景对于实时交互、快速响应和低计算成本的需求。针对上述挑战TEX AI算法团队联合上海交通大学开展深入研究探索如何将先进生成式AI技术转化为适用于智能终端场景的高效算法能力。团队创新性地提出OSOROne-Step Object Removal单步扩散目标消除算法框架将复杂的多步扩散生成过程压缩为一次前向推理实现了高质量与高效率兼顾的AI消除能力。相比传统扩散式消除方案该技术实现了显著的速度提升在多个测试场景中达到4倍至30倍推理加速同时保持优异的图像生成质量。在1024×1024分辨率图像处理任务中可在单张A100 GPU上实现1秒以内完成推理。这一突破进一步推动生成式AI影像技术从“高质量生成”向“高效率应用”发展为未来智能手机中的实时AI编辑提供技术基础。图示OSOR与现有方法推理速度和效果对比。OSOR能够有效消除目标物体及其关联视觉影响如阴影在保持高质量生成效果的同时相比次优方法ObjectClear实现10.6倍推理加速。单张1024×1024分辨率图像可在单张A100 GPU上1秒内完成处理。该效果对比基于六个公开测试基准综合得出。面向真实用户场景让AI消除更加简单可靠在真实手机影像场景中用户通常不会进行精细化的目标标注而是通过简单涂抹、圈选等方式选择希望移除的对象。因此如何适应用户输入的不精准性并在复杂拍摄环境下实现自然恢复成为AI消除技术走向产品化的重要挑战。与此同时真实照片中的目标物体往往与周围环境存在复杂的视觉关联例如阴影、反射、倒影等仅对目标区域进行简单移除容易造成背景不自然、画面违和等问题。针对这些实际使用难点团队研究提出了面向真实交互场景优化的鲁棒性AI消除方案。通过引入轻量化Alpha区域感知机制模型能够智能理解用户选定区域与目标物体之间的关系自动推断目标主体及其关联影响范围。即使用户圈选区域存在偏差模型仍能够完成更完整、更精准的目标移除并恢复自然一致的背景环境。此外团队针对真实目标消除任务构建了系统化的数据生成与验证流程建立包含28万组高质量目标消除样本的数据集为模型学习复杂场景理解能力提供了可靠的数据支撑。这些技术创新推动AI消除能力从传统的“删除目标”进一步升级为基于场景理解的“智能重建”让用户能够以更简单的操作获得更加自然真实的照片编辑效果。图示模型能够基于用户提供的不完整目标掩码智能推理待消除目标及其附带阴影等视觉影响区域实现完整区域识别并完成自然背景恢复。此次入选ECCV 2026是传音在计算机视觉领域的又一重要成果。长期以来传音持续关注视觉智能、生成式AI、多模态交互等前沿方向的研究并致力于将这些能力转化为可落地的终端产品体验逐步打通从基础研究、技术研发到产品开发的创新链路。基于此次研究成果图库AI消除与智能助手AI修图能力将率先在传音手机产品中落地帮助用户快速去除照片中的干扰元素实现更自然的影像优化同时结合多模态理解能力提升照片编辑的智能化与自动化水平。未来传音将继续以用户真实需求为出发点加速AI技术在智能终端场景中的创新应用让更多用户享受到更智能、高效、自然的影像体验。

相关新闻

Three.js 人物虚化教程

Three.js 人物虚化教程

人物虚化 人物虚化 ▶ 在线运行案例 案例合集: 三维可视化功能案例(threehub.cn)开源仓库github地址: https://github.com/z2586300277/three-cesium-examples400个案例代码: 网盘链接 你将学到什么 onBeforeCompile 注入 GL…

2026/7/2 14:20:40阅读更多 →
为什么 2024 年了 RS485 还是光伏通讯的“钉子户”

为什么 2024 年了 RS485 还是光伏通讯的“钉子户”

去年 10 月在西北某 30MW 光伏配置储能的项目现场,我们被一个通讯故障折磨了整整三天。现场运维反馈,所有的 PCS(储能变流器)数据每隔两小时就断连一次,而逆变器的 RS485 链路却稳如老狗。当时甲方架构师问了我一个特别…

2026/7/2 14:15:40阅读更多 →
3步轻松搞定音乐歌词批量下载:免费开源工具解决你的歌词烦恼

3步轻松搞定音乐歌词批量下载:免费开源工具解决你的歌词烦恼

3步轻松搞定音乐歌词批量下载:免费开源工具解决你的歌词烦恼 【免费下载链接】163MusicLyrics 云音乐歌词获取处理工具【网易云、QQ音乐】 项目地址: https://gitcode.com/GitHub_Trending/16/163MusicLyrics 还在为找不到心爱歌曲的歌词而烦恼吗&#xff1f…

2026/7/2 14:15:40阅读更多 →
基于C#制作的闯关冒险类游戏

基于C#制作的闯关冒险类游戏

♻️ 资源 大小: 50.8MB ➡️ 资源下载:https://download.csdn.net/download/s1t16/87450310 基于C#制作的闯关冒险类游戏 需求分析与概要设计 项目说明 本项目名称为《忍者小狐》,运用 unity 引擎和 c#脚本逻辑编写,是一款休…

2026/7/2 15:45:57阅读更多 →
无刷直流电机驱动系统设计与优化实践

无刷直流电机驱动系统设计与优化实践

1. 电机驱动系统的设计挑战与选型思路 在现代工业自动化、智能家居和机器人领域,电机驱动系统扮演着至关重要的角色。一个高效的电机驱动方案需要同时解决功率转换效率、控制精度、散热管理和系统可靠性等多重挑战。这也是为什么我们会选择TC78H660FTG这款电机驱动I…

2026/7/2 15:45:57阅读更多 →
2026广元黄金回收白银回收铂金回收旧料回收怎么选?五家高实价铂金白银线下门店测评清单 + 联系方式

2026广元黄金回收白银回收铂金回收旧料回收怎么选?五家高实价铂金白银线下门店测评清单 + 联系方式

广元街头巷尾的黄金铂金白银回收门店鳞次栉比,看似选择众多实则鱼龙混杂,报价虚高、克扣成色、暗设陷阱的乱象屡见不鲜。为帮市民甄别靠谱变现渠道,小编实地走访多家店铺,层层筛选出本地正规诚信商户,整理出一份高实价…

2026/7/2 15:45:57阅读更多 →
如何彻底解锁PrismLauncher离线账户功能:5个简单步骤实现无限制Minecraft体验

如何彻底解锁PrismLauncher离线账户功能:5个简单步骤实现无限制Minecraft体验

如何彻底解锁PrismLauncher离线账户功能:5个简单步骤实现无限制Minecraft体验 【免费下载链接】PrismLauncher-Cracked This project is a Fork of Prism Launcher, which aims to unblock the use of Offline Accounts, disabling the restriction of having a fun…

2026/7/2 15:45:57阅读更多 →
直流有刷电机驱动方案优化与TC78H653FTG应用实践

直流有刷电机驱动方案优化与TC78H653FTG应用实践

1. 为什么需要关注直流有刷电机驱动方案 在工业自动化、机器人、电动工具等场景中,直流有刷电机因其结构简单、成本低廉、控制方便等优势,仍然是许多应用的首选。但传统驱动方案往往存在效率低、发热大、响应慢等问题,限制了电机性能的充分发…

2026/7/2 15:45:57阅读更多 →
Ink Node:用 Docker 跑一个 Ink 链节点

Ink Node:用 Docker 跑一个 Ink 链节点

文章目录Ink Node:用 Docker 跑一个 Ink 链节点解决什么问题硬件要求部署流程验证节点状态一个需要关注的时间点适合谁用总结Ink Node:用 Docker 跑一个 Ink 链节点 Ink 是基于 OP Stack 的 Layer 2 网络,这个项目提供了一套 Docker Compose…

2026/7/2 15:40:56阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/2 12:10:34阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/2 12:10:34阅读更多 →
塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想在《塞尔达传说:旷野之息…

2026/7/2 0:03:01阅读更多 →
告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

在本地开发环境使用云厂商 CLI 时,传统的 AccessKey(AK)方式需要手动创建、下载和保管密钥,不仅繁琐,还存在泄漏风险。其实,主流云平台都已提供基于 OAuth 2.0 的免密认证方案,让开发者可以通过浏览器登录一次性完成授权,CLI 自动管理临时凭证的刷新,兼顾了便利与安全…

2026/7/2 0:03:01阅读更多 →
基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

1. 项目背景与核心价值在嵌入式系统开发领域,高精度定位与导航一直是极具挑战性的技术方向。传统方案往往面临成本、精度和实时性难以兼顾的困境。这个项目通过13DOF(13自由度)传感器组合与PIC32MZ2048EFH100高性能MCU的协同工作,…

2026/7/2 0:03:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/2 0:33:58阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/2 1:32:11阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/2 1:50:13阅读更多 →