热红外视觉下的车辆/船舶重识别新方法:Vc-fes
在监控与海事安防等场景中,如何在**热红外图像**(灰度、无色彩、纹理弱)中准确识别同一辆车或同一艘船,是一个长期悬而未决的难题。近期发表于《International Journal of Machine Learning and Cybernetics》(2026年)的论文《Vc-fes: viewpoint-conditioned feature selection for vehicle re-identification in thermal vision》针对这一问题提出了一套完整的解决方案。## 问题:热红外域重识别为什么难传统的重识别(Re-ID)方法大多在RGB图像上训练,依赖颜色和纹理这类跨视角通用的线索来判断两张图片是否为同一目标。但在热红外图像中:- 没有颜色信息,只剩灰度强度;- 纹理细节被大幅削弱;- 可获取的视角数量有限(不像RGB场景那样容易采集多角度样本)。这导致同类目标(比如两艘外形相近的渔船)在缺乏颜色线索时高度相似,而同一目标从不同视角(前、侧、后)拍摄时特征差异又很大——这两个矛盾叠加,使得直接套用RGB域的重识别算法效果很差。## 方法:视角条件化的特征选择论文提出的核心思路是**将目标的前景图像按可见侧面(前、侧、后)拆分,分别提取特征并分空间比较**,再用各视角的面积占比作为置信度权重融合最终结果。整体流程分为两个子系统:**1. 目标检测与跟踪**基于 TraDeS 算法,针对热红外域做了适配与微调,先用转灰度的COCO数据预训练,再用新采集的热红外海事数据集及 Singapore Maritime Dataset 进行微调,使模型能够在缺乏颜色特征的情况下完成检测与跟踪。**2. 视角条件化重识别**- 首先用一个自建的编码器-解码器网络提取目标前景掩码(实验表明这一步比传统的 GrabCut 方法更适合热红外图像,尤其是在处理船体细小凸出部分和海面反光干扰时表现更好);- 用预训练的 Dino-ViT 提取特征,并通过四个并行线性层将特征映射到全局、前、侧、后四个隐空间,每个空间用 ArcFace 损失增强类间可分性;- 借助与 SPAN 模型类似的思路计算每个视角的**面积占比**(该视角前景掩码占总前景的比例),以此对各空间的 L2 距离加权求和,得到最终的置信度得分;- 训练时联合使用身份分类损失和三元组损失。这种设计的关键优势在于:当查询图像只能看到某一两个侧面时,面积占比会自动把不可见视角的权重降为零,避免了无效比较对最终结果的干扰。## 数据集:首个公开的热红外海事重识别数据集为验证方法,作者用 FLIR M232 热像仪自行采集了一个海事监控数据集,涵盖白天和夜晚场景,标注了船只、大型船舶、行人、水上摩托艇等4类目标的检测框,并整理出用于重识别评估的40艘小型船舶和32艘大型船舶的多视角图像子集。据作者所述,这是目前首个公开的热红外海事监控数据集,同时支持检测、跟踪与重识别三类任务的COCO格式标注。## 结果在跟踪任务上,改进后的 TraDeS 在热红外数据上取得了约 61.2% 的 MOTA,与其在RGB域的表现基本持平,同时保持 30fps 的处理速度,证明了域适配的有效性。在重识别任务上,该方法在RGBNT100(热红外车辆数据集)和作者自建的海事数据集上分别以 mAP 提升 19.7% 和 12.8% 超过此前的最优方法(SPAN)。消融实验也表明:引入 ViT 特征提取、ArcFace 视角空间映射、以及多视角特征融合(相较仅用面积占比最大的单一视角)均能带来稳定的性能提升,尤其在热红外域收益最为明显。## 链接- 论文原文:https://link.springer.com/article/10.1007/s13042-026-03049-w- 数据集主页:https://hevidra.github.io/- 代码仓库:https://github.com/YasodGinige/VCFeS-Maritime-Surveillance

相关新闻

本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家

本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家

title: 本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家? tags: 本地AI,私有大模型,Ollama,DeepSeek,大模型部署,AI隐私,离线AI,本地部署大模型,DeepSeek本地部署 category: 人工智能 本地AI完全指南①&…

2026/7/5 9:11:56阅读更多 →
同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比

同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比

前面几期测的都是模型官方 API。但你实际用的时候,大概率走的不是官方——而是通过某个聚合平台。 为什么?几个现实原因: 不想每个模型绑一张信用卡公司采购要求统一结算官方 API 在某些地区不稳定想用一个 API Key 调所有模型 所以这期我不测…

2026/7/5 9:11:56阅读更多 →
TrafficLLM:用大语言模型做开放集加密流量分析

TrafficLLM:用大语言模型做开放集加密流量分析

核心思路 加密流量仍会因包大小、时序、方向等统计特征被攻击者识别(如判断访问的网站或观看的视频),而现实场景要求模型能做“开放集”判断——只识别目标流量,其余一律拒识,不能像传统闭合集模型那样把所有输入硬塞…

2026/7/5 9:11:56阅读更多 →
三电平NPC变换器原理与工程实践详解

三电平NPC变换器原理与工程实践详解

1. NPC三电平变换器技术解析 三电平NPC(Neutral Point Clamped)拓扑是电力电子领域广泛使用的中高压功率变换方案。我第一次接触这种拓扑是在2015年的光伏逆变器项目中,当时需要解决传统两电平逆变器在高压场合的开关损耗问题。相比传统两电平…

2026/7/5 10:22:01阅读更多 →
电梯图纸解析:从符号系统到BIM应用全指南

电梯图纸解析:从符号系统到BIM应用全指南

1. 电梯图纸的工程语言解析 电梯图纸是建筑垂直交通系统的DNA,承载着从机械结构到电气控制的完整信息链。一套标准的电梯图纸通常包含以下核心图样: 井道布置图 :这是电梯系统的"骨骼框架",精确标注井道尺寸、层门位置…

2026/7/5 10:22:01阅读更多 →
PCB盘中孔工艺:高密度互连的机遇与挑战

PCB盘中孔工艺:高密度互连的机遇与挑战

1. 项目概述:盘中孔工艺的争议焦点 "盘中孔"这个看似简单的工艺名词,在PCB制造领域已经争论了整整十年。上周在公司技术评审会上,我亲眼见证了入行二十年的硬件总工和刚毕业三个月的材料学博士为这个工艺争得面红耳赤——老师傅拍着…

2026/7/5 10:22:01阅读更多 →
全桥LLC谐振变换器设计与双环竞争控制策略

全桥LLC谐振变换器设计与双环竞争控制策略

1. 全桥LLC谐振变换器概述全桥LLC谐振变换器是一种高效、高功率密度的DC-DC变换器拓扑结构,广泛应用于服务器电源、电动汽车充电桩、工业电源等领域。这种拓扑通过利用谐振腔的软开关特性,实现了主开关管的零电压开通(ZVS)和整流二…

2026/7/5 10:22:01阅读更多 →
波峰焊虚焊问题分析与解决方案

波峰焊虚焊问题分析与解决方案

1. 波峰焊虚焊问题概述 虚焊是PCB波峰焊工艺中最常见的缺陷之一,它指的是焊料与被焊金属表面未能形成良好的冶金结合,导致电气连接不可靠或完全断开。这种现象在目检时往往难以发现,但在产品使用过程中会出现间歇性导通或完全开路&#xff0c…

2026/7/5 10:22:01阅读更多 →
3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit 你…

2026/7/5 10:17:01阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/5 1:30:27阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/5 3:48:10阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/5 3:48:09阅读更多 →