(论文速读)基于扩散模型潜变量的旋转机械健康监测与早期故障检测方法
论文题目A health monitoring and early fault detection method of rotating machines based on latent variables of diffusion model基于扩散模型潜变量的旋转机械健康监测与早期故障检测方法期刊Mechanical Systems and Signal Processing 2025摘要深度生成模型在旋转机械的智能状态监测中得到了突出的应用主要利用重构误差作为健康指标(HIS)来表示实际的健康状况。这种构建HIS的方法极大地影响了健康监测和早期故障检测的健壮性和有效性。潜在变量(LV)的加入被认为是为了缓解这些挑战。尽管如此现有的深度生成模型的有限建模能力限制了它们捕获复杂模式的能力。对此本文提出了一种利用扩散模型中的潜在变量进行健康监测和故障预测的新方法。设计了一种基于多头自我注意机制(MHSA)的网络结构以有效地将时间序列监测数据映射到潜在空间。扩散模型最初是使用健康监测样本进行训练的。随后对于每个监测样本帧分析监测样本和健康样本在潜在空间中的分布差异以构建HIS。针对多个场景中的基线模型对我们提出的方法进行了全面的定量和定性比较。结果表明该方法在旋转机械状态监测和故障预测中具有良好的稳健性和有效性。用扩散模型的潜变量做旋转机械健康监测——LV-MHSA-Diffusion 详解1. 研究背景与动机旋转机械轴承、齿轮、传动轴等是工业系统的核心部件。对它们进行健康监测Health Monitoring和早期故障检测Early Fault Detection能够在故障真正发生之前发现隐患从而保障设备全寿命周期的安全运行。目前主流的智能监测方法可以分为两大类信号处理类方法依赖先验故障知识对特定部件效果好但泛化能力有限。AI 类方法以深度生成模型为代表无需大量有标签数据仅用健康样本训练对高维数据处理能力强近年来受到广泛关注。在 AI 类方法中研究者通常用健康指标Health IndicatorHI来定量描述设备的健康状态。HI 的构建质量直接决定了监测系统的鲁棒性和有效性。2. 现有方法存在的核心问题论文系统梳理了当前深度生成模型在 HI 构建中面临的三大瓶颈问题一基于重建误差的 HI 受噪声干扰现有方法包括 VAE、GAN通常以数据空间中生成样本与原始样本之间的分布差异作为 HI例如重建误差和对数似然函数。然而原始监测信号本身含有噪声生成过程也存在时延这些因素会污染 HI 的构建使其偏离设备真实健康状态。问题二VAE 和 GAN 的潜变量空间表达能力有限VAE使用单一正态分布对编码/生成过程建模表达复杂数据分布的能力不足GAN训练过程不稳定生成器与判别器之间的平衡难以维持模式坍塌问题。两者的潜变量LV数量有限限制了模型对设备真实健康状态变化的精细刻画能力。问题三扩散模型的潜变量用于健康监测尚未被系统开发扩散模型DDPM具备多步骤、多潜变量的丰富潜空间在图像生成等任务上已取得优异表现理论上更适合构建 HI。但目前将其潜变量用于旋转机械健康监测的研究几乎空白。此外DDPM 原始骨干网络U-Net主要为图像分割设计对工业监测信号这类长时序数据的上下文信息和时间依赖性捕捉能力不足亟需专门的网络结构设计。3. 论文提出的方法LV-MHSA-Diffusion针对上述三大问题论文提出了一套完整的健康监测框架核心创新点如下3.1 创新点一用 MHSA 替换 U-Net 作为扩散模型骨干网络论文设计了基于多头自注意力机制Multi-Head Self-AttentionMHSA的网络结构用于替代 DDPM 中的 U-Net以更好地处理时序监测数据。网络结构如下输入层接受时序监测样本Case I 维度为 512Case II 维度为 1024时间嵌入Time Embedding对扩散时间步 t 进行编码与输入特征融合两层 MHSA 模块每层包含 LayerNorm → MHSA8个注意力头→ Linear → SiLU → LayerNorm输出层预测每一步加入的噪声配图位置Fig. 6Case I 网络结构图和 Fig. 13Case II 网络结构图训练目标与标准 DDPM 一致最小化预测噪声与真实噪声之间的 L2 距离3.2 创新点二基于潜变量分布差异构建 HI这是本文最核心的思想。核心假设扩散模型在健康样本上训练完成后若输入的监测样本健康反向去噪过程能顺利恢复原始信号前向与反向转移概率之间的 KL 散度较小若输入的监测样本出现故障去噪过程受到干扰KL 散度增大。因此对第 n 帧监测样本计算每个扩散时间步 t 的分布差异对所有时间步求均值得到第 n 帧的 HI这种构建方式完全在潜变量空间进行避免了重建误差中数据空间噪声的干扰同时利用了扩散模型远比 VAE/GAN 更丰富的多步潜变量。3.3 方法整体流程整个 LV-MHSA-Diffusion 框架分为三个阶段① 数据采集与预处理将振动信号裁剪为多个时序片段构建健康样本集。② 扩散模型训练仅用健康样本通过前向加噪和反向去噪两个子过程训练 MHSA 扩散模型。③ HI 构建与应用对每帧监测数据计算潜变量空间的 KL 散度生成 HI 序列用于健康监测和早期故障检测。配图位置Fig. 3LV-MHSA-Diffusion 整体工作流程图4. 实验验证论文设计了两个案例进行验证覆盖了仿真和真实工况两种场景。4.1 案例一轴承故障仿真数据集实验设置基于滚动轴承外圈故障动力学仿真模型生成数据集。通过设定不同的外圈缺陷深度构建对应不同健康等级的振动响应配图位置Fig. 4外圈故障仿真模型示意图编号缺陷深度×10⁻⁶ m健康状态样本数量10.001健康40020.01Level 140030.1Level 240040.5Level 340051.0Level 4400配表位置Table 2实验参数设置仿真参数采样频率 20000 Hz转速 2000 rpm每段样本长 512 点见原文 Table 1。配表位置Table 1仿真参数为测试鲁棒性在原始信号中叠加不同信噪比SNR no noise / 1dB / −5dB的高斯白噪声。结果一HI 单调性验证计算每个扩散时间步的分布差异可观察到随故障等级增加曲线整体呈上升趋势。由此构建的 HI 随缺陷深度单调递增与退化真值高度一致。配图位置Fig. 7分布差异曲线及 HI 结果结果二鲁棒性对比定性将本文方法与5个基线模型Anomaly-Transformer、LSTM-AE-OC-SVM、WGDT、STGAT-MAD、OmniAnomaly在不同 SNR 下的 HI 曲线进行对比。从结果可以看出即使在强噪声环境SNR −5dB下本文方法的 HI 曲线仍能保持与退化过程一致的单调趋势且各损伤等级下的误差带error band明显小于其他基线方法。配图位置Fig. 8各方法在不同噪声下的 HI 曲线对比共6幅子图结果三鲁棒性对比定量采用余弦相似度Cosine Similarity衡量构建的 HI 与缺陷深度真值之间的一致性方法1dB−5dBLV-MHSA-Diffusion本文0.990.33Anomaly-Transformer0.980.86LSTM-AE-OC-SVM0.980.89WGDT0.980.86STGAT-MAD0.990.52OmniAnomaly0.40.88配图位置Fig. 9余弦相似度定量对比柱状图在强噪声−5dB场景下各基线方法性能均有明显下降而本文方法保持了相对较优的表现体现了潜变量 HI 构建策略在抗噪方面的优势。结果四消融实验将本文方法与以下四种变体进行对比LV-MHSA-Diffusion本文MHSA LVReconstruction-MHSA-DiffusionMHSA 重建误差LV-DDPMU-Net LVReconstruction-DDPMU-Net 重建误差配图位置Fig. 10消融实验余弦相似度对比结论无论采用哪种网络结构基于 LV 的 HI 均优于基于重建误差的 HI验证了潜变量策略的核心价值。MHSA 与 U-Net 在健康监测性能上相近但在推理速度上差异显著网络结构FPS帧/秒U-NetDDPM111.11MHSA本文502.51配表位置Table 3FPS 对比MHSA 结构的推理速度约为 U-Net 的4.5 倍在 NVIDIA RTX 4090 上测得极大地提升了实时监测的可行性。4.2 案例二真实轴承退化实验IMS 数据集实验设置采用广泛使用的IMS 轴承数据集进行验证。测试台由电机驱动4个 Rexnord ZA-2115 滚动轴承并联安装在同一轴上加速度传感器安装在轴承座处采样频率 20 kHz。配图位置Fig. 11IMS 测试台实物图与示意图使用第2子数据集共984帧监测数据每帧包含4个通道每通道 20480 个数据点。第984帧采集后检查发现1号轴承外圈损坏。考虑到实际工况下测点距故障源有一定距离选用距故障最远的3号轴承数据进行分析模拟实际场景中传感器不在故障点正上方的情形。训练集前 200 帧健康状态每帧切分为 20 个样本每样本 1024 点相邻样本有重叠共 1000 个训练样本保留一定时序信息。配图位置Fig. 12数据分割策略示意图轴承几何参数节圆直径 71.5mm滚子直径 8.4mm滚子数 16接触角 15.17°见原文 Table 4。配表位置Table 4轴承几何参数结果一潜变量分布差异可视化提取第1帧健康和第984帧故障的曲线两者呈现明显不同的形状验证了用潜变量分布差异构建 HI 的可行性。配图位置Fig. 14健康与故障样本的曲线对比结果二健康监测效果对比定性与 Case I 相同的基线模型进行对比。本文方法在轴承健康阶段 HI 波动更小故障发生后 HI 上升更明显健康状态刻画更准确。配图位置Fig. 15各方法 HI 曲线随时间变化对比共6幅子图结果三早期故障检测定量对比采用以 AE-LSTM-OCSVM 方法检测到的故障时刻为基准阈值策略统一为其中和分别为健康阶段 HI 的均值和标准差。方法AUROCAUPRC早期检测提前帧数AE-LSTM-OCSVN0.600.170基准Anomaly-Transformer0.750.280WGDT0.760.300OmniAnomaly0.620.210STGAT-MAD0.770.7878LV-MHSA-Diffusion本文0.810.8283配表位置Table 5定量对比结果本文方法在 AUROC、AUPRC 和早期检测提前帧数三项指标上均取得最优表现比基准方法提前83帧检测到早期故障。结果四消融实验Case II对比四种 HI 构建方式LV-MHSA、DDPM-Rec、DDPM-LVM、DDPM-Rec在真实退化数据上的 HI 曲线基于 LV 的方法无论 MHSA 还是 U-Net均能反映轴承退化的上升趋势本文的 MHSA LV 方法在退化过程中 HI 波动最小退化跟踪性能最优。配图位置Fig. 16消融实验 HI 曲线4幅子图5. 总结与展望核心贡献回顾创新点内容网络结构用 MHSA 替换 U-Net专门适配时序监测数据推理速度提升约 4.5 倍HI 构建策略首次将扩散模型的多步潜变量分布差异用于旋转机械 HI 构建规避重建误差的噪声干扰系统验证在仿真和真实数据集上均超越5个主流基线方法定量和定性结果一致方法优势更强的抗噪能力在 −5dB 强噪声下仍能有效跟踪退化趋势。更早的故障检测在 IMS 数据集上比基准方法提前 83 帧检出故障。更快的推理速度MHSA 结构在 RTX 4090 上达到 502.51 FPS满足实时监测需求。无监督学习仅需健康样本训练无需故障标签符合工业场景中故障样本稀少的实际情况。未来工作作者指出目前方法在潜变量可解释性方面仍有提升空间。未来研究将聚焦于如何增强 LV 衍生 HI 的可解释性使工程师能够更直观地理解潜变量与物理故障模式之间的对应关系。

相关新闻

把 CLAUDE.md 当成项目里的第二份 README

把 CLAUDE.md 当成项目里的第二份 README

我现在看 Claude Code 的项目配置,越来越觉得 CLAUDE.md 不应该被当成一个神秘的提示词文件。它更像是项目里的第二份 README,只是第一份 README 写给人看,CLAUDE.md 写给 Claude Code 看。官方文档对它的定义很直接,CLAUDE.md 是一种 markdown 文件,用来给 Claude 提供跨…

2026/7/4 3:33:10阅读更多 →
国产大模型企业选型实测:Claude、GLM5、Kimi三大路径深度对比

国产大模型企业选型实测:Claude、GLM5、Kimi三大路径深度对比

1. 项目概述:为什么我花整整72小时横向实测这三款国产主力大模型 最近两周,我几乎没碰过手机,每天雷打不动用Claude、GLM5、Kimi各跑3轮真实任务——不是简单问“今天天气如何”,而是拿它们当真员工用:让Claude重写我上…

2026/7/4 3:28:10阅读更多 →
(一)集成django、swagger、docker desktop之创建项目

(一)集成django、swagger、docker desktop之创建项目

​ 初始模板的相关文件都在 https://gitee.com/yaaakaaang/django_swagger_docker 的一个项目模板里,可以拿来用。 下面我们来详细看看是怎么构建的。 一、创建项目 首先我们在pycharm中新建一个项目 test 然后打开终端输入 django-admin startproject backendb…

2026/7/4 3:28:10阅读更多 →
数据研究零门槛:okbiye 一站式 AI 数据分析功能重塑实证论文创作逻辑

数据研究零门槛:okbiye 一站式 AI 数据分析功能重塑实证论文创作逻辑

okbiye-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/数据分析数据分析 - Okbiye智能写作https://www.okbiye.com/ai/sjfx 引言 实证类毕业论文、期刊论文撰写过程中,数据分析始终是大部分学生的核心难点。从问卷数据清洗、统计方法筛选,…

2026/7/4 6:38:33阅读更多 →
如何用p5快速上手创意编程?5分钟搭建你的第一个交互艺术项目

如何用p5快速上手创意编程?5分钟搭建你的第一个交互艺术项目

如何用p5快速上手创意编程?5分钟搭建你的第一个交互艺术项目 【免费下载链接】p5 p5 is a Python package based on the core ideas of Processing. 项目地址: https://gitcode.com/gh_mirrors/p5/p5 想要学习创意编程,但被复杂的图形库和数学公式…

2026/7/4 6:38:33阅读更多 →
昇腾GE TensorDesc API文档

昇腾GE TensorDesc API文档

TensorDesc 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端…

2026/7/4 6:38:33阅读更多 →
Flutter_thrio跨栈路由深度解析:实现原生与Flutter页面无缝跳转的终极指南 [特殊字符]

Flutter_thrio跨栈路由深度解析:实现原生与Flutter页面无缝跳转的终极指南 [特殊字符]

Flutter_thrio跨栈路由深度解析:实现原生与Flutter页面无缝跳转的终极指南 🚀 【免费下载链接】flutter_thrio flutter_thrio makes it easy and fast to add flutter to existing mobile applications, and provide a simple and consistent navigator …

2026/7/4 6:38:33阅读更多 →
CANN/ge:GE图Dump格式说明

CANN/ge:GE图Dump格式说明

GE 图 Dump 格式说明 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、Tenso…

2026/7/4 6:38:32阅读更多 →
QtAutoUpdater移动端适配:Android应用自动更新实现方案

QtAutoUpdater移动端适配:Android应用自动更新实现方案

QtAutoUpdater移动端适配:Android应用自动更新实现方案 【免费下载链接】QtAutoUpdater A Qt library to automatically check for updates and install them 项目地址: https://gitcode.com/gh_mirrors/qt/QtAutoUpdater QtAutoUpdater是一个强大的Qt库&…

2026/7/4 6:33:31阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 14:18:39阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/3 14:38:35阅读更多 →
端到端自动驾驶:从GTC‘26看工程可信落地的核心逻辑

端到端自动驾驶:从GTC‘26看工程可信落地的核心逻辑

1. 项目概述:当算法工程师走进GTC26展厅,看到的不是芯片,而是“端到端”的呼吸节奏“端到端”这三个字,在GTC’26现场出现的频率,高得像NVLink带宽测试时的峰值曲线——它不再是一个论文里的技术路径选项,而…

2026/7/4 0:02:48阅读更多 →
缺牙修复科普:常见义齿类型与选择参考

缺牙修复科普:常见义齿类型与选择参考

缺牙修复科普:常见义齿类型与选择参考牙齿缺失是中老年人群中较为常见的口腔问题,不仅会造成咀嚼不便、进食受影响,长期还可能对营养摄入与日常社交带来困扰。义齿是改善缺牙问题的常用方式,目前市面上的义齿种类较多,…

2026/7/4 0:02:48阅读更多 →
STM32F091RC与LTC6904实现高精度方波信号生成

STM32F091RC与LTC6904实现高精度方波信号生成

1. 项目概述:LTC6904与STM32F091RC的精准方波生成方案在嵌入式系统开发中,精确的时钟信号和定时控制往往是项目成败的关键。LTC6904作为一款低功耗、高精度的可编程振荡器芯片,与STM32F091RC这款ARM Cortex-M0内核微控制器的组合,…

2026/7/4 0:02:48阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/4 1:16:56阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/4 2:33:55阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/4 2:33:55阅读更多 →