基于变分模态提取及轻量级网络的滚动轴承故障诊断

冯志刚 ,  王首起 ,  于明月

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (06) : 1883 -1891.

PDF (2904KB)
吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (06) : 1883 -1891. DOI: 10.13229/j.cnki.jdxbgxb.20231047
车辆工程·机械工程

基于变分模态提取及轻量级网络的滚动轴承故障诊断

作者信息 +

Rolling bearing fault diagnosis based on variational mode extraction and lightweight network

Author information +
文章历史 +
PDF (2973K)

摘要

设计了一种将变分模态提取(VME)与轻量级卷积神经网络(CNN)结合的滚动轴承故障诊断方法,解决了CNN在复杂工业环境下诊断性能低下及参数量庞大的问题。使用VME提取多个传感器收集的振动信号中的期望模态,并构建多传感器灰度特征图,消除信息干扰的同时实现数据融合。在SqueezeNet基础上引入残差结构与超轻量级子空间注意力模块(ULSAM),构建轻量级残差注意力卷积神经网络(LRACNN)。实验结果表明,本文方法在复杂环境下拥有很高的故障识别率和诊断稳定性。

Abstract

A rolling bearing fault diagnosis method combining variational mode extraction (VME) and lightweight convolutional neural network (CNN) was designed to solve the problems of low diagnostic performance of CNN in complex industrial environments as well as the problem of large number of parameters. VME was used to extract the desired modes in the vibration signals collected from multiple sensors and construct the multi-sensor grayscale feature maps to eliminate information interference while enabling data fusion. The residual structure and ultra-lightweight subspace attention module(ULSAM) are introduced on the basis of SqueezeNet to construct a lightweight residual attention convolutional neural network (LRACNN). The method has a high fault recognition rate and diagnostic stability in complex environments.

Graphical abstract

关键词

故障诊断 / 滚动轴承 / 卷积神经网络 / 注意力机制 / 轻量级

Key words

fault diagnosis / rolling bearing / convolutional neural network / attention mechanism / lightweight

引用本文

引用格式 ▾
冯志刚,王首起,于明月. 基于变分模态提取及轻量级网络的滚动轴承故障诊断[J]. 吉林大学学报(工学版), 2025, 55(06): 1883-1891 DOI:10.13229/j.cnki.jdxbgxb.20231047

登录浏览全文

4963

注册一个新账户 忘记密码

0 引 言

随着现代工业的持续发展和进步,对机械设备的要求也不断提高,自动化、精密化和集成化已成为工业机械设备的核心需求。滚动轴承是当前工业中应用最广泛的设备之一,性能下降通常会对整个设备产生重大影响。由于其工作环境恶劣复杂,很容易发生故障直接影响整个设备,进而带来重大的经济损失和人员安全风险1。因此,开发一种快速、智能的滚动轴承运行状态监测技术,对于避免潜在故障,确保工业生产的稳定性和安全性具有重要意义。

深度学习作为机器学习的一个重要分支,因其强大的特征学习和模式识别能力,在故障诊断领域的应用日益广泛。深度学习可以通过训练深度神经网络,从原始数据中自动提取故障特征,避免了手工特征提取的复杂性和主观性,极大提高了故障诊断的准确性和效率2。Gu等3提出一种基于变分模态分解(Variational mode decomposition,VMD)、连续小波变换(Continuous wavelet transform,CWT)、卷积神经网络(Convolutional Neural networks,CNN)和支持向量机的滚动轴承故障诊断方法,适合用于处理小样本。Yao等4构建一种了堆叠逆残差CNN的智能轴承故障诊断模型,该模型能够保证噪声环境下故障诊断的准确性。Bai等5提出了一种新的基于多通道卷积神经网络结合多尺度裁剪融合数据增强技术的滚动轴承故障诊断方法,该方法能够显著提升故障诊断的正确率。虽然上述方法的诊断正确率较高,但是模型结构复杂,参数量庞大,无法满足实际工业应用中低成本、高性能的要求。轻量级深度学习模型具有可学习参数少、计算成本低的优点,在故障诊断的工业应用中具有广泛前景6

在实际工业应用中,影响滚动轴承故障诊断模型最终结果的因素非常多,如各种机械设备和工艺流程产生的噪声叠加在一起,形成强烈的背景噪声,这种噪声会掩盖或混淆被测物体的振动信号,导致信号采集不准确或无法识别7。电磁干扰也会影响传感器的输出信号,导致测量结果不准确。机械设备运行时的振动和冲击、复杂工况条件、传感器工作环境等,都是故障诊断研究在工业应用中需要考虑的因素8。但是,目前大多数基于数据驱动的故障诊断方法,使用的数据大都是单个传感器采集到的信号。综合考虑滚动轴承自身的复杂结构及上述复杂工业环境,单个传感器采集的信号存在很大偶然性,很难保证故障信息的精准性和完整性,也无法反映设备的整体状态。因此,使用安装在不同位置的传感器采集数据和特征进行补偿,可以在故障诊断时获得更加可靠的结果。

本文设计了一种在复杂工业环境下能够对滚动轴承实现智能故障诊断的方法。首先,使用变分模态提取(Variational mode extraction,VME)方法提取由多个传感器采集的振动信号中的期望模态信号,依托不同传感器的期望模态信号构建多传感器灰度特征图。然后,构建轻量级残差注意力卷积神经网络(Lightweight residual attention convolutional neural network,LRACNN)模型,该模型在SqueezeNet模型基础上使用了残差结构,避免了梯度消失和梯度爆炸问题的发生。同时,引入超轻量级子空间注意力模块(Ultra-lightweight subspace attention module,ULSAM),可以用更少的模型参数提取更多有效的故障特征进行学习。本文模型在复杂工业环境下拥有很好的诊断性能,同时也能够实现模型的轻量化应用。

1 理论知识

1.1 变分模态提取

VME是在VMD基础上提出的,在VME中,将振动信号f(t)分解成期望模态ud(t)和残余信号fr(t)9,即:

f(t)=ud(t)+fr(t)

提取期望模态ud(t)需满足两个条件:①期望模态ud(t)必须紧凑围绕中心频率ωd;②期望模态ud(t)和残余信号fr(t)频谱重叠最小。通过以下操作达到上述两个条件。

minud,ωd,fr{αJ1+J2}s.t.  ud(t)+fr(t)=f(t)
J1=iδ(t)+jπt×ud(t)e-jwdt22
J2=β(t)×fr(t)22

式中:α为影响模态带宽的平衡因子;δ(t)为狄利克雷函数;βt)为时域滤波器。

β^定义为:

β^(ω)=1α(ω-ωdn)2

引入二次惩罚项和拉格朗日乘子λ(t)式(2)转换为无约束最优问题,构建增广拉格朗日函数L,如下所示:

L(ud,ωd,λ)=αtδ(t)+jπt×ud(t)e-jwdt22+β(t)fr(t)22+f(t)-(ud(t)+fr(t))22+λ(t),f(t)-(ud(t)+fr(t))

根据Parseval时频域能量守恒定理,有:

x(t)22=x^(ω)22

式中:x^(ω)x(t)的傅里叶变换。

可以将式(6)转换成如下频域形式:

L(ud,ωd,λ)=αj(ω-ωd)[(1+sgn(ω))u^d(ω)]22+β^(ω)f^r(ω)22+f^(ω)-(u^d(ω)+f^r(ω))22+λ^(ω),f^(ω)-(u^d(ω)+f^r(ω))

式中:λ为拉格朗日乘数;式(8)由ADMM算法求解。

提取的期望模态ud(t)和对应的中心频率ωd可通过式(9)~(11)不断更新,直至达到终止条件。

u^dn+1(ω)=f^(w)+α2ω-ωdn4u^dn(ω)+λ^(ω)21+α2ω-ωdn41+2αω-ωdn2
ωdn+1=0ω|u^dn+1(ω)|2dω0|u^dn+1(ω)|2dω
λ^n+1(ω)=λ^n+τ[f^(ω)-(u^d(ω)+f^rn(ω))]

式中:τ为更新迭代的步长。

1.2 SqueezeNet模型

SqueezeNet目标是建立一个小型化的网络模型,具有更少的模型参数,以便在内存有限的嵌入式环境中使用。SqueezeNet可以拥有与AlexNet同等级别的精度,但模型参数减少了50倍。SqueezeNet主要由Fire模块构成,该模块由Squeeze层和Expand层组成6,如图1所示。Squeeze层是一种仅由1×1卷积核组成的卷积层;Expand层由1×13×3两种卷积核组成。特征图在经过1×13×3卷积核处理后进行特征融合。Squeeze层与Expand层的卷积核数目需要满足s1×1<e1×1+e3×3。SqueezeNet模型是由卷积层、池化层、Fire模块和输出层Softmax构成。

1.3 超轻量级子空间注意力模块

ULSAM主要使用子空间注意力机制有效地捕捉特征图中的跨通道联系,该模型结构如图2所示,其将通道数为m的输入特征图分成g组,每组包含G个特征映射图10。对每组的子特征,首先使用深度卷积(Depthwise convolution,DW)处理输入特征,仅使用1×1卷积核进行处理,经最大池化层后,使用点卷积(Pointwise convolution,PW)处理;其次,使用Softmax对得到的特征进行扩展;再次,对输入特征逐点分配权重并进行残差处理,使输出特征与输入特征具有相同的维度;最后,对各个子空间的输出特征进行特征拼接,并作为最终的输出特征。ULSAM有助于网络提取到多尺度和多频率特征,同时也使模型可以高效地利用跨通道信息。

2 本文方法

为进一步提升滚动轴承故障诊断模型的性能和正确率,本文详细探讨了基于VME和轻量级CNN的多传感器智能故障诊断方法,该方法可以更有效地识别和诊断滚动轴承的故障特征。图3为本文方法流程图。

2.1 多传感器灰度特征图的构建

本文利用来自多个传感器的滚动轴承振动信号构建多传感器灰度特征图,旨在通过整合不同传感器的数据,实现更全面、更协同的故障诊断。这种方法可以确保从更广泛的数据集中捕获关键信息,从而避免遗漏重要的故障特征,有效提升诊断模型的鲁棒性和精确性。使用VME提取不同传感器振动信号的期望模态信号,信号包含大量故障敏感特征,可以清除掉复杂环境对振动信号的干扰,为后续的故障诊断提供关键信息。灰度特征图的具体构建过程如图4所示。

首先,使用VME处理各传感器的振动信号,VME需要确定两个关键参数:惩罚因子α和初始中心频率ωd。本文使用文献[11]方法确定上述两个参数,其中惩罚因子α=1000,初始中心频率ωd通过观察所采集振动信号的最高频谱峰值频率确定。

然后,将经VME处理后得到的一维期望模态信号转换为2D灰度图像。假设振动信号包含l个数据点,可以将其转换为具有M个数据点的N行向量,其中l=M×N。本文选取的振动信号长度l=1 024,将其转换为32×32的矩阵,在转换成矩阵前需要将数据进行归一化处理,归一化处理公式为:

y=x-minmax-min×255

式中:xy分别为归一化前、归一化后的数值;maxmin分别为数据中的最大值和最小值。

最后,将不同传感器的灰度图像拼接得到灰度特征图,实现特征的像素级融合,可以利用多个传感器的优势,降低因单一传感器故障导致的数据不准确或中断问题,从而提高数据的准确性和精度。

2.2 LRACNN模型

本文构建的LRACNN模型如图5所示,该模型由卷积+ReLu、Fire模块、ULSAM、最大池化和Softmax构成。ULSAM作为一种轻量级的注意力机制,引入SqueezeNet中,可以帮助模型实现高效的资源分配,使用较少的计算资源与模型参数,便可以获得更重要的图像信息,从而使模型的性能显著提升。同时,在Fire模块中引入残差结构,可以很好地解决随着网络深度增加出现的梯度消失和梯度爆炸问题,增强模型的抗噪声鲁棒性。

3 实验验证

3.1 实验数据集

使用美国凯斯西储大学公布的轴承数据集进行实验验证,CWRU实验平台如图6所示,该实验平台由电机、扭矩传感器/译码器、驱动端(Driver end,DE)轴承、风扇端(Fan end,FE)轴承和电子控制器组成12。本文选取在0~3 HP负载工况下工作的轴承振动信号,采样频率为12 kHz。传感器数据采集对象为DE轴承和FE轴承,型号分别为深沟球轴承SKF6205和SKF6203,使用电火花人工给滚动轴承添加故障,包含滚动体故障、内圈故障、外圈故障3种故障类型,每种故障类型分别有0.177 8、0.355 6、0.533 4 mm共3种不同程度的损伤。实验数据的详细情况如表1所示,共创建A0、A1、A2、A3共4个数据集,分别对应4种工况,每个数据集按8∶2比例无交集地划分训练集和测试集,后续每个实验重复进行10次,取10次结果的平均值作为最终结果。

3.2 基于VME的信号提取实验

本文实验以A1数据集作为实验对象,使用VME提取DE和FE轴承振动信号的期望模态信号,按照2.1小节方法,设置惩罚因子α=1 000,根据振动信号的最高频谱峰值的频率确定初始中心频率ωd图7为DE轴承In1振动信号的频谱图,从图7中可以看出:最高频谱峰值的频率约为3 500 Hz,因此初始中心频率ωd为3 500 Hz。图8(a)(b)分别为使用VME提取DE轴承的In1振动信号前、后的时域波形和频谱,从图8中可以看出,VME可以很好地提取所需要中心频率的期望模态信号。使用同样方法处理不同工况下两个传感器的振动信号,最终所有振动信号的初始中心频率如表2所示。按照2.1小节的方法转换成灰度图像,最终得到多传感器灰度特征图的大小为64×32。A0~A3数据集中不同故障类型的多传感器灰度特征图如图9所示。

3.3 不同方法的实验对比

3.3.1 网络模型参数确认

网络模型参数对模型的训练效率和输出结果具有至关重要的影响。本文经过深入探索和实验,最终确定LRACNN模型选取Adam自适应优化器优化网络参数,学习率设置为0.001,小批量大小设置为64,最大迭代次数设置为20。

3.3小节的所有实验都以A1数据集作为实验对象,该模型是在Matlab R2021b环境下编写的,充分考虑了计算机系统的实际情况。该计算机运行的是Windows 10 64位操作系统,配备了AMD Ryzen 5 5600U with Radeon Graphics处理器,主频为2.30 GHz,其内存容量为16.00 GB,显卡使用的是NVIDIA Geforce MX450。

3.3.2 不同信号处理方法的实验对比

为了深入了解VME在轴承故障特征提取中的优势,将VME与VMD、经验模态分解(Empirical mode decomposition,EMD)、固有时间尺度分解(Intrinsic Time-scale Decomposition,ITD)、小波包分解(Wavelet packet decomposition,WPD)4种常见信号处理方法进行对比。表3详细记录每种方法处理后的诊断正确率和处理信号时间。从表3可以看出,与其他方法相比,VME不仅拥有最高的诊断正确率,而且处理信号时间最短,充分证明了VME在特征提取中的优越性。

3.3.3 不同传感器数据诊断实验对比

为了验证本文采用多传感器轴承振动信号进行故障诊断方法的有效性,将本文方法与使用单一传感器信号进行故障诊断的方法作对比。可得本文方法、单独使用DE、单独使用FE的故障诊断正确率分别为100%、97.75%、96.90%。可以看出,使用多传感器信号进行故障诊断的正确率明显高于单传感器。具体来说,本文方法比单独使用DE的诊断正确率提高了2.25%,比单独使用FE的诊断正确率提高了3.10%。表明本文方法能够综合利用不同传感器提供的信息,有效避免单个传感器的局限性,更好地了解设备的整体性能和运行状态,从而对滚动轴承进行更全面的识别,显著提高了诊断的正确性。

3.3.4 不同诊断模型的性能对比

为了进一步评估LRACNN模型的性能,将它与SqueezeNet、LCNN13、ShuffleNet13和MCDS-CNN14 4个轻量级模型进行比较。在对比过程中,主要关注模型的正确率、训练时间和模型参数3个关键因素,对比结果如表4所示。从表4中可以看出,LRACNN模型在正确率方面表现最佳,达到了100%。与其他模型相比,LRACNN具有最高的诊断正确率,表明它能够更准确地识别和分类样本。在训练时间方面,LRACNN用时最短,表明其训练效率较高,能够在相对短的时间内完成训练。此外,LRACNN的模型参数最少,只有0.045 MB,表明其模型结构相对简洁,能够有效地降低过拟合的风险。LRACNN模型在正确率、训练时间和模型参数方面均表现出优越的性能,在实际应用中,选择LRACNN模型可以获得更高的诊断正确率和更快的训练速度,同时保持模型结构的简洁性。

3.4 噪声环境下模型的诊断实验

为了评估本文方法在噪声环境下的诊断性能,在实验中模拟了工业现场的噪声条件。为了模拟实际环境中存在的各种噪声,在滚动轴承的原始振动信号中添加了不同信噪比(Signal-to-noise ratio,SNR)的高斯白噪声(White Gaussian noise,WGN)。SNR是一种用于比较所需信号强度和背景噪声强度的指标,具体公式如下:

SNRdb=10log10PsignalPnoise

式中:PsignalPnoise分别为振动信号和高斯白噪声的功率。

图10为原始振动信号和添加SNR=-4 dB噪声后的信号时域波形图。通过对比可以明显看出,添加噪声后的时域波形发生了显著变化。这些变化表明,噪声信号对原始故障特征产生明显干扰,导致故障特征被淹没,从而使特征提取变得困难甚至无法进行。这种情况下,无法准确地进行故障识别,最终导致诊断正确率的降低。

为进一步验证LRACNN模型的性能,将它与SqueezeNet、CNN+Attention2、AAnNet2、MSCNN-BiLSTM15模型进行比较,对比结果如表5所示。从表5可以清晰地看到,无论在何种噪声环境下,LRACNN模型均展现出最高的正确率。这一结果有力证明了VME的有效性,它可以从复杂的噪声环境中准确提取出滚动轴承的故障特征期望模态信号。同时,LRACNN的强大学习能力及其对噪声的鲁棒性使其在各种噪声环境下都能保持出色的性能。

3.5 多工况工频周期干扰下模型的诊断实验

在工业环境下,振动信号会随着工况变动发生相应变化,导致故障特征的取值范围和变化规律产生差异。此外,必须正视工频周期干扰信号的影响,这类干扰信号源自电力系统,其频率通常为50或60 Hz。这类干扰可能导致采集的数据中混入噪声和异常值,进而影响数据的准确性和可靠性。这不仅增加模型输出的波动性,而且降低了模型的稳定性,对故障诊断的准确性和可靠性造成威胁。因此,对于实际应用中的故障诊断模型,需要充分考虑工况变化和工频周期干扰的影响,并采取有效措施提高模型的诊断性能和稳定性。

为了模拟工业环境中常见的干扰情况,选择在原始振动信号中添加50和60 Hz的正弦波信号模拟工频周期干扰。表6为LRACNN模型在0~3 HP负载情况下,面对无干扰、50 Hz干扰和60 Hz干扰3种不同情况的诊断结果。从表6可以明显看出,无论是在何种负载情况下,LRACNN模型都展现出极高的诊断正确率。即便在工频周期干扰下,模型的正确率变化微乎其微,并且依旧维持在一个相当高的水平。这充分表明VME在此干扰情况下提取期望模态信号的有效性,以及LRACNN模型具有强大的抗干扰能力和稳定性。

4 结束语

本文提出了一种创新的滚动轴承智能故障诊断方法,该方法结合VME和轻量级CNN,旨在解决工业复杂环境下滚动轴承故障诊断正确率低下,以及CNN模型轻量化应用的问题。首先,利用VME对来自不同传感器的振动信号进行处理,从中提取出关键的期望模态信号。期望模态信号进一步用于构建多传感器灰度特征图,特征图能有效地反映滚动轴承的工作状态。然后,对SqueezeNet模型进行改进,引入残差结构和ULSAM,构建了LRACNN模型。该模型不仅拥有优秀的诊断性能,而且在轻量化方面有显著提升。通过使用灰度特征图对LRACNN进行训练和测试,能够得出准确的故障诊断结果。在CWRU数据集上进行实验,与多个模型进行比较,结果表明本文模型不仅提高了诊断的准确性,而且极大减少了模型参数和训练时间,实现了高效的诊断性能,为解决工业复杂环境中滚动轴承故障诊断难题提供了有效且高效的方法。

参考文献

[1]

Yang D, Karimi H R, Sun K. Residual wide-kernel deep convolutional auto-encoder for intelligent rotating machinery fault diagnosis with limited samples[J]. Neural Networks, 2021, 14: 133-144.

[2]

陈晓雷, 孙永峰, 李策, 基于卷积神经网络和双向长短期记忆的稳定抗噪声滚动轴承故障诊断[J]. 吉林大学学报: 工学版, 2022, 52(2): 296-309.

[3]

Chen Xiao-lei, Sun Yong-feng, Li Ce, et al. Stable anti⁃noise fault diagnosis of rolling bearing based on CNN⁃BiLSTM[J]. Journal of Jilin University (Engineering and Technology Edition), 2022, 52(2): 296-309.

[4]

Gu J, Peng Y, Lu H, et al. A novel fault diagnosis method of rotating machinery via VMD, CWT and improved CNN[J]. Measurement, 2022, 200: No.111635.

[5]

Yao D, Liu H, Yang J, et al. A lightweight neural network with strong robustness for bearing fault diagnosis[J]. Measurement, 2020, 159: No.107756.

[6]

Bai R, Xu Q, Meng Z, et al. Rolling bearing fault diagnosis based on multi-channel convolution neural network and multi-scale clipping fusion data augmentation[J]. Measurement, 2021, 184: No.109885.

[7]

Zhong H, Lv Y, Yuan R, et al. Bearing fault diagnosis using transfer learning and self-attention ensemble lightweight convolutional neural network[J]. Neurocomputing, 2022, 501: 765-777.

[8]

Wang S, Feng Z. Multi-sensor fusion rolling bearing intelligent fault diagnosis based on VMD and ultra-lightweight GoogLeNet in industrial environments[J]. Digital Signal Processing, 2024, 145: No.104306.

[9]

王军, 张维通, 闫正兵, 基于迁移QCNN的孪生网络轴承故障诊断方法[J]. 计算机测量与控制, 2024, 32(4): 6-12.

[10]

Wang Jun, Zhang Wei-tong, Yan Zheng-bing, et al. Twin network-based bearing fault diagnosis method with transfer QCNN[J]. Computer Measurement & Control, 2024, 32(4): 6-12.

[11]

Nazari M, Sakhaei S M. Variational mode extraction: A new efficient method to derive respiratory signals from ECG[J]. IEEE Journal of Biomedical and Health Informatics, 2018, 22(4): 1059-1067.

[12]

Saini R, Jha N K, Das B, et al. ULSAM: Ultra-ightweight ubspace ttention odule for ompact onvolutional eural etworks[C]∥2020 IEEE Winter Conference on Applications of Computer Vision (WACV), Snowmass, CO, USA, 2020: 1616-1625.

[13]

Ye M, Yan X, Chen N, et al. Intelligent fault diagnosis of rolling bearing using variational mode extraction and improved one-dimensional convolutional neural network[J]. Applied Acoustics, 2023, 202: No.109143.

[14]

Smith W A, Randall R B. Rolling element bearing diagnostics using the case western reserve university data: a benchmark study[J]. Mechanical Systems and Signal Processing, 2015, 64-65: 100-131.

[15]

Wang Y, Yan J, Sun Q, et al. Bearing intelligent fault diagnosis in the industrial internet of things context: a lightweight convolutional neural network[J]. IEEE Access, 2020, 8: 87329-87340.

[16]

Ling L, Wu Q, Huang K, et al. A lightweight bearing fault diagnosis method based on multi-channel depthwise separable convolutional neural network[J]. Electronics, 2022, 11(24): No.4110.

[17]

Xu Z, Mei X, Wang X, et al. Fault diagnosis of wind turbine bearing using a multi-scale convolutional neural network with bidirectional long short term memory and weighted majority voting for multi-sensors[J]. Renewable Energy, 2022, 182: 615-626.

基金资助

国家自然科学基金项目(51605309)

AI Summary AI Mindmap
PDF (2904KB)

169

访问

0

被引

详细

导航
相关文章

AI思维导图

/