基于深度对抗和联合域校准的轴承故障诊断方法

王小瑞 ,  郝润芳 ,  杨琨 ,  袁仲云 ,  桑胜波

山西大学学报(自然科学版) ›› 2026, Vol. 49 ›› Issue (02) : 295 -309.

PDF (4269KB)
山西大学学报(自然科学版) ›› 2026, Vol. 49 ›› Issue (02) : 295 -309. DOI: 10.13451/j.sxu.ns.2024086
信息科学

基于深度对抗和联合域校准的轴承故障诊断方法

作者信息 +

A Deep Conjoint and Adversarial Domain Calibration Method for Bearing Fault Diagnosis

Author information +
文章历史 +
PDF (4370K)

摘要

为了兼顾全局域对齐和局部子域的校准,并且使得特征表示容易被决策边界区分,提出了一种基于深度对抗和联合域校准(Deep Conjoint and Adversarial Domain Calibration, DCADC)方法来进行跨负载的故障诊断任务。首先,将一维轴承振动信号处理为二维灰度图像,有利于模型泛化;其次提出了一种双卷积结构,增强了模型学习域不变信息的能力;另外实施了联合校准策略,使模型在匹配全局信息时捕获局部细粒度信息;最后,加入了特征表示惩罚机制,使决策边界更易于区分样本类别。在三种迁移场景实验中,DCADC方法的平均诊断准确率分别达到了99.80%、100%和99.72%,分别比目前最先进的域适应方法提升了4.80%、0.86%和2.16%。实验结果说明了DCADC方法在复杂工作环境中能够表现出良好的准确性和鲁棒性。

Abstract

In order to guarantee simultaneous alignment of global domains and local classes, facilitating feature representation discrimination by decision boundaries, a deep conjoint and adversarial domain calibration (DCADC) method for cross-load fault diagnosis tasks is proposed. First, the one-dimensional bearing vibration signals are processed into two-dimensional grayscale images to be more applicable for model generalization. Second, a double convolution structure is proposed, which enhances the model's ability of learning domain-invariant information. Third, a conjoint calibration strategy is implemented so that the model captures local fine-grained subdomain information while matching global domain. Finally, a mechanism for penalizing feature representations is incorporated to make it easier for decision boundaries to distinguish samples. In three transfer scenario experiments, the proposed DCADC method achieves an average diagnostic accuracy of 99.80%, 100%, and 99.72%, respectively, showing the improvements of 4.80%, 0.86%, and 2.16% over the current state-of-the-art domain adaptation method. The experimental results illustrate that DCADC method exhibits good accuracy and robustness in complex working environments.

Graphical abstract

关键词

故障诊断 / 特征对齐 / 域适应 / 深度学习

Key words

fault diagnosis / feature alignment / domain adaptation / deep learning

引用本文

引用格式 ▾
王小瑞,郝润芳,杨琨,袁仲云,桑胜波. 基于深度对抗和联合域校准的轴承故障诊断方法[J]. 山西大学学报(自然科学版), 2026, 49(02): 295-309 DOI:10.13451/j.sxu.ns.2024086

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

滚动轴承作为机械设备中的重要元件,对于设备的正常运行至关重要。已有的数据表明,轴承故障在旋转机械故障中的占比为30%1-2。轴承故障可能导致工业安全问题,因此对轴承故障的及早发现和诊断极为必要。加速度传感器采集的振动数据常被用来监测轴承状态3,由于近年来工业设备数目激增,带来了空前规模的数据量,使得数据驱动方法成为智能故障诊断的重要方法4

目前的智能诊断方法还存在明显的短板。首先,这些方法通常需要大量人工标注的带标签数据作为支撑5,不但成本高昂,而且难以实现。其次,这些方法依赖于训练数据和测试数据服从相同的分布。然而机械设备的工况处于变化之中,一种负载条件下训练的网络无法直接在另一个负载条件的数据上进行诊断。这些局限性阻碍了深度学习技术在故障诊断领域进一步的发展。

为了解决上述两个问题,在目标场景的无监督学习问题方面,深度特征迁移受到了越来越多的关注6。深度特征迁移是通过特征分布的对齐,学习到域不变信息,完成另一目标域场景下诊断任务。主流的方法可以分为基于度量的特征迁移方法和基于对抗的特征迁移方法。

基于度量的方法通过衡量域差异来进行边缘分布的匹配。例如,Yang等7在两个共享权值的卷积神经网络(Convolutional Neural Network, CNN)的中间层加入了最大平均差异(Maximum Mean Discrepancy, MMD)来约束CNN的参数。Guo等8将MMD嵌入到全连接层中,完成域不变特征的有效提取。Zhu等9提出了一种改进的推土机距离 (Wasserstein Distance, WD),使用余弦相似度缩小两个信号之间的差距。

基于对抗的方法使用特征提取器学习的特征欺骗域鉴别器,使后者无法判断特征的域归属,从而学习到跨域信息。Ganin等10首次把对抗训练的思想引入到域适应中,提出了域对抗神经网络(Domain-adversarial Neural Network, DANN),此后DANN在故障诊断中也得到了广泛的关注。例如,Jiao等11引入了联合最大平均差异以减少联合分布和边缘分布在不同域的偏移。Wang等12基于两阶段的特征提取和特征对齐实现了部分域迁移的任务。Zhu等13向多个域鉴别器中添加动态权重,使模型可以从多个不同的源域学习到诊断知识对目标域进行预测。Deng等14设计了双层注意力机制的域鉴别器,为相同特征标签的样本赋予更高的权重,从而有选择地进行部分域迁移。

尽管上述方法通过特征对齐和模型改进在跨域诊断轴承故障方面取得了成效,但是依然存在一些问题:

1) 最小化全局域差异可以缩小不同域之间的差异,但是容易忽略子域信息;

2) 子域类别对齐的方法可以使得子域中心靠近,但是不同的子域边界会交叠在一起;

3) 结构改进的模型增强了特征提取能力,但付出的代价是区分样本能力的衰减。

针对上述问题,本文提出了一种基于深度对抗和联合域校准(Deep Conjoint And Adversarial Domain Calibration, DCADC)的方法。该方法同时对齐全局域特征和子域特征,提高了特征表示在映射空间的可区分程度,达到轴承故障诊断的目的。本文主要贡献如下:

1) 为了提升模型的跨域特征学习能力,提出了一种双卷积结构特征提取器,使得模型学习域不变信息的能力增强;

2) 为了缩小源域和目标域的特征差异,实施了联合校准策略,采用MMD度量两个域的全局差异,并且采用软标签的局部最大均值差异(Local Maximum Mean Miscrepancy, LMMD)对齐各个子域;

3) 为了保持模型对目标域特征良好的区分能力,引入了批量谱惩罚(Batch Spectral Penalization, BSP)机制,对特征值的最大奇异值加以抑制,从而使模型更容易地区分每一类样本;

4) 为了充分展示提出的模型在无标签目标域故障诊断工作的优异成绩,本文进行了一系列严谨的实验,并以可视化的方式展现了实验结果,证明了提出方法的有效性。

本文其余部分的安排如下:第1节进行关于域对抗迁移学习的理论背景介绍,第2节阐述所提出的基于深度对抗网络的联合校准域迁移学习方法,第3节通过实验说明所提出方法的有效性,最后第4节进行总结与展望。

1 理论背景

1.1 基于深度学习的故障诊断

基于深度学习的故障诊断主要应用的方式为:特征提取、特征分类和特征提取与分类15。第一种方式利用深度学习技术直接对信号进行特征提取,不需要依赖先验知识,例如Fang等16改进了传统的卷积结构,使其快速准确地提取故障特征。第二种方式利用信号的统计分析特征或时频变换特征进行分类,例如Liang等17对斯托克韦尔变换(Stockwell Transform, ST)18生成的伪图像进行了数据增强,利用胶囊网络(Capsule Network,CapsNet)19对判断故障类型;Liu等20添加了对全连接层(Fully Connected, FC)的正则化,用短时傅里叶变换后的时频图完成了故障分类。第三种方式采用端到端的训练方式,例如Yao等21提出了一种反向残差的网络结构,提升了模型在噪声环境中的性能。Wang等22将小波包分解和注意力机制嵌入到CNN中,提高了模型学习信息的能力和分类的准确率。

1.2 域适应技术

在迁移学习任务中,所获取到的样本来自源域DS和目标域DT。一般地,这两个域包含的样本空间X的边缘分布PX不相同。在本文中的无监督域适应学习任务数据是轴承振动信号,源域样本XS带有标签YS,记为DS={XS,YS,XSPXS},目标域样本XT缺少标签,记为DT={XT,XTPXT}。不同负载下的数据边缘分布的不同,即PXSPXTDSDT。域适应的目标是将数据映射到特征空间,通过特征对齐使得源域与目标域的数据分布尽可能接近。因此在完成带标签的源域数据分类过程的同时,分类器可以同时完成目标域样本的分类任务。

1.3 域对抗网络

DANN作为一种实现域适应的方法,其结构包括特征提取器Gf,标签预测器Gy和域鉴别器Gd,如图1所示。DANN的目标是最小化分类损失和最大化判别损失,一方面,特征提取器需要将数据映射到高维空间,使得标签预测器能够正确地分类;另一方面,特征提取器还要欺骗鉴别器,使后者无法判别数据来自哪一个域,鉴别器则需要判断数据的域归属。通过对抗训练,最终高维空间上的数据在分布上相似,目标域数据也因此容易被区分。

假设现有ns个来自源域的数据和标签{xsi,ysi}nsDSnt个来自于目标域的数据{xti}ntDT,给定特征提取器Gf的参数为θf,标签预测器Gy的参数为θy,域鉴别器Gd的参数为θd,样本xi经过卷积之后得到的特征表示为𝒵 i=Gfxi;θf,由预测器进行分类后的输出为𝒴i=GyGfxi;θf;θy。分类损失可以表示为

Lyiθf,θy=LyGyGfxi;θf;θy,yi=Ly𝒴 i,yi,

其中yi表示xi的标签。鉴别器的输出为𝒟i=GdGfxi;θf;θd,域鉴别的数为

Ldiθf,θd=LdGdGfxi;θf;θd,ydi=Ld𝒟 i,ydi,

其中ydi表示xi的域标签信息,训练过程中,源域的样本被标记为ydsi=0,目标域的样本被标记为ydti=1。因此,在迭代过程中,模型参数优化的目标为

θf',θy'=argminθf,θyEθf,θy,θd',
θd'=argmaxθdEθf,θd

根据以上条件可以得出DANN总的损失为

Liθf,θy,θd=Lyiθf,θy-λLdiθf,θd,λ= 21+exp (-10p)-1, p:01,

其中λ是一个调和右边两个变量的超参数。

2 模型结构与特征对齐

轴承故障的跨域诊断容易出现的情况是特征对齐的过程中类别的混淆和子域中心的偏移,如图2所示。图2(a)只进行全局域匹配,忽略了子域对齐,导致样本类别的混淆,图2(b)考虑了子域中心对齐而忽略了全局信息,导致决策边界难以进行分类。为了避免上述情况的发生,提出了一种基于深度对抗和联合域校准的方法。方法中设计了双卷积结构特征提取器,实施了一种联合校准策略,还加入了对特征的惩罚机制,框架如图3所示。

2.1 数据预处理

二维的图像信号包含更高维的特征,适用于模型泛化23,所以在预处理阶段,采用滑动窗口截取和重塑的方式将一维信号处理为二维灰度图像。窗口长度过小无法包含有效信息,长度过大则增加训练时间,所以将窗长选择为1 024。实验过程中发现滑动步长的大小会影响样本数量和诊断准确率,如表1所示。当窗长固定时,滑动步长减小,总样本数随之增加,会占用更大的设备存储空间。滑动步长增大,总样本数相应地减少,准确率在样本总数小于5 000的情况下急剧下降。

基于表1的分析,选择步长为128,窗长为1 024的滑动窗口进行截取,每个信号段重塑为32×32的灰度图像。二维的灰度图像提高了数据的信噪比和计算资源的利用效率。接着对信号进行归一化处理,公式如下:

x˜=x-min xmax x-min x

其中x˜是归一化后的信号,x是原始信号。在模型训练过程中,将x映射到[0,1]范围内可以消除数据量纲,无量纲化之后的数据特征对于模型的求解有加速作用。

2.2 双卷积结构

传统的卷积模型结构为卷积-池化交替堆叠而成,卷积层的计算公式为

yjl+1=fiwi,jl+1xil+bjl+1,

其中l表示模型的层数,j表示输出特征图的索引,f(∙)表示激活函数,yjl+1是激活后的输出,i表示输入特征图的索引,wi,jl是第j个卷积核,⊗表示卷积操作符,bjl+1是卷积核的偏置。在卷积层之后的最大池化或平均池化的过程公式分别为

xcx,y,l=max xcm,n,lm,nRm,n,xcx,y,l=1Rm,nxcm,n,lm,nRm,n,

其中xcx,y,l是第l个池化层的输出特征图,c为通道索引,xcm,n,l是在池化区域Rm,n内的元素值。池化层(平均池化或最大池化)会不可避免地损失掉一部分特征信息,而迁移学习过程中的目标是需要学习域不变信息。基于此观点,本文提出适用于特征迁移的双卷积结构。如图4所示,左侧部分是传统的卷积-池化结构,右侧部分是提出的双卷积结构。

双卷积结构包含两层卷积操作,在第一层将特征图的通道翻倍,第二层的输出保持通道数不变,特征图尺寸缩减一半,因此公式(7)可知,双卷积结构的输出表示为

ykl+2=fkwj,kl+2iwi,jl+1xil+bjl+1+bkl+2

双卷积结构减少了提取特征过程中信息的丢失,充分学习到了域之间的一致性表示。

双卷积结构参数信息在表2中列出。首先,Conv1-1层使用了5×5的卷积核,增加了感受野,获取到更多的全局信息,其次Conv1-2层以2×2卷积核对特征图进行步距为2的下采样,接着是3×3卷积层与下采样卷积层的交替堆叠,线性整流单元(Rectified Linear Unit, ReLU)函数被采用为激活函数。特征提取器的输出被全局平均池化层(Global Average Pooling, GAP)压缩为256维的特征向量。最后,展平的特征向量输入到FC层构成的标签预测器和域鉴别器中进行标签预测和域判别。

2.3 联合校准与惩罚机制

本节将介绍文中实施的联合校准策略和惩罚机制。联合校准策略包括缩小域间差异和对齐子域中心两个部分,使得两域中不同类别数据之间边界明显,相同类别子域数据中心对齐。惩罚机制是对特征表示的奇异值加以抑制,从而提高目标域特征对于分类器的可区分程度。

2.3.1 全局域匹配

在域适应方面,MMD是一种最常用的测量两个域之间距离的方法24。MMD的值越小,表示两个分布越接近。MMD可以估计各种分布之间的非参数距离,并避免计算中间密度25,实现不同域之间更稳定和更准确地度量26。对于一组给定的样本{xsi,ysi}nsDS{xti}ntDT,它们之间的MMD计算如下:

LMMD{xsi}ns,{xti}nt=1nsi=1nsϕxsi-1ntj=1ntϕxtj2,

其中ϕ是将数据映射到再生核希尔伯特空间的非线性函数。为了减少训练过程中的计算量,核函数k(∙)选择线性核。因此,用于反向传播的MMD损失可以表示为:

LMMD={xsi}ns,{xti}nt=1ns2i=1nsi'=1nsϕxsiϕxsi'-2nsnti=1nsj=1ntϕxsiϕxtj+1nt2j=1ntj'=1ntϕxtjϕ(xtj')=1ns2i=1nsi'=1nskxsi,  xsi'-2nsnti=1nsj=1ntkxsi,  xtj+1nt2j=1ntj'=1ntk(xtj,  xtj')

2.3.2 局部域对齐

对齐子域分布可以防止来自源域和目标域的所有类别数据过于接近,使得决策边界能够正确地分类。为了让模型学习子域信息,引入LMMD27损失函数,在不增加额外的对抗性训练的情况下对齐相关子域,捕获细粒度信息。两个子域的分布差异计算为:

LLMMDPXS,PXT=EcEPXScϕXSc-EPXTcϕXTc2,

其中PXSc,PXTc分别是源域DS和目标域DT中类别索引为c的实例所具有的边缘分布。通过最小化公式(12),类别c的所有样本会在特征空间中更加接近,模型可以根据细粒度信息加以区分。假设每一个样本xi根据相应的权重wci属于某一个类别,那么公式(12)的一个无偏估计量可以表示为:

L^LMMDPXS,PXT=1Ci=1CxsiDSwcsiϕxsi-xtjDTwctjϕxtj2=1Ci=1Ci=1nsi'=1nswcsiwcsi'kxsi,  xsi'-2i=1nsj=1ntwcsiwctjkxsi,  xtj+j=1ntj'=1ntwctjwctj'kxtj,  xtj',

其中

wci=yci(xj,yj)DSycj

需要注意的是i=1wci=1。因为类别索引为c的源域标签ycsi是可获得的,可以直接用于计算源域样本xsi的权重,而目标域的类别标签ycti是无法获取的,因此使用标签预测器输出的概率分布𝒴cti作为目标域的软标签来计算权重。软标签可以降低在训练过程中错误预测的样本带来的负迁移效果的影响。

2.3.3 特征惩罚机制

在对抗性学习的过程中,具有最大奇异值的特征向量携带的信息是可迁移的知识,此外较小的奇异值对应的特征向量携带的信息是易于分类的信息。然而过大的奇异值会使得其他较小的奇异值湮没,不利于决策边界区分样本类别。为了避免此类情况发生,提出的方法引入了批量谱惩罚(Batch Spectral Penalization, BSP)28机制,对于𝒵S𝒵T来说,存在酉矩阵P,Q满足等式(15)

PSH𝒵SQS=ΣS000, PTH𝒵TQT=ΣT000

其中PH是矩阵P的共轭转置矩阵,并且ΣSΣT的表述如下:

ΣS= σs1σsr1, σs1σsr10,ΣT= σt1σtr2, σt1σtr20,

其中σs1,,σsr1σt1,,σtr2分别是ΣSΣT中前r1和前r2个最大的奇异值。由于模型的可迁移性和区分能力同样重要,需要用大的奇异值保证迁移能力,小的奇异值也应该被关注用于提升模型的区分能力。因此,为了抑制最大的前r个奇异值相应的特征信息对于可区分度的影响,利用SVD对特征进行奇异值分解后,批量谱惩罚计算如下:

LBSP𝒵S,𝒵T=SVD𝒵S2+SVD𝒵T2=i=1rσsi2+σti2

2.4 优化目标

分类器应用的是交叉熵损失函数,由公式(1)可得,分类损失表述为:

LCE=-1nsi=1nsc=1Cysilogexp𝒴sij=1C(exp𝒴sj

该损失只在源域样本上进行计算,其中ns是源域样本数量,轴承状态总共包含C个类型,ysi是第i个源域样本的类别标签。由公式(2)可知,域鉴别器需要分辨样本来自源域或是目标域,因此输出结果是二元回归预测,其损失可以表述为:

LD=1nsi=1nsLd𝒟 si,ydsi+1nti=1ntLd𝒟 ti,ydti,
Ld(𝒟 i,ydi)=ydilog 1𝒟 i+(1-ydi)1log 1-𝒟 i

公式(5)中已经讨论过,DANN的目标是最小化损失函数LCE和最大化损失函数LD来更新网络特征提取器Gf,标签预测器Gy和域鉴别器Gd的参数,其损失函数为:

LDANN=LCE-λLD

DANN缺乏有效的特征对齐手段,无法从复杂的数据中提取跨域故障表示,因此无法完成故障迁移学习的任务。经过上述章节的分析,测量两个域差异的损失LMMD,对齐类级别的子域损失L^LMMD以及提升模型在目标域可区分能力的损失LBSP,可以弥补DANN的缺陷。综上,可以计算模型的总体损失如下:

LTOTAL=LDANN+μLMMD+νL^LMMD+ηLBSP

2.5 迭代过程

本文提出的方法具体训练流程表述为以下几个部分。

1) 数据处理:对原始的一维轴承振动信号进行滑动窗口分割,以实现数据增强,分割后的样本被重塑为单通道灰度图,所有灰度图划被分为训练集和测试集,供后续的模型训练与性能评估使用;

2) 特征提取:用双卷积结构特征提取器将这些灰度图像映射到特征空间中。在源域和目标域特征图上实施全局匹配以缩小域差异,并对特征图进行奇异值分解,抑制最大奇异值;

3) 联合校准与惩罚:将特征表示分别输入标签预测器和域鉴别器,标签预测器对源域数据的预测结果和源域标签计算交叉熵,对目标域数据的预测概率作为软标签,进行局部域对齐;域鉴别器则需要判断特征表示来自哪个域,输出判断结果并与域标签计算交叉熵损失;

4) 参数更新:根据步骤2和3中损失函数的计算结果,进行反向传播和模型参数更新的过程,迭代优化直至训练结果收敛。

模型的前向传播与参数更新过程如算法1所示。

3 实验验证

3.1 数据集

轴承振动信号数据由凯斯西储大学轴承数据中心29和机械故障预防技术协会30提供。凯斯西储大学(Case Western Reserve University,CWRU)轴承振动数据在马达转速为1 797、1 772、1 750和1 730 r/min时以12 kHz采样率进行收集,马达的转速从高到低分别对应着0、1、2和3 HP负载。轴承有正常(NS)、内圈故障(IF)、滚动体故障(BF)和外圈故障(OF)四种状态。故障由电火花加工造成,加工直径分别为0.177 8,0.355 6和0.533 4 mm,故障状态和标签空间如表3所示。机械故障预防技术协会的数据以97.6 kHz采样率收集各个负载条件下的轴承振动数据,正常状态(NS)数据的电机负载为122.469 9 kg,内圈故障(IF)数据的电机负载分别为0、22.679 6、45.359 2、68.038 9、90.718 5、113.398 1和136.077 7 kg,外圈故障(OF)数据的电机负载分别为11.339 8、22.679 6、45.359 2、68.038 9、90.718 5、113.398 1和136.077 7 kg。故障状态和标签空间如表4所示。

实验部分设置了三种迁移场景,每种场景考虑不同的负载变化情况。每一个标签空间包含的样本数量为500个,其中用于训练的样本有400个,用于测试的样本有100个。

第一种迁移场景是凯斯西储大学轴承数据中0 HP、1 HP和2 HP负载之间的迁移,共计6个迁移任务和10种不同的故障类型。表5给出了迁移任务的具体信息。

第二种迁移场景是凯斯西储大学轴承数据内外圈不同转速之间的迁移,共计6个迁移任务,标签空间为7个故障类型,如表6所示。

第三种迁移场景是机械故障预防技术协会轴承数据负载差距逐渐增大的迁移,共计6个迁移任务,标签空间为3个故障类型,如表7所示。

3.2 不同模型的性能对比

本节基于迁移场景一和场景二,所提出的DCADC方法与现有的先进域适应方法在各个迁移任务中进行诊断准确率的比较,被比较的方法如下:

1) Baseline:三层CNN搭建的模型,在源域数据上进行训练,在目标域测试集上进行评估;

2) DANN10:第二章介绍的域对抗网络,特征提取器和与鉴别器相互对抗来完成域迁移任务;

3) DDC31:该方法在两个共享权值的模型中间桥接了MMD来减小特征之间的差异;

4) DeepCORAL32:该方法通过相似性度量距离的度量对齐源域和目标域分布的二阶统计特征;

5) CDAN33:模型利用特征分布和预测分布之间的互协方差提高样本可判别性,通过熵调整控制不确定样本的可迁移性。

6) DSAN27:该方法不进行对抗训练,在模型中间层中基于LMMD损失对齐相关子域的分布。

7) TSDA34:该方法建立了目录分类器,通过重建目录结构与域鉴别器对抗以保留分类信息。

随机梯度下降(Stochastic Gradient Descent, SGD)优化器用于参数优化,初始学习率为0.01,迭代轮数为300轮。作为衡量指标的准确率(Acc)计算公式如下:

Acc=1-FP+FNTP+FP+TN+FN,

其中FP表示被错误识别的正样本,FN表示被错误识别的负样本,TP表示被正确识别的正样本,TN表示被正确识别的负样本。

3.2.1 迁移场景一中的准确率对比

表8列出了每一种方法在场景一中的准确率以及平均准确率。可以观察出,由于Baseline中没有使用任何迁移方法,所以性能表现很差。DANN没有对齐策略,因此直接在CWRU数据集上进行迁移的效果不理想。DDC与DeepCORAL也只关注了全局域对齐,CDAN方法缺乏对子域信息的关注,因此在基于目标域的分类上逊色于DCADC。

3.2.2 迁移场景二中的准确率对比

表9列出了每一种方法在场景二中的准确率。DANN缺乏特征对齐的手段,因此和Baseline一样性能表现相近。随着域差异变大,DDC和DeepCORAL只关注全局域信息,无法准确区分轴承状态,CDAN对于子域信息的学习也不够。相比之下,所提出的DCADC方法在所提出的方法在面对不同转速的内外圈故障时,取得了令人满意的效果,实现了源域向不同目标域的迁移任务。

3.2.3 迁移场景三中的准确率对比

表10列举了每一种方法迁移场景三中的表现。随着负载差距的增大,每一种方法准确率的整体趋势逐渐下降,具备特征对齐策略的方法准确率下降的幅度较小。DCADC方法在场景三的任务中仍能保持99%以上的诊断准确率,证明了DCADC方法具备强大的特征提取能力和有效的特征对齐策略。

3.3 消融实验

为了探究模型中卷积层参数比例和损失函数在迁移过程中对结果的影响,本节将基于迁移场景一,在包含了所有标签的情况下直观展示消融实验的结果并加以分析。

3.3.1 卷积参数比例的影响

文献[35]在发现当全连接层增加的时候,目标域的分类准确率均有不同程度的下降。表11列举出了几个不同的卷积参数比例对应准确率。实验选择0 HP负载数据作为源域,将1 HP负载数据作为目标域,固定T1任务中训练完毕的模型参数,将特征提取器的输出降维后进行观察,如图5所示。从左到右依次对应表11中的模型结构,蓝色代表源域特征分布,红色代表目标域特征分布。随着卷积参数占比的逐渐减小,卷积层学习到的域不变信息相对地在下降,分布差异愈发增大。

3.3.2 各部分损失函数的作用

表12展示了迁移场景一中各个损失函数单独作用于模型时准确率。由表12可以看出,条件1整体上的分类准确率最高,证明LMMD在缩小域差异中起重要作用,这一结论也在4、5和6的条件下得到了证明。条件5和6下的每一项任务准确率相差不大,但是条件4缺少了LMMD时准确率急剧下降。其次,L^LMMD的作用是属于同一类的子域分布趋于相似,因此条件6的平均准确率高于条件1,条件4的平均准确率高于条件3。另外,LBSP损失对于提高类别之间的可区分性有着重要作用,条件5的平均准确率高于条件1,条件4的平均准确率高于条件2。

选取表12中编号为4、5、6和7的T1任务,使用t分布随机邻域嵌入(t-SNE)进行样本类别和样本域的可视化,如图6所示。任何一部分损失函数的缺失都会造成样本的混淆或者子域中心的偏移。在图6(d)和(h)的样本类别和样本域中,提出的方法不仅可以容易地区分开每一类,而且各个子域中心也相互靠近,证明了所提出DCADC方法的优越性。

3.4 鲁棒性评估

为了证明DCADC方法的鲁棒性,选取了T7任务中各个模型的分类结果,绘制了如图7所示的混淆矩阵。可以看到在混淆矩阵中,被比较的方法均出现了不同程度的错误分类情况,尤其在标签为2、3和4的类别中较为严重。从混淆矩阵中还可以得出的几个指标是精确率(P)、召回率(R)和F1分数(F1-score),具体计算方式为:

P=TPTP+FP,
R=TPTP+FN
F1=2×P×RP+R

根据公式(22)计算出的指标绘制在图8中。在T7任务中Baseline和DANN对OF的预测出现严重失误,DeepCORAL和CDAN则把IF2和OF3这两个类型相互混淆,其他方法也出现了不同程度的分类偏差,DCADC方法则避免了误判情况,所以从F1分数统计图中可以看出,DCADC的鲁棒性均高于其他方法。

4 总结

本文为了使得模型能够学习到不同负载条件之间的域不变特征,提出了一种基于深度对抗和联合域校准的故障诊断方法。为了有效学习到域不变信息,提出了一种独特的双卷积结构的模型,提升卷积参数在模型中的占比;为了缩小全局域分布差异和捕获细粒度的子域信息,实施了联合校准策略;为了提升决策边界对每一个类别的可区分性,抑制了特征的最大奇异值。基于对比实验,证明了提出的方法可以达到较高的诊断准确率,基于消融实验证明了提出的方法具有良好的鲁棒性。虽然本文在故障诊断任务上具有一定的效果,但是还存在着以下局限:在信号预处理时,所使用的信号是实验室条件采集的纯粹信号,没有考虑到降噪的问题;另外在实验中发现模型没有考虑对抗梯度弥散现象的举措,需要在未来的工作中进一步完善。

参考文献

[1]

SHI H T, GUO J, BAI X T, et al. Research on a Nonlinear Dynamic Incipient Fault Detection Method for Rolling Bearings[J]. Appl Sci, 2020, 10(7): 2443. DOI: 10.3390/app10072443 .

[2]

LIU R N, YANG B Y, ZIO E, et al. Artificial Intelligence for Fault Diagnosis of Rotating Machinery: A Review[J]. Mech Syst Signal Process, 2018, 108: 33-47. DOI: 10.1016/j.ymssp.2018.02.016 .

[3]

LI J, WANG Y, ZI Y Y, et al. A Local Weighted Multi-instance Multilabel Network for Fault Diagnosis of Rolling Bearings Using Encoder Signal[J]. IEEE Trans Instrum Meas, 2020, 69(10): 8580-8589. DOI: 10.1109/TIM.2020.2986853 .

[4]

ZHAO Z B, ZHANG Q Y, YU X L, et al. Applications of Unsupervised Deep Transfer Learning to Intelligent Fault Diagnosis: A Survey and Comparative Study[J]. IEEE Trans Instrum Meas, 2021, 70: 3525828. DOI: 10.1109/TIM.2021.3116309 .

[5]

ZHU Z Q, LEI Y B, QI G Q, et al. A Review of the Application of Deep Learning in Intelligent Fault Diagnosis of Rotating Machinery[J]. Measurement, 2023, 206: 112346. DOI: 10.1016/j.measurement.2022.112346 .

[6]

MA Y L, YANG J, LI L. Collaborative and Adversarial Deep Transfer Auto-encoder for Intelligent Fault Diagnosis[J]. Neurocomputing, 2022, 486: 1-15. DOI: 10.1016/j.neucom.2022.02.050 .

[7]

YANG B, LEI Y G, JIA F, et al. An Intelligent Fault Diagnosis Approach Based on Transfer Learning from Laboratory Bearings to Locomotive Bearings[J]. Mech Syst Signal Process, 2019, 122: 692-706. DOI: 10.1016/j.ymssp.2018.12.051 .

[8]

GUO L, LEI Y G, XING S B, et al. Deep Convolutional Transfer Learning Network: A New Method for Intelligent Fault Diagnosis of Machines with Unlabeled Data[J]. IEEE Trans Ind Electron, 2019, 66(9): 7316-7325. DOI: 10.1109/TIE.2018.2877090 .

[9]

ZHU Z Y, WANG L Z, PENG G L, et al. WDA: an Improved Wasserstein Distance-based Transfer Learning Fault Diagnosis Method[J]. Sensors, 2021, 21(13): 4394. DOI: 10.3390/s21134394 .

[10]

GANIN Y, USTINOVA E, AJAKAN H, et al. Domain-adversarial Training of Neural Networks[M]//Domain Adaptation in Computer Vision Applications. Cham: Springer International Publishing, 2017: 189-209. DOI: 10.1007/978-3-319-58347-1_10 .

[11]

JIAO J Y, ZHAO M, LIN J, et al. Residual Joint Adaptation Adversarial Network for Intelligent Transfer Fault Diagnosis[J]. Mech Syst Signal Process, 2020, 145: 106962. DOI: 10.1016/j.ymssp.2020.106962 .

[12]

WANG X, SHE B, SHI Z S, et al. Partial Adversarial Domain Adaptation by Dual-domain Alignment for Fault Diagnosis of Rotating Machines[J]. ISA Trans, 2023, 136: 455-467. DOI: 10.1016/j.isatra.2022.11.021 .

[13]

ZHU J, CHEN N, SHEN C Q. A New Multiple Source Domain Adaptation Fault Diagnosis Method between Different Rotating Machines[J]. IEEE Trans Ind Inform, 2021, 17(7): 4788-4797. DOI: 10.1109/TII.2020.3021406 .

[14]

DENG Y F, HUANG D L, DU S C, et al. A Double-layer Attention Based Adversarial Network for Partial Transfer Learning in Machinery Fault Diagnosis[J]. Comput Ind, 2021, 127: 103399. DOI: 10.1016/j.compind.2021.103399 .

[15]

文成林, 吕菲亚. 基于深度学习的故障诊断方法综述[J]. 电子与信息学报, 2020, 42(1): 234-248. DOI: 10.11999/JEIT190715 .

[16]

WEN C L, F Y. Review on Deep Learning Based Fault Diagnosis[J]. J Electron Inf Technol, 2020, 42(1): 234-248. DOI: 10.11999/JEIT190715 .

[17]

FANG H R, DENG J, ZHAO B, et al. LEFE-net: a Lightweight Efficient Feature Extraction Network with Strong Robustness for Bearing Fault Diagnosis[J]. IEEE Trans Instrum Meas, 2021, 70: 3513311. DOI: 10.1109/TIM.2021.3067187 .

[18]

LIANG P F, DENG C, YUAN X M, et al. A Deep Capsule Neural Network with Data Augmentation Generative Adversarial Networks for Single and Simultaneous Fault Diagnosis of Wind Turbine Gearbox[J]. ISA Trans, 2023, 135: 462-475. DOI: 10.1016/j.isatra.2022.10.008 .

[19]

STOCKWELL R G, MANSINHA L, LOWE R P. Localization of the Complex Spectrum: The S Transform[J]. IEEE Trans Signal Process, 1996, 44(4): 998-1001. DOI: 10.1109/78.492555 .

[20]

SABOUR S, FROSST N, HINTON G E. Dynamic Routing Between Capsules[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. New York: ACM, 2017: 3859-3869.

[21]

LIU H C, YAO D C, YANG J W, et al. Lightweight Convolutional Neural Network and Its Application in Rolling Bearing Fault Diagnosis under Variable Working Conditions[J]. Sensors, 2019, 19(22): 4827. DOI: 10.3390/s19224827 .

[22]

YAO D C, LIU H C, YANG J W, et al. A Lightweight Neural Network with Strong Robustness for Bearing Fault Diagnosis[J]. Measurement, 2020, 159: 107756. DOI: 10.1016/j.measurement.2020.107756 .

[23]

WANG H, LIU Z L, PENG D D, et al. Interpretable Convolutional Neural Network with Multilayer Wavelet for Noise-robust Machinery Fault Diagnosis[J]. Mech Syst Signal Process, 2023, 195: 110314. DOI: 10.1016/j.ymssp.2023.110314 .

[24]

XUE F, ZHANG W M, XUE F, et al. A Novel Intelligent Fault Diagnosis Method of Rolling Bearing Based on Two-stream Feature Fusion Convolutional Neural Network[J]. Measurement, 2021, 176: 109226. DOI: 10.1016/j.measurement.2021.109226 .

[25]

YU X, YIN H S, SUN L, et al. A New Cross-domain Bearing Fault Diagnosis Framework Based on Transferable Features and Manifold Embedded Discriminative Distribution Adaption under Class Imbalance[J]. IEEE Sens J, 2023, 23(7): 7525-7545. DOI: 10.1109/JSEN.2023.3248950 .

[26]

LU W N, LIANG B, CHENG Y, et al. Deep Model Based Domain Adaptation for Fault Diagnosis[J]. IEEE Trans Ind Electron, 2017, 64(3): 2296-2305. DOI: 10.1109/TIE.2016.2627020 .

[27]

QIN R C, LU C. Research on Measurement Methods of Transferability between Different Domains in Transfer Learning[C]//2019 CAA Symposium on Fault Detection, Supervision and Safety for Technical Processes (SAFEPROCESS). New York: IEEE, 2019: 926-931. DOI: 10.1109/SAFEPROCESS45799.2019.9213266 .

[28]

ZHU Y C, ZHUANG F Z, WANG J D, et al. Deep Subdomain Adaptation Network for Image Classification[J]. IEEE Trans Neural Netw Learn Syst, 2021, 32(4): 1713-1722. DOI: 10.1109/TNNLS.2020.2988928 .

[29]

CHEN X, WANG S, LONG M, et al. Transferability vs. Discriminability: Batch Spectral Penalization for Adversarial Domain Adaptation[C]//Proceedings of the 36th International Conference on Machine Learning. Cambridge: PMLR, 2019, 97: 1081-1090.

[30]

SMITH W A, RANDALL R B. Rolling Element Bearing Diagnostics Using the Case Western Reserve University Data: A Benchmark Study[J]. Mech Syst Signal Process, 2015, 64/65: 100-131. DOI: 10.1016/j.ymssp.2015.04.021 .

[31]

ZHENG H L, WANG R X, YIN J C, et al. A New Intelligent Fault Identification Method Based on Transfer Locality Preserving Projection for Actual Diagnosis Scenario of Rotating Machinery[J]. Mech Syst Signal Process, 2020, 135: 106344. DOI: 10.1016/j.ymssp.2019.106344 .

[32]

TZENG E, HOFFMAN J, ZHANG N, et al. Deep Domain Confusion: Maximizing for Domain Invariance[EB/OL]. (2014-12-10)[2024-02-19].

[33]

SUN B C, SAENKO K. Deep CORAL: Correlation Alignment for Deep Domain Adaptation[C]//European Conference on Computer Vision. Cham: Springer, 2016: 443-450.10.1007/978-3-319-49409-8_35.

[34]

LONG M, CAO Z, WANG J, et al. Conditional Adversarial Domain Adaptation[C]//Proceedings of the 32nd International Conference on Neural Information Processing Systems. New York: Curran Associates Inc., 2018, 31: 1647-1657.

[35]

LIU T Y, XU Z H, HE H, et al. Taxonomy-structured Domain Adaptation[C]//Proceedings of the 40th International Conference on Machine Learning. Cambridge: JMLR, 2023: 22215-22232.

[36]

WU H, LI J M, ZHANG Q Y, et al. Intelligent Fault Diagnosis of Rolling Bearings Under Varying Operating Conditions Based on Domain-adversarial Neural Network and Attention Mechanism[J]. ISA Trans, 2022, 130: 477-489. DOI: 10.1016/j.isatra.2022.04.026 .

基金资助

山西省回国留学人员科研教研资助项目(2024-047)

AI Summary AI Mindmap
PDF (4269KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/