融合二维卷积与门控循环神经网络的滚动轴承多故障诊断方法

张雄; 董乐聪; 王文强; 渠伟瀅; 万书亭

doi:10.3969/j.issn.1004-132X.2025.12.021

中国机械工程 ›› 2025, Vol. 36 ›› Issue (12) : 2978 -2985. DOI: 10.3969/j.issn.1004-132X.2025.12.021

智能制造

融合二维卷积与门控循环神经网络的滚动轴承多故障诊断方法

张雄 ¹^,² ,
董乐聪 ² ,
王文强 ² ,
渠伟瀅 ² ,
万书亭 ¹^,²

作者信息 +

A Multi-fault Diagnosis Method for Rolling Bearings Integrating Two-dimensional Convolutional and GRU

Xiong ZHANG ¹^,² ,
Lecong DONG ² ,
Wenqiang WANG ² ,
Weiying QU ² ,
Shuting WAN ¹^,²

Author information +

文章历史 +

PDF (3246K)

摘要

针对滚动轴承在复杂工况下的单一或复合故障诊断与分类困难的问题，提出了一种二维卷积神经网络（2D-CNN）与门控循环神经网络（GRU）融合的轴承故障诊断方法。首先采用2D-CNN层和GRU层提取空间特征与时序特征，并引入批量标准化（BN）层防止过拟合，然后通过权重融合综合二者提取的空间与时序信息特征，再使用全局平均池化层代替展平层，最后用协方差矩阵和t-SNE算法对模型训练过程进行可视化分析并通过激活函数Softmax分类输出结果。通过故障预测与健康管理（PHM）数据集和XJTU-SY数据集对模型进行验证，并和其他模型作对比，结果显示了所提模型良好的准确率和泛化性。

Abstract

Aiming at the problems of difficulty in diagnosing and classifying single or compound faults of rolling bearings under complex working conditions，a bearing fault diagnosis method was proposed by fusing two-dimensional convolutional neural network（2D-CNN）and GRU.Firstly，the 2D-CNN layer and GRU layer were used to extract the spatial and temporal features，and the batch normalization（BN） layer was introduced to prevent overfitting.Secondly，the spatial and temporal information features extracted by weight fusion were synthesized，and then the global average pooling layer was used instead of the flatten layer.Finally，the covariance matrix and t-SNE algorithm were used to visualize and analyze the model training processes and output the results by activation function Softmax classification.The model was verified by prognostics and health management（PHM） dataset and XJTU-SY dataset，and compared with other models，the good accuracy and generalization of the model were shown.

Graphical abstract

关键词

滚动轴承 / 卷积神经网络 / 门控循环神经网络 / 故障诊断与分类 / 可视化分析法

Key words

rolling bearing / convolutional neural network / gated recurrent neural network（GRU） / fault diagnosis and classification / visual analytics

Author summay

引用本文

引用格式 ▾

张雄,董乐聪,王文强,渠伟瀅,万书亭. 融合二维卷积与门控循环神经网络的滚动轴承多故障诊断方法[J]. 中国机械工程, 2025, 36(12): 2978-2985 DOI:10.3969/j.issn.1004-132X.2025.12.021

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

受限于工作环境及工况条件等多种复杂因素，轴承故障的精确提取及复合故障的综合诊断十分困难。轴承是机械设备中不可或缺的关键部件，因此准确检测和诊断轴承的状况对确保机械设备的安全运行至关重要^［1］。

随着人工智能技术的发展，深度学习作为一种强大的机器学习方法，在轴承故障诊断领域得到了广泛的应用^［2-3］。赵靖等^［4］提出了一种运用残差注意力和卷积神经网络（convolutional neural network，CNN）来提高滚动轴承故障识别精度的方法。陈保家等^［5］将CNN与长短期记忆网络（long short-term memory，LSTM）结合来解决滚动轴承故障特征自适应提取与智能诊断的问题。邹筱瑜等^［6］通过时域和频域两种模态特征进行联合提取与分析来提高故障诊断精度。宫文峰等^［7］提出了一种运用全局均值池化代替全连接层的改进CNN方法。FU等^［8］提出了CNN和LSTM相结合的故障诊断模型。WU等^［9］提出了多尺度CNN和LSTM相结合与注意机制相融合的多目标优化算法。

上述方法在面对复杂工况下复合轴承故障时存在故障识别不准确的问题，为此本文提出了多故障卷积神经网络-门控循环神经网络（multi-fault convolutional neural network-gated recurrent neural network，MFCNN-GRU）模型。首先融合2D-CNN和GRU使模型能够同时捕捉空间特征与时序特征；然后引入批量标准化（batch normalization，BN）层与随机失活（Dropout）层降低过拟合的风险；最后使用全局平均池化层替代传统的全连接层进一步增强模型的泛化能力。通过故障预测与健康管理（prognostics and health management， PHM）数据集和西安交通大学与SY公司共同开发的XJTU-SY数据集进行验证并和同类诊断方法进行对比，验证了MFCNN-GRU算法的优越性和泛化性。

1 基本理论

1.1 卷积神经网络

卷积神经网络（CNN）通过卷积层采用局部感知的方式有效捕捉局部特征，其构成包括输入层、卷积层、池化层、全连接层和输出层。卷积层和池化层通常几个交替连接^［10］。CNN模型的结构如图1所示。卷积过程^［11］表达式如下：

X i + 1 = W i * X i + b i

（1）

式中：

X i + 1

为经过卷积操作后的结果；

W i

为过滤器权重参数；*表示卷积操作；

X i

为当前输入信号；

b i

为偏移量。

池化层通过下采样减少特征图的维度，降低计算复杂度，同时保留重要特征，从而减少过拟合^［12］。通常有最大池化和平均池化两种操作。

1.2 门控循环神经网络

门控循环神经网络（GRU）是一种改进的循环神经网络（RNN）^［13］。GRU通过门控机制（更新门和重置门）有效地捕捉序列中的长距离依赖关系，减少梯度消失问题^［14］。相对于长短时记忆神经网络（LSTM），GRU的结构简单，参数更少，训练和收敛速度更快，尤其在数据量有限的情况下表现更好。通过更新门和重置门，GRU可以灵活地选择保留和遗忘的信息，使得模型能够适应不同的序列特征。GRU单元基本结构如图2所示，主要包括更新门、重置门和隐藏状态^［15］，其主要公式如下：

z t = σ W z ⋅ x t + U z ⋅ h t - 1

（2）

r t = σ W r ⋅ x t + U r ⋅ h t - 1

（3）

h ˜ t = t a n h (W h ⋅ x t + U h ⋅ (r t ⊙ h t - 1))

（4）

h t = (1 - z t) ⊙ h t - 1 + z t ⊙ h ˜ t

（5）

式中：z_t 为更新门；r_t 为重置门； x_t 为输入的特征矩阵；

h ˜ t

为当前候选状态特征矩阵； h_t_-₁ 为前一时刻的隐藏状态特征矩阵；σ为Sigmoid激活函数；tanh（·）为双曲正切函数； W_z 、 W_r 、 W_h 、 U_z 、 U_r 、 U_h 为可学习权重参数矩阵；⊙表示逐元素相乘。

滚动轴承振动信号中的故障特征往往具有时序动态特性（如冲击信号的周期性衰减）^［16］。GRU的隐藏状态传递可以有效捕捉振动信号中的时序依赖关系，重置门可过滤噪声干扰的历史信息，更新门则可以动态调整新旧状态权重，提高模型对噪声的鲁棒性^［17］。

2 MFCNN-GRU模型

MFCNN-GRU模型对传统的CNN-LSTM架构进行了重要的改进。该模型利用二维卷积层有效地捕捉空间特征，能够通过卷积操作提取局部特征信息，而1D CNN则仅关注于一维数据的局部特征。GRU在处理批量序列数据方面表现出色，显著增强了模型在时间维度上的学习能力。此外，模型通过加权组合来自不同来源的特征，促进了卷积网络与循环网络优势的融合，从而提高了特征表达能力。Dropout层的应用进一步增强了模型的鲁棒性，有效降低了过拟合的风险。模型的整体结构如图3所示。模型参数见表1。

以PHM数据集为例，对MFCNN-GRU模型和CNN-LSTM模型分别进行五次实验，每次实验包含两种配置：一次使用全局平均池化，一次采用传统全连接层。每次实验均迭代200次，实验结果如图4所示。结果表明，MFCNN-GRU模型准确率大于CNN-LSTM模型准确率，使用全局平均池化准确率大于使用全连接层准确率。

3 故障诊断流程

故障诊断整体流程如图5所示。首先选取需要的数据集信号并进行数据预处理，包括划分训练集和测试集；然后进入模型构建与训练阶段，经过多次迭代训练调整模型参数和超参数；再使用事先划分好的测试集对训练好的模型进行评估；最后对模型的测试结果进行评估和可视化分析。

4 实验

4.1 PHM数据集

实验使用的数据集为PHM 数据集，由北京交通大学联合多家单位组织提供，涵盖了多种类型的工业设备数据。数据采集自图6所示的地铁转向架故障模拟实验台，该实验台为地铁转向架的1∶2缩比模型。电机轴承型号为SKF6205-2RSH^［18］。传感器采样频率为64 kHz。

数据集中共包括9种工况，如表2所示。其中不同的横向载荷用以模拟列车直线行驶和过弯。横向加载为正表示加载方向为被测传动链电机侧方向，负则为被测传动链齿轮箱侧方向。

选取了不同工况下的10种数据集，涵盖内圈故障、外圈故障、滚动体故障、保持架故障及复合故障等类别。故障轴承来自电机驱动端、齿轮箱和左右轴箱。数据标签的设置如表3所示，M代表电机、G代表齿轮箱、LA和RA分别代表左右轴箱，标签0代表正常，其余标签代表不同故障。实验使用的计算机配置为Intel i5-13490F+RTX4060Ti。

每个数据文件中包含64万个采样点，并划分为625组，每组包含1024个采样点。数据集按照7∶3的比例分为训练集和测试集，以便模型训练与性能评估。

4.2 不同参数对准确率影响分析

4.2.1 不同特征提取层数对比

对MFCNN-GRU模型在特征提取层数为2~5层的情况进行对比实验，实验结果如图7所示。当特征提取层数为3时，模型的准确率最高且最为稳定；当层数为2时，特征提取能力不足，导致准确率下降并伴随波动；当层数增至4或5时，模型的准确率曲线出现了明显波动。

4.2.2 不同批次大小对比

对MFCNN-GRU模型在不同训练批次大小（32、64、128、256）下进行对比实验，结果见表4。实验结果表明，当批次大小为128时，模型所需的训练时间最短且准确率最高。与批次大小为64的模型相比，批次为128的训练时间缩短了5 s，且在训练效率和模型性能之间达到了较好的平衡。

4.3 实验结果验证

在本研究中，模型训练过程中采用批次大小为128，经过100次迭代后停止训练。为优化学习率，采用了ADAM优化器，以实现自适应调整。此外，模型参数的优化是基于交叉熵损失函数进行的。MFCNN-GRU模型的准确率和损失曲线见图8和图9。

训练集的准确率曲线与损失曲线在约7次迭代后趋于完全收敛。其中，准确率曲线达到了100%，损失曲线则无限接近于0。相对而言，测试集的准确率曲线和损失曲线在经历了20次迭代后同样达到了完全收敛状态，准确率曲线达到99.99%，损失曲线亦无限接近于0。这一结果表明，模型在训练集和测试集上的表现均显示出良好的收敛性。

在图10所示的矩阵中，横向表示预测标签，纵向表示实际标签。主对角线的值均达到了187，且与每种数据的测试集样本数相等，表明模型对单一故障和复合故障的识别准确率均达到了100%，进一步验证了模型在测试集上分类性能的优越性。

为了验证MFCNN-GRU模型相对于CNN-LSTM模型改进的有效性，在相同条件下以两个模型的第二层特征提取层为例，将第二层的输出特征用协方差矩阵进行可视化，结果如图11和图12所示。

实验结果表明，MFCNN-GRU模型所提取特征的冗余度低且特征间相关性较小，更有利于分类；而CNN-LSTM模型提取的特征相关性较高，致使CNN-LSTM模型偶尔出现混叠现象，不能够很好地区分单一故障和复合故障，进而使模型准确率偏低。

利用t分布随机邻居嵌入（t-distributed stochastic neighbor embedding，t-SNE）降维方法对训练期间分类过程进行可视化，结果如图13所示。初始阶段，原始数据的分布相对分散，表现出不同类别数据的混叠情况；随着训练的深入，不同类数据点逐渐分离，同类数据点则开始聚集；最终实现了完全的类别分离，表明模型在分类任务中的卓越性能。由这一结果也可看出模型对于复合故障具有出色的诊断能力。

4.4 与不同诊断方法对比

4.4.1 准确率和损失

为了证明模型的优越性，选取了3个对比模型，并在相同的测试数据集上对4个模型的性能进行了评估。3个对比模型的主要参数与MFCNN-GRU模型参数相同，结果见图14和图15。

模型在收敛速度和准确率方面均优于对比模型，准确率可达到99.99%。相对而言，对比模型中MobileNetV2模型在迭代次数为100时依旧未收敛，且其余两种模型的平均准确率分别为89.21%和80.51%。此外，MFCNN-GRU模型的损失曲线也表现出最小的损失值，与对比模型AlexNet相比损失值减小了约88%。因此，可以认为所提出的MFCNN-GRU模型在性能上显著优于对比模型。

4.4.2 不同数据集划分比例

为避免数据集划分比例不同对结果的影响，在相同条件下对四种模型在三种划分比例（6∶4、7∶3和8∶2）下进行了准确率的比较，结果如表5所示。无论采用何种划分比例，所提出的模型均有优异的准确率表现。这进一步验证了所提模型在复杂工况下对多种故障共存的诊断与分类的有效性。

4.4.3 噪声的影响

为了验证所提模型在实际应用中的抗噪性，向PHM数据集中引入高斯噪声，以模拟工业生产过程中可能出现的噪声干扰。信噪比S的计算方法为

S = 10 l g P s i g n a l P n o i s e

（6）

式中：P_signal、P_noise分别为信号和噪声的功率。

分别给四种模型添加信噪比为

-

10、

-

5、0、5、10 dB的高斯噪声，每种模型进行10次实验，选取平均准确率作为最终结果，如图16所示。

在各种信噪比情况下，MFCNN-GRU模型均表现出最优的准确率。即使在信噪比为

-

10 dB的条件下，MFCNN-GRU模型的准确率仍达到了85%。信噪比为0时，MFCNN-GRU模型的准确率便已经达到99.69%，表明MFCNN-GRU模型在强噪声环境下依然能够有效地进行故障诊断与分类，表现出良好的鲁棒性和准确性。

4.5 泛化性验证

为了验证MFCNN-GRU模型的泛化性，选取了XJTU-SY轴承数据集进行实验评估。数据集由西安交通大学（XJTU）与SY公司共同开发，旨在支持滚动轴承的寿命预测、故障诊断以及机械健康监测等领域的研究。该数据集涵盖了多种不同故障类型和工作条件，能够充分体现轴承在实际应用中复杂工况下的性能表现。在该数据集上进行实验能够进一步考察MFCNN-GRU模型在处理不同类型轴承故障时的泛化能力与鲁棒性。

轴承实验台由交流（AC）感应电动机、电动机速度控制器、支撑轴、两个支撑轴承（重型滚子轴承）、液压加载系统等组成^［19］。采样频率设置为25.6 kHz，分别对轴承不同损伤程度下的单一故障和复合故障进行试验。

实验中共包括三种工况，工况设置如表6所示。选用数据集中的数据标签设置如表7所示。每个数据文件中取64万个采样点，并将其划分为625组，每组包含1024个采样点。按照7∶3的比例分为428个训练集和187个测试集。

采取前一实验同样的参数，MFCNN-GRU模型诊断的准确率和损失结果见图17和图18，混淆矩阵和过程可视化如图19和图20所示。

由实验结果可以看出，MFCNN-GRU模型在XJTU-SY数据集上的故障诊断性能表现优异，具有较高的准确率和较小的损失值。这些结果充分验证了该模型具有较强的可用性和良好的泛化性。

5 结论

1）为了有效识别并将滚动轴承在复杂工况下的多种故障分类，提出了一种多故障诊断卷积神经网络-门控循环神经网络（MFCNN-GRU）轴承故障诊断方法。

2）通过加权融合了二维卷积神经网络（2D-CNN）的空间特征提取能力与GRU的时序动态建模能力，模型能够充分捕捉复杂工况下的多维故障信息；采用了批量标准化（BN）层、随机失活（Dropout）层和全局平均池化层优化模型；根据不同迭代次数、特征提取层数以及批次大小的实验结果优化模型的参数。

3）通过对MFCNN-GRU模型进行不同模型的特征协方差矩阵可视化对比实验、准确率和损失对比实验、噪声影响实验和泛化性验证实验，证明了加权融合2D-CNN和GRU提取特征、使用全局平均池化层、BN层和Dropout层可使模型在复杂工况下的准确率提高12%，损失值降低88%，即使在

-

10 dB信噪比的强噪声条件下仍可保持85%的准确率，验证了模型在工业场景中的应用可靠性。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	赵志宏，李春秀，窦广鉴，等. 基于MTF-CNN的轴承故障诊断研究［J］. 振动与冲击， 2023， 42（2）：126-131.

[2]	ZHAO Zhihong， LI Chunxiu， DOU Guangjian， et al. Research on Bearing Fault Diagnosis Based on MTF-CNN ［J］. Vibration and Shock， 2023， 42（2）：126-131.

[3]	杨平，苏燕辰，张振. 基于卷积胶囊网络的滚动轴承故障诊断研究［J］. 振动与冲击， 2020， 39（4）：55-62.

[4]	YANG Ping， SU Yanchen， ZHANG Zhen. Research on Fault Diagnosis of Rolling Bearing Based on Convolutional Capsule Network ［J］. Vibration and Shock， 2020， 39（4）：55-62.

[5]	李俊卿，刘静. 结合卷积神经网络和迁移学习的电机轴承故障诊断方法［J］. 华北电力大学学报（自然科学版）， 2023， 50（1）：76-83.

[6]	LI Junqing， LIU Jing. Fault Diagnosis Method of Motor Bearing Based on Convolutional Neural Network and Transfer Learning ［J］. Journal of North China Electric Power University （Natural Science Edition）， 2023， 50（1）：76-83.

[7]	赵靖，杨绍普，李强，等. 一种残差注意力迁移学习方法及其在滚动轴承故障诊断中的应用［J］. 中国机械工程， 2023， 34（3）：332-343.

[8]	ZHAO Jing， YANG Shaopu， LI Qiang， et al. A New Transfer Learning Method with Residual Attention and Its Applications on Rolling Bearing Fault Diagnosis ［J］. China Mechanical Engineering， 2023， 34（3）：332-343.

[9]	陈保家，陈学力，沈保明，等. CNN-LSTM深度神经网络在滚动轴承故障诊断中的应用［J］. 西安交通大学学报， 2021， 55（6）：28-36.

[10]	CHEN Baojia， CHEN Xueli， SHEN Baoming， et al. Application of CNN-LSTM Deep Neural Network in Fault Diagnosis of Rolling Bearings ［J］. Journal of Xi'an Jiaotong University， 2021， 55（6）：28-36.

[11]	邹筱瑜，孙国庆，王忠宾，等. 基于时频融合深度网络的矿用钻机轴承故障诊断［J］. 中国机械工程， 2024， 35（8）：1405-1413.

[12]	ZOU Xiaoyu， SUN Guoqing， WANG Zhongbin， et al. Bearing Fault Diagnosis of Mining Drilling Rig with Time-frequency-fused Deep Network ［J］. China Mechanical Engineering， 2024， 35（8）：1405-1413.

[13]	宫文峰，陈辉，张泽辉，等. 基于改进卷积神经网络的滚动轴承智能故障诊断研究［J］. 振动工程学报， 2020， 33（2）：400-413.

[14]	GONG Wenfeng， CHEN Hui， ZHANG Zehui， et al. Research on Intelligent Fault Diagnosis of Rolling Bearings Based on Improved Convolutional Neural Network ［J］. Journal of Vibration Engineering， 2020， 33（2）：400-413.

[15]	FU Guanghua， WEI Qingjuan， YANG Yongsheng. Bearing Fault Diagnosis with Parallel CNN and LSTM ［J］. Mathematical Biosciences and Engineering， 2024， 21（2）：2385-2406.

[16]	WU Chunming， ZHENG Shupeng. Fault Diagnosis Method of Rolling Bearing Based on MSCNN-LSTM ［J］. Computers， Meterials & Continua， 2024， 79（3）：4395-4411.

[17]	刘玉鑫，武文博，张雄，等. 基于 HHO-CNN 的轴承故障诊断方法研究［J］. 河北大学学报（自然科学版）， 2023， 43（6）：571-583.

[18]	LIU Yuxin， WU Wenbo， ZHANG Xiong， et al. Research on Bearing Fault Diagnosis Method Based on HHO-CNN ［J］. Journal of Hebei University （Natural Science Edition）， 2023， 43（6）：571-583.

[19]	CHEN Guangyi， TANG Gang， ZHU Zhixiao. VKCNN：an Interpretable Variational Kernel Convolutional Neural Network for Rolling Bearing Fault Diagnosis ［J］. Advanced Engineering Informatics， 2024， 62（B）：102705.

[20]	LIU Fang， LIANG Chen， GUO Zhihao， et al. Fault Fiagnosis of Rolling Bearings under Varying Speeds Based on Gray Level Cooccurrence Matrix and DCCNN ［J］. Measurement， 2024， 235：114955.

[21]	CHO K， van MERRIENBOER B， GULCEHRE C， et al. Leaning Phrase Representations Using RNN Encoder-Decoder for Statistical Machine Translation ［J］. ArXiv， 2014， 1406：1724-1734.

[22]	刘建伟，宋志妍. 循环神经网络研究综述［J］. 控制与决策， 2022， 37（11）：2753-2768.

[23]	LIU JIANwei， SONG Zhiyan. A Review of Recurrent Neural Networks ［J］. Control and Decision， 2022， 37（11）：2753-2768.

[24]	唐贵基，周威，王晓龙，等. 基于变维GRU-BiLSTM神经网络模型的滚动轴承寿命预测［J］. 中国工程机械学报， 2022， 20（6）：498-503.

[25]	TANG Guiji， ZHOU Wei， WANG Xiaolong， et al. Life Prediction of Rolling Bearings Based on Variable Dimensionality GRU-BiLSTM Neural Network Model ［J］. Proceedings of the China Society of Engineering Machinery， 2022， 20（6）：498-503.

[26]	朱云贵，郭瑜，陈鑫，等. 优化AR模型的滚动轴承故障IAS信号诊断方法［J］. 振动工程学报， 2024， 37（12）：2141-2147.

[27]	ZHU Yungui， GUO Yu， CHEN Xin， et al. Diagnostic Method for Rolling Bearing Fault IAS Signal Based on Optimized AR Model ［J］. Journal of Vibration Engineering， 2024， 37（12）：2141-2147.

[28]	Yin Shuxin， Chen Zengxu. Research on Compound Fault Diagnosis of Bearings Using an Improved DRSN-GRU Dual-channel Model ［J］. IEEE Sensors Journal， 2024， 24（21）：35304-35311.

[29]	DING Ao， QIN Yong， WANG Biao， et al. Evolvable Graph Neural Network for System-level Incremental Fault Diagnosis of Train Transmission Systems ［J］. Mechanical Systems and Signal Processing， 2024， 210：111-175.

[30]	WANG Biao， LEI Yaguo， LI Naipeng， et al. A Hybrid Prognostics Approach for Estimating Remaining Useful Life of Rolling Element Bearings ［J］. IEEE Transactions on Reliability， 2020， 69（1）：401-412.