一种时空特征融合的剩余寿命预测方法

龚永奇 ,  郭基联 ,  张亮 ,  唐希浪

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 438 -443.

PDF (2182KB)
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 438 -443. DOI: 10.3969/j.issn.1671-0673.2025.04.009
计算机科学与技术

一种时空特征融合的剩余寿命预测方法

作者信息 +

A Remaining Useful Life Prediction Method Based on Spatio-Temporal Feature Fusion

Author information +
文章历史 +
PDF (2233K)

摘要

针对剩余寿命预测精度低、退化特征难提取等问题,提出一种基于时空特征融合的剩余寿命预测方法。首先,构造双通道深度学习网络,通道1采用基于通道注意力机制的长短期记忆神经网络提取时间维度的退化信息,通道2采用语义分割网络挖掘空间维度的退化信息;其次,利用交叉注意力机制融合时空特征;最后,采用回归层实现剩余寿命预测。在商用模块化航空推进系统仿真数据集进行实验验证,结果表明,与其他深度学习方法相比,该方法在FD004测试集中均方根误差降低了16.21%,评分函数值降低了14.97%,实现剩余寿命的高精度预测。

Abstract

Aiming at the problems of low prediction accuracy of remaining useful life and difficulty in extracting degenerative features, a remaining useful life prediction method based on spatio-temporal feature fusion is proposed. Firstly, a dual-channel deep learning network is constructed, the long short-term memory neural network based on channel attention mechanism is used to extract the degraded information in the time dimension in channel 1, and the semantic segmentation network is used to mine the degraded information in the spatial dimension in channel 2. Secondly, the cross attention mechanism is used to fuse the spatiotemporal features. Finally, the regression layer is used to realize the remaining useful life prediction. Experimental verification on the simulation dataset of commercial modular aviation propulsion system shows that compared with other deep learning methods, the value of root mean square error and score in the FD004 test set are reduced by 16.21% and 14.97%, and the remaining useful life is predicted with high accuracy.

Graphical abstract

关键词

剩余寿命预测 / 时空特征融合 / 长短期记忆网络 / 语义分割网络 / 交叉注意力机制

Key words

remaining useful life prediction / spatio-temporal feature fusion / long short-term memory / semantic segmentation network / cross-attention mechanism

引用本文

引用格式 ▾
龚永奇,郭基联,张亮,唐希浪. 一种时空特征融合的剩余寿命预测方法[J]. 信息工程大学学报, 2025, 26(04): 438-443 DOI:10.3969/j.issn.1671-0673.2025.04.009

登录浏览全文

4963

注册一个新账户 忘记密码

剩余寿命(Remaining Useful Life, RUL)预测是装备故障预测和健康管理的重要环节,能够有效避免计划外停机,降低装备运行风险[1]。RUL预测主要采用数据驱动的方法,利用传感器检测数据,深度挖掘退化特征,实现高精度预测。数据驱动方法分为传统机器学习算法和深度学习算法[2]。传统机器学习算法包括类别特征梯度提升(Categorical Boosting, CatBoost)、支持向量机(Support Vector Machine, SVM)等[3-4],深度学习算法包括卷积神经网络(Convolutional Neural Network, CNN)、长短期记忆网络(Long Short-Term Memory, LSTM)等[5-6]。传统机器学习算法是浅层网络结构,其预测效果整体上不如深度学习算法。
RUL预测本质是挖掘表征系统退化规律的特征信息,包含时间和空间维度退化信息。如何更有效提取和融合时空退化信息,是实现RUL预测的关键。在深度学习算法中,CNN能挖掘数据特征,尤其是空间维度退化特征,并演化发展深度卷积神经网络(Deep CNN, DCNN)、时间卷积神经网络(Temporal Convolutional Network, TCN)、语义分割网络(Semantic Segmentation Network, SegNet)等[7-9]。但CNN未考虑时间维度中当前与过去的关联性。而LSTM在长序列预测和时间维度特征提取方面更具优势,并演化发展双向LSTM网络(Bi-directional LSTM, BiLSTM)、卷积LSTM网络(ConvLSTM)等[10]。但LSTM网络通常认为输入特征对输出结果同等重要,一定程度影响预测准确性。
为进一步提高RUL预测精度,时空特征融合逐渐成为趋势。文献[11]构建了ConvLSTM和TCN双通道模型,提取多维时空特征,采用多头注意力机制实现时空融合,有效提高了RUL预测精度。文献[12]构建了基于特征增强和时空信息嵌入的卷积神经模型,采用时空信息编码方式嵌入了时间序列信息和空间特征信息,并通过回归预测模块捕获数据内在关系。文献[13]构建了多尺度融合预测模型,深度挖掘时空退化特征,并融入门控残差机制,既提高了模型的适应性,也保证了信息在网络中传递的效率。但在多工况和故障模式下,时空退化信息提取并不充分,RUL预测结果波动较大。
对此,提出一种基于时空特征融合的剩余寿命预测方法。首先,将通道注意力机制(Squeeze and Excitation, SE)与LSTM网络相结合,提取不同输入数据的时间维度退化特征,同时采用SegNet提取空间维度特征;其次,通过交叉注意力(Cross Attention)机制实现时空特征融合;最后,在商用模块化航空推进系统仿真数据集(Commercial Modular Aero-Propulsion System Simulation, C-MAPSS)验证模型的有效性。

1 理论基础

1.1 SE-LSTM网络

不同的传感器数据所包含的退化信息并不相同,仅采用LSTM网络提取时间维度信息并不充分[14]。因此,考虑将SE和LSTM网络相结合,先由SE输出包含不同权重的特征序列,再经LSTM挖掘特征序列中的时序相关性信息,实现时间维度退化信息提取,其结构如图1所示。

设输入数据Xm×n=[x1,x2,,xn]n为输入数据的特征个数,m为每个特征时序长度,采用全局平均池化,将空间信息压缩到通道描述符号S1×n

S1×n=Fsq(Xm×n)

式中,Fsq表示全局池化操作。

采用两个全连接层,先降维、再升维,提取特征权重向量c1×n

c1×n=σ(W2δ(W1S1×n))

式中:σ(·)表示Sigmoid激活函数;δ(·)表示Swish激活函数;W1W2表示两个全连接层权重。

将权重向量c1×n与输入数据Xm×n点乘,生成加权后的特征数据zm×n

设第i个特征向量中第t个特征值为ztiintm,其遗忘门fti、输入门gti和输出门oti分别为:

fti=σ(Wf[ht-i1,zti]+bf)
gti=σ(Wg[ht-1i,zti]+bg)
oti=σ(Wo[ht-1i,zti]+bo)

式中, Wb 分别为网络权重和偏置。

长记忆输出cti、短记忆输出hti分别为:

cti=ftict-1+gtiC˜ti;C˜ti=tanh(Wc[ht-1,zti]+bc).
hti=otitanh(cti)

式中,tanh(·)表示双曲正弦激活函数。

1.2 SegNet网络

SegNet是以CNN为基础的语义分割网络,采用编码—解码结构,能够高效地提取空间退化信息[15]

SegNet中编码器和解码器均包含4个卷积层。其中:编码器主要包含卷积层、批量归一化层、激活函数及池化层;解码器主要包含卷积层、批量归一化层、激活函数及反池化层。多层卷积结构能够有效提取空间维度退化特征;编码与解码参数一一对应,通过特征缩放的方式,解决特征挖掘过程中可能出现的精度缺失问题。

1.3 Cross Attention网络

Cross Attention网络将时间维度特征作为键值集合,空间维度特征作为查询集合,捕捉两个输入之间的依赖关系,实现时空退化特征融合,其结构如图2所示。

设空间维度特征序列为X1,时间维度特征序列为X2,查询集合为Q=X1WQ,键集合为K=X2WK,值集合为V=X2WV,则交叉注意力可表示为

CrossAttention(X1,X2)=Softmax(QKdK) V

式中,dK表示键向量 K 的维度。

2 时空特征融合的RUL预测模型

2.1 预测方法流程

基于时空特征融合的RUL预测模型主要包括数据预处理、模型训练和模型测试。

步骤1:数据预处理,对数据进行归一化和降噪处理,并剔除无用数据;

步骤2:设置剩余寿命标签,并按照4∶1的比例划分训练集和验证集;

步骤3:训练集构建双通道网络结构,设置初始化参数,验证集进行交叉验证,实现双通道网络训练;

步骤4:将测试集数据输入最终模型,预测剩余寿命,并与其他算法进行对比分析。

2.2 双通道网络模型

为深度挖掘退化特征的时间和空间信息,实现时空特征融合,构建基于退化特征融合的双通道网络模型,如图3所示。

1)通道1。采用SE-LSTM网络提取时间维度的退化信息,并引入全连接层将数据展开。SE输出与输入特征通道相同;LSTM网络隐藏层维度为64。

2)通道2。采用SegNet提取空间维度退化信息,并引入全连接层将数据展开。SegNet中编码器4个卷积层输出通道依次为64、128、256、512,卷积核尺寸均为3×3,4个池化层过滤器尺寸均为2×2,步长为2。解码器与编码器的参数一一对应,解码器卷积层输出通道依次为512、256、128、64,卷积核尺寸均为3×3,4个反池化层尺寸均为2×2,步长为2。

3)时空退化特征融合。采用Cross Attention网络,将通道1提取的时间维度退化特征作为键值对序列,通道2提取的空间维度退化特征作为查询序列,实现退化特征时空融合。

4)RUL预测。根据提取的时空融合退化特征,使用回归层实现航空发动机RUL预测。

为进一步说明网络结构,设批量大小为B,滑动时间窗为M,特征通道为N,输入数据维度为(B,M,N)。通道1、通道2及特征融合模块参数分别如表1~表3所示。其中:M代表时间维度信息;N代表空间维度信息;K/V代表键或值信息;Q代表查询信息。

2.3 性能评价指标

将均方根误差(Root Mean Square Error, RMSE)和评分函数值(Score)作为评估RUL预测效果的指标。

y˜jyj分别表示第j个测试样本的剩余寿命预测值和真实值,N为测试样本的数量,均方根误差和评分函数值计算公式分别为:

RRMSE=1Nj=1N(y˜j-yj)2
RScore=j=1N(e- 113(y˜j-yj)-1), y˜j<yj;j=1N(e- 110(y˜j-yj)-1), y˜jyj.

式中:RRMSE表示预测值与真实值的均方根误差,其值越低则预测精度越高;RScore表示RUL预测误差的指数惩罚函数,RUL滞后预测较滞前预测的装备损失更大,因此滞后预测的RScore增加速度高于滞前预测,其值越小则RUL预测效果越好。

2.4 剩余寿命标签

考虑到航空发动机初期性能相对平稳,退化趋势不明显,因此将剩余寿命划分成常数阶段和线性递减阶段。设定常数阶段值为125,在模型训练中将剩余寿命标签归一化处理,验证时还原为预测结果。

3 实验验证

3.1 实验数据

C-MAPSS数据集提供了包含不同工作条件和故障模式下涡扇发动机的退化数据,共有FD001(1种飞行工况和1种故障模式)、FD002(6种飞行工况和1种故障模式)、FD003(1种飞行工况和两种故障模式)、FD004(6种飞行工况和两种故障模式)这4个子数据集[16]

为了验证所提方法对多工况、多故障模式下RUL预测的有效性,选用子数据集FD004进行实验分析。该数据集共有249条训练数据和248条测试数据,每条数据由21个传感器、3个工况条件、1个发动机编号和1个循环编号组成。其中,第1、5、6、10、16、18、19号传感器数据基本无变化或变化较小,经过归一化和自适应噪声完全集合经验模态分解降噪处理后,与输出结果关联不大,因此将上述传感器数据剔除,选用剩余的14个传感器数据作为退化特征。

3.2 实验过程和结果

实验平台为Python3.8解释器、PyTorch深度学习框架;处理器设备为Legion R7000 APH9、AMD Ryzen 77840H with Radeon 780M Graphics、Windows 11。

3.2.1 网络超参数设置

滑动时间窗口和批量大小是两种重要网络超参数。为提高RUL预测的准确率,分别选用滑动时间窗为16、32、48、64,批量大小为64、96、128、160开展实验,相应的均方根误差和评分函数值如图4图5所示。由图4可得,滑动时间窗设定为48和64时,均方根误差相近,但滑动时间窗口为48的评分函数值更低。由图5可得,批量大小设定为96时,模型预测均方根误差和评分函数值均最小。因此,选择滑动时间窗为48,批量为96。

3.2.2 预测结果

将FD004测试集中248台发动机进行RUL预测,其结果与真实值如图6所示。由图6可得,所提方法的RUL预测值与真实值误差较小,具有较好的预测性能。

将该模型与其他文献模型结果对比,不同模型的均方根误差、评分函数值如表4所示。由表4可得,本文方法在复杂工况、多故障模式下能提取更多的退化信息。与其他模型的最优值相比,本文方法的均方根误差降低了16.21%,评分函数值降低了14.97%。

3.2.3 消融实验

为验证双通道模型的优越性,将SegNet、SE-LSTM、LSTM与本文方法进行对比实验,网络参数设置保持不变,以测试集中第2、40、99、143号发动机为例,其剩余寿命值预测过程如图7所示。由图7可得,本文方法与发动机剩余寿命的变化拟合较好,优于单通道模型。

为进一步对比4种模型预测性能,分别运行10次,消融实验评价指标值取平均值,结果如表5所示。由表5可得,与时间维度通道SE-LSTM、LSTM相比,空间维度通道SegNet的均方根误差和评分函数值最大,说明时间维度退化信息比空间维度退化信息预测RUL效果更好,误差更小;同时LSTM网络中引入SE机制后,赋予不同输入特征权重,均方根误差和评分函数值进一步降低,说明SE-LSTM网络结合能够更好提取时间维度退化信息。而本文所构建双通道模型的均方根误差和评分函数值均小于单通道SE-LSTM、LSTM、SegNet,说明采用时空特征融合方法能够提取更多退化信息,与单通道预测方法相比,RUL预测精度更高。

4 结束语

针对多工况、多故障模式下装备RUL预测难度大、退化特征难提取等问题,提出一种时空特征融合的RUL预测方法。仿真结果表明,与其他深度模型相比,本文所提方法能够提取更多退化信息,有效提高了RUL预测精度,可为退化特征挖掘和RUL预测提供借鉴。同时,在RUL预测的基础上,确定不同工况下的维修间隔期更具实际意义,这也是下一步的研究方向。

参考文献

[1]

XU DXIAO X QLIU Jet al. Spatio-temporal degradation modeling and remaining useful life prediction under multiple operating conditions based on attention mechanism and deep learning[J]. Reliability Engineering & System Safety2023,229:No.108886.

[2]

XU D YQIU H BGAO Let al. A novel dual-stream self-attention neural network for remaining useful life estimation of mechanical systems[J]. Reliability Engineering & System Safety2022,222:No.108444.

[3]

李东君,李亚,李东文,.基于MIC特征提取与BO-CatBoost的航空发动机RUL预测[J].空军工程大学学报202425(1):31-38.

[4]

YANG DCHHATRE NCAMPI Fet al. Feasibility of support vector machine gesture classification on a wearable embedded device[C]∥Proceedings of the 2016 IEEE Canadian Conference on Electrical and Computer Engineering. Piscataway, USA: IEEE, 2016. DOI: 10.1109/CCECE.2016.7726800 .

[5]

郭俊锋,刘国华,刘国伟.基于长序列的航空发动机剩余使用寿命预测方法[J].北京航空航天大学学报202450(3):774-784.

[6]

吴嘉俊,苏春,张玉茹.基于双重自注意力机制和长短时记忆网络的剩余寿命预测[J].系统工程与电子技术202446(6):1986-1994.

[7]

LI XDING QSUN J Q. Remaining useful life estimation in prognostics using deep convolution neural networks[J]. Reliability Engineering & System Safety2018172:1-11.

[8]

王智龙,龙江,魏友,.基于TCN-AGRU的滚动轴承全寿命周期剩余使用寿命预测分析[J].电子技术202352(1):356-359.

[9]

SHANG Z WZHANG B RLI W Xet al. Machine remaining life prediction based on multi-layer self-attention and temporal convolution network[J]. Complex & Intelligent Systems20228(2):1409-1424.

[10]

CHEN Z HWU MZHAO Ret al. Machine remaining useful life prediction via an attention-based deep learning approach[J]. IEEE Transactions on Industrial Electronics202168(3):2521-2531.

[11]

车鲁阳,高军伟,付惠琛.基于双通道模型的航空发动机剩余寿命预测[J].空军工程大学学报202324(6):42-49.

[12]

李勇成,李文骁,雷印杰.基于特征增强与时空信息嵌入的涡扇发动机剩余寿命预测[J].计算机应用研究202441(4):1001-1007.

[13]

刘纳川,郭建胜,张晓丰,.基于多尺度融合预测模型的航空发动机剩余寿命预测[J].兵器装备工程学报202344(7):289-296.

[14]

聂磊,徐诗奕,张吕凡,.基于多头注意力机制的飞机发动机寿命预测研究[J].推进技术202344(8):197-205.

[15]

司徒祖祥,冯婉恩,钟琪升,.基于时空特征融合的城市洪涝混合深度学习预测[J].中国给水排水202440(17):131-136.

[16]

FREDERICK D KDECASTRO J ALITT J S. Users guide for the commercial modular aero-propulsion system simulation (C-MAPSS)[R/OL]. (2007-10-01)[2024-11-29].

[17]

LIU LSONG XZHOU Z T. Aircraft engine remaining useful life estimation via a double attention-based data-driven architecture[J]. Reliability Engineering & System Safety2022221:108330.

[18]

YOU K SQIU G QGU Y K. A 3-D attention-enhanced hybrid neural network for turbofan engine remaining life prediction using CNN and BiLSTM models[J]. IEEE Sensors Journal202424(14):21893-21905.

基金资助

国家自然科学基金(72201276)

AI Summary AI Mindmap
PDF (2182KB)

52

访问

0

被引

详细

导航
相关文章

AI思维导图

/