基于预测与重构的桥梁异常状态检测模型

火久元; 窦瑞翔; 常琛; 陈峰; 张耀南

doi:10.13229/j.cnki.jdxbgxb.20240810

吉林大学学报(工学版) ›› 2026, Vol. 56 ›› Issue (02) : 497 -508. DOI: 10.13229/j.cnki.jdxbgxb.20240810

交通运输工程·土木工程

基于预测与重构的桥梁异常状态检测模型

火久元 ¹^,² ,
窦瑞翔 ¹ ,
常琛 ¹ ,
陈峰 ¹ ,
张耀南 ²

作者信息 +

Prediction and reconstruction based anomaly condition detection model for bridges

Author information +

文章历史 +

PDF (3347K)

摘要

提出了一种时间特征与空间特征融合的桥梁异常状态检测模型TSSF-BADM，通过图注意力网络（GAT）和长短期记忆网络（LSTM）提取时间和空间的数据特征，将不同维度的特征通过门控循环单元（GRU）进行融合并捕获时间序列的顺序模式；融合后的数据再通过预测和重构模型进行联合优化，分别使用堆叠LSTM网络和变分自编码器（VAE）进行预测和重构；最后，使用峰值超过阈值（POT）方法对模型的预测和重建误差进行分析，获得阈值并进行异常检测，将超过异常阈值的样本视为异常样本。实验对比结果表明：本文模型在真实桥梁Z24上取得了良好效果，识别的准确率达到了0.986 8，识别延迟仅有0.008，均优于LSTM_VAE、MAD_GAN、OmniAnomaly等其他对比模型，能够有效进行桥梁异常状态检测，可为桥梁安全检测、预防性维护等提供决策。

Abstract

This paper proposes a bridge anomaly detection model that integrates temporal and spatial features TSSF-BADM. The model utilizes graph attention networks （GAT） and long short-term memory （LSTM） networks to extract temporal and spatial data features. These multi-dimensional features are then fused using gated recurrent units （GRU） to capture sequential patterns in the time series. The fused data undergo joint optimization through prediction and reconstruction models， employing stacked LSTM networks and variational autoencoders （VAE） for prediction and reconstruction， respectively. Finally， the prediction and reconstruction errors of the model are analysed using the peak over threshold （POT） method to obtain the threshold and perform anomaly detection， and the samples exceeding the anomaly threshold are considered as anomalous samples. The experimental comparison results show that the model in this paper achieves good performance on the real bridge Z24， the accuracy of recognition reaches 0.986 8， and the recognition delay is only 0.008， which are all better than other comparative models such as LSTM_VAE， MAD_GAN， OmniAnomaly， etc.， and are able to effectively carry out the detection of the abnormal state of the bridge. It provides decision-making for bridge safety detection， preventive maintenance， etc.

Graphical abstract

关键词

桥梁异常状态检测 / 时空特征融合 / 重构模型 / 预测模型

Key words

bridge anomaly detection / integration of spatial and temporal features / reconstructed model / prediction model

引用本文

引用格式 ▾

火久元,窦瑞翔,常琛,陈峰,张耀南. 基于预测与重构的桥梁异常状态检测模型[J]. 吉林大学学报(工学版), 2026, 56(02): 497-508 DOI:10.13229/j.cnki.jdxbgxb.20240810

登录浏览全文

4963

注册一个新账户忘记密码

0 引　言

桥梁结构作为城市交通运输的关键工程，其设计服役寿命长达数十年，需要确保其安全性、承重力、耐久性等性能指标符合要求。然而，桥梁在服役期间会受到材料老化、过度荷载、意外损坏等因素影响，导致性能退化，进而影响桥梁的服务能力^［1，2］。桥梁故障可能导致运输中断和重大损失，因此，需要有效的异常状态检测和评估方法。

传统的检测方法存在耗时耗力、主观性强等问题，难以发现内部损伤。因此，结构健康监测（SHM）系统逐渐受到关注。SHM系统利用传感器捕捉桥梁的结构行为数据^［3］，包括加速度计、温度传感器、应变计和位移传感器，并对数据进行分析，以识别桥梁的变化和异常。

常见的基于SHM的方法包括基于振动、应变和位移的监测^［4］。尽管SHM系统被证明在早期的异常检测方面非常有效，但是对大量数据的处理以及损伤特征的提取还是存在挑战。为解决上述问题，研究人员开始将工作重点转移到深度学习的方法中。Abdeljaber等^［5］提出了一种一维CNN的监督学习方法，用于检测一个小型格栅钢结构上的结构损伤。由于从不同设施中收集的数据可能不适用于训练^［6］其他结构，因此，无监督学习逐渐被广泛用于桥梁异常检测。Rafiei和Adeli^［7］提出了一种基于无监督深度自动编码器的方法来提取损伤敏感特征。Silva等^［8］提出了一种无监督的两级特征提取方法，采用堆叠自动编码器来学习模态属性。Soleimani等^［9］提出了一个基于GAN进行SHM无监督异常检测的框架，在两个基准数据集上实现了较高的准确率。Sony等^［10］使用振动传感器数据作为LSTM网络的输入，并利用模型输出的类别概率来确定损伤的位置。Li等^［11］将广义自编码器与统计模式识别相结合，使用功率倒频作为输入和输出，有效解决了网络复杂性和过拟合问题。

为了进一步研究符合真实监测场景以及更加准确地监测桥梁损伤，本文提出了一个基于预测与重构的网络模型，并且在真实的Z24基准桥上进行测试。它可以学习传感器在时间和空间维度上的依赖关系，联合优化的方法也能够更加准确地评估桥梁损伤情况。通过对比验证得出，异常状态检测模型能够快速、准确地识别出桥梁异常状态。

1 理论基础

1.1　时间卷积网络

TCN是时间卷积网络（Temporal convolutional network）^［12］的简称，它由具有相同输入和输出长度的扩张因果卷积层组成。TCN使用了一个一维的全卷积网络，它具有相同长度的输入、隐藏和输出层。同时，TCN使用因果卷积，当前时刻的输出只依赖于该时刻之前的输入。为了捕捉长期依赖和减少卷积层的叠加，TCN提出扩张卷积，使得有效窗口大小随层数指数增长，这样卷积网络可以获得更大的感受野。

1.2　变分自编码器

自编码器是一种通过无监督学习训练的模型^［13］，它具备生成与训练数据相似的数据样本的功能，使其可以应用于数据增广和无监督神经网络的预训练等阶段。自编码器模型主要由两个部分组成：

（1）编码器（Encoder）：通过非线性映射函数将原始输入向量

x

映射到低维的表示

z

。

（2）解码器（Decoder）：通过变换将隐藏表示

z

映射回原始输入空间，以得到重构数据

x'

。

变分自编码器（VAE）是自编码器的扩展形式^［14］，VAE利用两个神经网络建立两个概率密度分布模型：推断网络用于原始输入数据的变分推断，生成隐变量的变分概率分布；生成网络根据生成的隐变量变分概率，还原生成原始数据的近似概率分布。

1.3　长短期记忆网络

长短期记忆网络（Long short-term memory，LSTM）是一种用于处理序列数据的循环神经网络模型^［15］。LSTM神经网络的核心组件是一个门控机制，它可以控制信息的流动和遗忘，过滤掉桥梁监测数据中的噪声，减轻记忆负担。门控机制由3个门组成：输入门、遗忘门和输出门。每个门都有一个权重矩阵和一个偏置向量。当输入序列经过LSTM网络时，每个门的权重和偏置都会根据输入进行更新，以适应不同的序列模式。同时，LSTM网络还包含一个记忆单元，可以在不同的时间步骤中存储和检索先前的信息。

1.4　图注意力网络

注意力机制在序列数据中得到了广泛应用，其可以关注数据中重要的部分。图神经网络也可以使用注意力机制，即图注意力网络（GAT）^［16］。结合图神经网络的特点，可以很好地表达非欧几里得数据，相对于大部分深度学习方法来说更有优势。同时，使用注意力机制可以更好地捕捉时间序列中的相关性，从而提高时间序列异常检测的准确率。

1.5　门控循环网络

门控循环网络（GRU）是对LSTM的一种改进^［17］，可以捕捉长期信息。与LSTM网络相比，GRU将遗忘门和输入门合成了一个单一的更新门，同样还有细胞状态和隐藏状态。其结构不仅更简单，计算更快捷，同时拥有较高的计算精度。

2 桥梁异常状态检测模型

为了进一步完善桥梁监测数据间依赖关系的建模，构建了一种新的无监督桥梁异常检测模型TSSF-BADM，其整体网络架构如图1所示。

2.1　数据预处理

不同变量往往具有不同的数值范围，因此，为了提高模型的鲁棒性，本文首先基于训练数据对每个时间序列执行数据归一化，以消除不同变量之间的量纲影响。具体地，本文使用最大最小归一化对多元时序数据进行处理，如式（1）所示：

x' = x - m i n (D t r a i n) m a x (D t r a i n) - m i n (D t r a i n)

（1）

然后，用步幅为

s

的时间窗口

w

从训练数据集

D t r a i n

中提取

N

个多元序列

{S n} n = 1 N

作为正式送入模型训练的数据。每个多元序列中包括

w

个连续的时序数据，如式（2）所示：

S n = [x (n - 1) ⋅ s, x (n - 1) ⋅ s + 1, …, x (n - 1) ⋅ s + w - 1]

（2）

在归一化处理数据的基础上，利用谱残差法（Spectral residual method， SR）^［18］进行训练，检测训练数据中每个时间序列的异常时间戳。在异常时间戳处检测到的异常数据被替换为正常值，从而在训练数据集中清除可能的异常值。该方法有效避免了对模型的误导，使模型能够更准确地学习到时间序列的正态分布。

2.2　特征预提取

为了更好地捕捉时间序列中的时间信息，在数据处理后加入了时序卷积网络（TCN）对时间序列数据进行特征提取。TCN模块将扩展因果卷积与残差网络相结合，使其能够更好地捕捉长期时间序列信息。

输入层采样率

d = 1

，表示每个输入数据在一维卷积中采样，并输入下一层。第一个隐藏层的采样率

d = 2

，表示每两个样本取一个样本作为下一层输入。以此类推，随着层数的加深，扩展因果卷积使得感受野的大小在卷积运算过程中呈指数级增长，有效获取更大的感受野，捕获更长的时间信息。因果卷积结构保证了当前输出值仅依赖于当前和过去的数据，即时刻

T

的输出

y T

仅与

x 1, x 2, …, x T

相关，防止在预测过程中泄露未来的数据。

TCN模块中感受野的大小与网络层数有很大的关系，如果为了扩展感受野而将网络设计得过深，则扩张的因果卷积必然会导致网络结构更加复杂，效率和稳定性降低，极易造成梯度消失和梯度爆炸。因此，TCN模块引入了残差连接，缓解了梯度消失^［19］，有效提高了性能。

2.3　特征提取

2.3.1　时间特征提取

LSTM模型具有良好的记忆性和泛化性，能够选择记忆桥梁损伤时序数据中含有损伤特征的数据，处理桥梁数据之间的长期依赖关系和复杂的序列模式。在每个时间步骤中，LSTM网络会根据当前的输入和前一时刻的隐藏状态来计算3个门的输出，分别表示输入、遗忘和输出的控制信号。同时，网络还会更新记忆单元的状态，以存储和检索前一时刻的信息。最后，LSTM网络会根据当前的门控信号和记忆单元状态，计算当前时刻的输出，并将其传递到下一个时间步骤中。LSTM模型的具体计算公式^［20］如下：

记忆细胞计算过程数学表达式为：

C t = C t - 1 × f t + C ˜ t × i t

（3）

遗忘门计算过程数学表达式为：

f t = σ (W f ⋅ [h t - 1, x t] + b f)

（4）

式中：

W f

为遗忘门的权重矩阵；

b f

为遗忘门的偏移量。

输入门计算过程数学表达式为：

i t = σ (W i ⋅ [h t - 1, x t] + b i) C ˜ t = t a n h (W c ⋅ [h t - 1, x t] + b c)

（5）

式中：

W i

和

W c

为输入门的权重矩阵；

b i

和

b c

为输入门的偏移量。

输出门计算过程数学表达式为：

o t = σ (W o ⋅ [h t - 1, x t] + b o) h t = o t × t a n h (C t)

（6）

2.3.2　空间特征提取

在空间动态特征提取模块，GAT在聚合信息时，图注意力机制对每个节点的邻居节点计算注意力权重，从而可以捕捉当前节点与其邻域节点之间的相关性。聚合后的特征向量可以用来表示该节点，其中输入为

h ⃗ = h ⃗ 1, h ⃗ 2, ⋯, h ⃗ r, h ⃗ i ∈ R F

，

h ⃗ i

表示输入节点

v i

的特征，

F

为特征的维度。

W

为权值矩阵对输入的特征进行线形转换得到的高维特征，接着使用式（7），即采用自注意力机制计算注意力系数

e i j

，

e i j

表示节点

v j

对节点

v i

的重要程度。此时，可以仅考虑节点

v i

对所有节点的权重，也可以为了便于训练模型，仅选择节点

v i

的邻域节点。接着在式（8）中对

e i j

进行归一化处理，从而得到节点

v j

对节点

v i

的权重系数，最后，式（9）通过与输入特征进行加权得到最终的输出

h ⃗ i

，

h ⃗ i

可以表示节点

v i

的特征^［21］。

e i j = L e a k y R e L U a ⃗ T W h i ⃗ | | W h j ⃗

（7）

α i j = e x p L e a k y R e L U a ⃗ T W h i ⃗ | | W h j ⃗ ∑ k ∈ N i e x p L e a k y R e L U a ⃗ T W h i ⃗ | | W h k ⃗

（8）

h ⃗ i = σ (∑ j ∈ N i α i j W h ⃗ j)

（9）

时间序列异常检测的相关性特征对于准确率来说十分重要，随着时间序列维度的增加，其中的相关性越来越复杂，从空间上检测异常可以提高异常检测的准确率，因此，GAT的优势符合这一任务。

2.3.3　时空特征融合

特征融合模块是对时间特征、空间特征以及预处理特征的融合，通过图2所示的策略结合元素级相加和维度拼接两种方法进行融合。首先，将时间特征

a i

与空间特征

r i

送入GRU模型中捕获长期时间序列信息，GRU模型作为LSTM的改进模型，减少了门的内部设计，简化了模型结构，更好地捕获了长期时间序列信息。

然后，将GRU层的输出送入注意力机制中，对不同特征赋予不同权重，注意力机制的显著优势在于它关注相关信息而忽略无关信息。通过计算注意机制，增加关键信息的权重，降低非关键信息的权重。接下来，对时间特征与空间特征进行元素级相加得到中间输出

v i

，再将中间输出

v i

与TCN预提取特征

c i

进行维度拼接后输出，用于后续的工作。

2.4　联合优化与异常检测

2.4.1　联合优化

联合优化机制是一个简单的加权和，其中更可靠的方法被赋予更高的信任度，并具有以下优点：

（1）相较于单一方法，结合使用这两种方法可以提高异常检测的准确性和鲁棒性。

（2）一些异常可能在某个单一模型中被视为正常，但结合多个模型可以减少误报和漏报。

（3）基于预测的方法强调时间序列中的时序相关性，而基于重构的方法侧重于学习数据的空间分布特征。

由于预测模型和重构模型各有优势，本文将两种模型结合起来。所得到的模型包括一个预测模型和一个重构模型，预测模型用来预测下一时间戳的值，重构模型用来重建整个时间序列的数据分布。在训练过程中，两个模块的参数同步更新并进行联合优化。损失函数包括两个优化目标，定义为：

ℒ = ℒ r e c + ℒ p r e d

（10）

式中：

ℒ r e c

为重构模块的损失函数；

ℒ p r e d

为预测模块的损失函数。

2.4.2　预测模型

预测模块使用当前输入值

x i, t + 1

来预测下一时间戳的观测值，预测模型使用图3所示的堆叠LSTM网络来作为预测模型。堆叠LSTM网络由多个LSTM层组成，每个LSTM层都有自己的隐藏状态和记忆单元。每个LSTM层接收上一层的隐藏状态作为输入，并输出当前层的隐藏状态和记忆单元。这种层与层之间的连接方式使得网络能够逐层学习和提取序列数据中的特征。输入序列数据传递给第一个LSTM层，第一个LSTM层提取特征并将隐藏状态和记忆单元传递给第二层；第二层逐渐学习更高级的特征，并同样将隐藏状态和记忆单元传递到最后一层；最后一层LSTM在学习并提取特征后用于预测下一时刻的值。利用真实值与预测值的均方根误差作为预测损失：

ℒ p r e d = 1 N ∑ N i = 1 (x i, t - 1 - x^i, t - 1) 2

（11）

式中：

x i, t - 1

为第

i

个时间序列在

t - 1

时刻的真实值；

x^i, t - 1

为第

i

个时间序列在

t - 1

时刻的预测值。

2.4.3　重构模型

重构模块的目标是学习输入数据的重构概率，本文使用变分自编码器（VAE）来进行重构。整个VAE网络由编码器和解码器组成。本模块中使用的VAE结构如图4所示，设计使用LSTM作为编码器，多层感知机MLP作为解码器。给定输入

𝒳 t

，VAE模型使用条件分布

p ψ (𝒳 t | z t)

来重构

𝒳 t

，其中

z

为潜在表示。训练重构模块的目标是最大化后验分布

z t

：

p ψ (z t | 𝒳 t) = p ψ (𝒳 t | z t) p ψ (z t) / p ψ (𝒳 t)

（12）

式中：

p ψ (𝒳 t)

为

𝒳 t

的重构概率。

设

p ψ (𝒳 t) = {p i | i = 1,2, …, N}

，其中

p i

为第

i

个单变量时间序列的重构概率。在每个时间戳，组合模型将产生两个推断结果。重构概率

p ψ (𝒳 t)

的定义如下：

p ψ (𝒳 t) = ∫ p ψ (z t) p ψ (𝒳 t | z t) d z t

（13）

2.4.4　异常检测

在每个时间戳，重构模块和预测模块分别生成重构概率

p i

和预测值

x^i

，其中

x^i

为第

i

个单变量时间序列的预测值。最终的异常分数平衡了这两个模块的权重，具体来说，异常评分为：

S c o r e = ∑ N i = 1 (x^i - x i) 2 + γ × (1 - p i) 1 + γ

（14）

式中：

(x^i - x i) 2

为预测与真实之间的平方误差；

(1 - p i)

为重构模型将特征值判定为异常值的概率；

γ

为平衡验证集中两个模块的超参数。

在测试阶段，异常检测的规则是，如果在某个时间戳上的异常评分大于定义的异常阈值，则将该时间戳标记为“异常”，否则标记为“正常”。本文使用峰值超过阈值（POT）^［22］算法在验证集上选择异常阈值。

2.5　异常检测流程

本文异常状态检测方法的总体流程如图5所示，主要步骤如下：

（1）数据采集与处理：对传感器收集到的加速度数据进行预处理，主要包括对数据的异常值替换、归一化处理以及数据集划分。

（2）特征提取与融合：使用TCN进行特征预提取，捕获序列中的长期依赖关系；处理后的数据分别输入GAT和LSTM中，提取特定的时空特征；最后进行特征融合，减轻非关键信息的干扰。

（3）联合优化：将通过特征融合后的输出分别送到预测与重构的模型中，联合优化预测损失与重构损失，输出预测值及重构概率。

（4）综合评分与检测：通过阈值确定方法对模型的预测值和重构概率进行分析，获得阈值，输出最终检测状态。

3 实验与分析

3.1　实验设置

本实验使用的显卡为NVIDIA GeForce RTX 3080，CUDA版本为11.8，编程语言为Python 3.8.17，深度学习框架为PyTorch 2.0.1版本，在Windows 10操作系统下运行，内存为32 GB。本文实验所用的超参数设置具体如表1所示。

3.2　数据说明与处理

Z24桥^［23］建于1963年，是伯尔尼和苏黎世之间的一座后张式混凝土箱梁桥。如图6所示，这座桥连接了Koppigen村和Utzenstorf村。桥主跨长30 m，两侧跨长14 m，总长度为58 m，宽度为8.6 m。两个混凝土桥墩被固定在主梁上，位于主跨的末端，构成了中间支撑。

虽然没有发现结构问题，但是由于旁边的一条铁路需要一座侧跨更大的新桥，所以这座桥还是在1998年被拆除。在拆除之前，为了证明损伤对桥梁动力性能的影响，进行了一系列渐进式可控制的人为破坏^［24］。表2总结了Z24桥上所进行的渐进损伤场景^［25］。

在桥梁完全拆除前不久，进行了为期一个月的渐进式破坏实验。通过检查这些实验是否与桥梁安全相关，以及模拟损坏是否经常发生，确保了这些实验的实际意义。为了监测桥梁动态，在不同的点和不同的方向上测量了桥梁上的16个加速度。传感器布设的位置如图7所示，其中8个传感器在检测过程中失效，另外两个传感器因损坏而未纳入分析，在本次工作中实际使用的传感器为S5、S6、S7、S12、S14和S16。每小时，加速度计以100 Hz的频率记录桥梁10 min内的振动，每个样本总共有65 536个加速度值。PDT数据库分为环境振动实验（AVT）和强迫振动实验（FVT）两个子数据库。在AVT子数据库中，桥梁由环境荷载激励，而在FVT子数据库中，桥梁由两个振动台控制激励，以减小交通噪声对测量的影响。本研究中，只考虑在AVT期间收集的测量结果。在实验中使用的训练集共有184 320条数据，验证集包括20 480条数据，测试集中包括87 840条数据，测试数据的异常率为21.8%。

3.3　异常检测的评价指标

（1）准确率（ACC）：准确率是衡量异常检测算法性能的最基本指标之一，指的是异常检测算法在预测过程中正确分类的样本数占总样本数的比例。准确率越高，说明该算法的预测结果越准确。

A C C = T P + T N T P + T N + F P + F N

（15）

式中：TP为时间序列中的正常数据经过算法分析后判定为正常数据的个数；TN为时间序列中的异常数据经过算法分析后判定为异常数据的个数；FN为时间序列中的正常数据经过算法分析判定为异常数据的个数；FP为时间序列中的异常数据经过算法分析后判定为正常数据的个数。

（2）召回率（Recall）：召回率主要衡量模型正确预测为正常样本的比例。

R e c a l l = T P T P + F N

（16）

（3）精度（Precision）：精度表示模型预测为正常样本数在所有正常样本中所占的比例。

P r e c i s i o n = T P T P + F P

（17）

（4）F₁值：F₁为召回率与精度的调和均值，可以更好地评估异常检测的性能。

F 1 = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l

（18）

（5）延迟值：延迟是除了准确性之外的另一个重要指标，它衡量异常发生后的滞后时间。延迟定义为第一次异常观测报告与第一次真正异常之间的距离。具有较低延迟的算法能够及时预警异常，方便排除故障，降低潜在故障发生的可能性。本文通过使用基于搜索获得的最优阈值生成的预测向量来计算延迟。

3.4　桥梁异常状态检测实验

使用健康状态下的数据集进行模型训练，训练过程中的损失变化情况如图8所示。模型在训练大约20轮时达到收敛状态，并保持较小的误差和损失值，训练过程中的损失值包括预测损失、重构损失以及总损失。然后，使用包括损伤场景下的测试数据集进行模型性能的评估，图9给出了测试数据在经过模型重构与预测的结果对比。图9（a）和图9（b）为正常场景下的重构与预测效果对比，图9（c）和图9（d）为损伤场景下的重构与预测效果对比。本文使用均方误差（MSE）来衡量不同场景下的重构与预测效果，MSE的计算公式如下：

M S E = ∑ i = 1 n (X o b s, i - X m o d e l, i) 2 n

（19）

式中：

X o b s, i

为预测值与重构值；

X m o d e l, i

为真实值；

n

为样本数量。

正常场景下的重构模型与预测模型的均方误差分别为0.000 071和0.000 0411，损伤场景下的重构模型与预测模型的均方误差分别为0.000 1和0.000 267。通过对比数据分布及误差，进一步说明了本文模型对数据特征的敏感性以及对损伤识别的准确性。

本文模型所识别出来的异常与实际异常相差不大，并且可以清楚地显示哪些时间戳是异常时刻。对于图10，横坐标为数据的索引，纵坐标为对应时间戳的异常评分，虚线为模型确定的异常阈值，异常阈值为0.028 29。其中，蓝色和红色区域指示错误检测的样本，彩图参见电子版，以下同。蓝色区域表示预测为异常但实际上正常的样本；红色区域表示预测为正常但实际上异常的样本；紫色区域表示正确检测到的样本。通过对识别为异常的样本和实际上也为异常的样本进行比较，可以看出该模型对异常的预测具有较高的准确性。

3.5　对比实验

为了验证模型在异常检测任务中的性能，在Z24数据集上将本文提出的异常检测模型TSSF-BADM与8种典型的异常检测方法进行了比较。主要包括PCA、Isolation Forest^［26］、AE^［27］、LSTM^［28］、LSTM-VAE^［29］、DAGMM^［30］、MAD-GAN^［31］、OmniAnomaly^［32］8种方法。表3展示了所有模型在Z24桥梁数据集上的精度、召回率和F₁。为了更准确地评估模型的性能，减小偶然因素的影响，对每组实验都进行了多次实验，并取其平均值作为最终结果。本文的网络模型在与其他模型对比中表现出良好的性能。

根据对比结果，可以看到在准确率方面，本文算法表现最优，达到了0.972 1，相比其他算法明显更高。Precision是指在所有被分类为异常的样本中，确实是异常的比例，因此，高Precision意味着本文算法在识别异常时更加准确。在Recall方面，虽然本文算法略低于DAGMM，但仍高于大多数其他对比算法，达到了0.980 8。Recall是指所有实际异常样本中被正确识别为异常的比例，因此，高Recall代表本文算法更好地捕捉到了真正的异常情况。

而在F₁值方面，本文算法均高于其他算法，达到了0.983 7，表明本文算法在Precision和Recall之间取得了很好的平衡，能够较好地识别异常情况。另外，在模型的延迟方面，如图11所示，本文算法的延迟远低于其他算法，达到了0.008，这意味着本文算法可以实时监测和识别桥梁异常，及时做出处理，具有更高的实时性和效率。

综上所述，本文算法在桥梁异常检测中表现出色，具有更高的准确性、性能和实时性，为工程应用提供了更有效的解决方案。

3.6　消融实验

为了证明TSSF-BADM方法中每个组成部分的有效性，在Z24桥梁实际数据集上进行了消融实验。通过移除不同的模块，观察性能的变化。首先，移除时间特征提取模块LSTM。其次，去除空间特征提取模块图注意力网络。最后，分别移除重构模型和预测模型来对比移除不同模型对性能的影响。将TSSF-BADM模型多种变体命名如下：V1为移除时间特征提取模块LSTM；V2为移除空间特征提取模块GAT；V3为移除重构模块；V4为移除预测模块。

通过表4所示的消融实验对比结果可以观察到，相比于TSSF-BADM，移除时间特征提取模块LSTM后，Precision略微下降，可能是由于LSTM在捕捉时间序列内部特征方面具有一定优势，但是由于注意力网络和重构模型仍然能够在一定程度上弥补时间序列内部特征提取的缺失，使得Recall和F₁值都保持在高水平。移除空间特征提取模块GAT后，准确率、精确度、召回率和F₁值都显著下降，尤其是召回率下降到了较低水平。这表明图注意力网络能够有效捕捉数据中节点间复杂的空间依赖关系。空间特征可能对于整体预测任务至关重要，其缺失会导致模型性能明显下降。移除重构模块后，Precision和Recall有大幅下降，但F₁值仍然维持在一个较高水平。这表明重构模型在模型的整体性能中发挥了一定的作用，其移除导致了信息的损失和对整体性能的影响。移除预测模块后，精确度和F₁值稍有下降，但召回率下降较多。这表明模型在没有预测模型的情况下仍能保持一定的准确性，但在找回相关信息方面表现较差。预测模型可能在整体任务中扮演着重要角色，其缺失会导致模型在某些方面的性能下降。基于预测和基于重构的方法单独使用效果都不如两种方法的结合，这表明本文模型可以结合两者的优势。

3.7　 $γ$ 值分析

γ

值平衡了基于预测的误差和基于重构的概率，为了分析不同

γ

值对实验的影响，本文通过将

γ

设置为不同的值来评估Z24数据集的精度、召回率和F₁值。通过将

γ

值设置为0.4~1.0，得到了表5所示的对比结果。结果表明，当

γ

为0.8时，本文模型达到最佳性能。

4 结　论

（1）通过构建时间与空间特征提取模块，促进了不同尺度特征信息的融合，提高了特征提取能力，能够综合利用时间与空间特征，全面分析桥梁结构状态。

（2）设计了联合优化与评分方法，联合优化预测与重构损失，提高了异常检测的准确性和鲁棒性。

（3）通过在真实桥梁数据集Z24上的对比实验和消融实验验证了本文方法的有效性及良好的泛化能力，其能够更准确、快速地识别异常状态。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	交通运输部. 2022年交通运输行业发展统计公报[EB/OL]. [2024-03-31].

[2]	Entezami A, Sarmadi H, Behkamal B. A novel double-hybrid learning method for modal frequency-based damage assessment of bridge structures under different environmental variation patterns[J]. Mechanical Systems and Signal Processing, 2023, 201:No. 110676.

[3]	Domenico D. A review of vibration-based methods for damage detection in structures[J]. Journal of Structural Health Monitoring, 2018, 17: 3-35.

[4]	Gao T, Wang X, Li Z. Sensor-based methods for structural health monitoring of bridges: a review[J]. Measurement, 2018, 115: 243-261.

[5]	Abdeljaber O, Avci O, Kiranyaz M S, et al. 1-D CNNs for structural damage detection: verification on a structural health monitoring benchmark data[J]. Neurocomputing, 2018, 275: 1308-1317.

[6]	Cha Y J, Wang Z. Unsupervised novelty detection–based structural damage localization using a density peaks-based fast clustering algorithm[J]. Structural Health Monitoring, 2018, 17(2): 313-324.

[7]	Rafiei M H, Adeli H. A novel unsupervised deep learning model for global and local health condition assessment of structures[J]. Engineering Structures, 2018, 156: 598-607.

[8]	Silva M F, Santos A, Santos R, et al. Damage‐sensitive feature extraction with stacked autoencoders for unsupervised damage detection[J]. Structural Control and Health Monitoring, 2021, 28(5):No. e2714.

[9]	Soleimani B M H, Sepasdar R, Nasrollahzadeh K, et al. Toward a general unsupervised novelty detection framework in structural health monitoring[J]. Computer‐Aided Civil and Infrastructure Engineering, 2022, 37(9): 1128-1145.

[10]	Sony S, Gamage S, Sadhu A, et al. Vibration-based mul ticlass damage detection and localization using long short-term memory networks[J]. Structures Elsevier, 2022, 35: 436-451.

[11]	Li L, Morgantini M, Betti R. Structural damage assessment through a new generalized autoencoder with features in the quefrency domain[J]. Mechanical Systems and Signal Processing, 2023, 184: No.109713.

[12]	Fan J, Zhang K, Huang Y, et al. Parallel spatio-temporal attention-based TCN for multivariate time series prediction[J]. Neural Computing and Applications, 2023, 35(18): 13109-13118.

[13]	Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.

[14]	Chen N, Tu H, Duan X, et al. Semisupervised anomaly detection of multivariate time series based on a variational autoencoder[J]. Applied Intelligence, 2023, 53(5): 6074-6098.

[15]	Dubey A K, Kumar A, García D V, et al. Study and analysis of SARIMA and LSTM in forecasting time series data[J]. Sustainable Energy Technologies and Assessments, 2021, 47: No.101474.

[16]	Ding C, Sun S, Zhao J. MST-GAT: a multimodal spatial-temporal graph attention network for time series anomaly detection[J]. Information Fusion, 2023, 89: 527-536.

[17]	Tang C, Xu L, Yang B, et al. GRU-based interpretable multivariate time series anomaly detection in industrial control system[J]. Computers & Security, 2023, 127: No.103094.

[18]	Lei T, Gong C, Chen G, et al. A novel unsupervised framework for time series data anomaly detection via spectrum decomposition[J]. Knowledge-Based Systems, 2023, 280:No. 111002.

[19]	Shan D, Yao K, Zhang X. Sequential learning network with residual blocks: incorporating temporal convolutional information into recurrent neural networks[J]. IEEE Transactions on Cognitive and Developmental Systems, 2023, 16(1): 396-401.

[20]	Lin M, Wu J, Meng J, et al. State of health estimation with attentional long short-term memory network for lithium-ion batteries[J]. Energy, 2023, 268: No.126706.

[21]	刘嫣然, 孟庆瑜, 郭洪艳, 等. 图注意力模式下融合高精地图的周车轨迹预测[J]. 吉林大学学报: 工学版, 2023, 53(3): 792-801.

[22]	Liu Yan-ran, Meng Qing-yu, Guo Hong-yan, et al. Vehicle trajectory prediction combined with high definition map in graph attention mode[J].Journal of Jilin University(Engineering and Technology Edition), 2023, 53(3): 792-801.

[23]	Siffer A, Fouque P A, Termier A, et al. Anomaly detection in streams with extreme value theory[C]∥ Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Halifax, Canada, 2017: 1067-1075.

[24]	Peeters B, Roeck D. One year monitoring of the z24-bridge: environmental influences versus damage events[J]. Proceedings of the International Modal Analysis Conference, 2000, 2: 1570-1576.

[25]	Maeck J, Roeck D. Description of Z24 benchmark[J]. Mechanical Systems and Signal Processing, 2003, 17(1): 127-131.

[26]	Reynders E, Roeck D. Vibration-based damage identification: the Z24 benchmark[J]. Living Reference Work Entry, 2015, 1: 1-8.

[27]	Liu F T, Ting K M, Zhou Z H. Isolation forest[C]∥ Eighth IEEE International Conference on Data Mining, Pisa, Italy, 2008: 413-422.

[28]	Borghesi A, Bartolini A, Lombardi M, et al. Anomaly detection using autoencoders in high performance computing systems[C]∥ Proceedings of the AAAI Conference on Artificial Intelligence, 2019, 33(1): 9428-9433.

[29]	Hundman K, Constantinou V, Laporte C, et al. Detecting spacecraft anomalies using lstms and nonparametric dynamic thresholding[C]∥ Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, London, UK, 2018: 387-395.

[30]	Park D, Hoshi Y, Kemp C C. A multimodal anomaly detector for robot-assisted feeding using an lstm-based variational autoencoder[J]. IEEE Robotics and Automation Letters, 2018, 3(3): 1544-1551.

[31]	Zong B, Song Q, Min M R, et al. Deep autoencoding gaussian mixture model for unsupervised anomaly detection[C]∥ International Conference on Learning Representations, Vancouver, Canada, 2018: 1-19.

[32]	Li D, Chen D, Jin B, et al. MAD-GAN: multivariate anomaly detection for time series data with generative adversarial networks[C]∥ International Conference on Artificial Neural Networks, Budapest, Hungary, 2019: 703-716.

[33]	Su Y, Zhao Y, Niu C, et al. Robust anomaly detection for multivariate time series through stochastic recurrent neural network[C]∥ Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, Anchorage, USA, 2019: 2828-2837.

基金资助

国家自然科学基金项目(62262038)

甘肃省重点研发计划-工业项目(22YF7GA145)

AI Summary AI Mindmap

PDF (3269KB)

访问

被引

详细

导航

Received	Accepted	Published
2024-07-19
Issue Date
2026-06-15

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引 言

1 理论基础

1.1 时间卷积网络

1.2 变分自编码器

1.3 长短期记忆网络

1.4 图注意力网络

1.5 门控循环网络

2 桥梁异常状态检测模型

2.1 数据预处理

2.2 特征预提取

2.3 特征提取

2.3.1 时间特征提取

2.3.2 空间特征提取

2.3.3 时空特征融合

2.4 联合优化与异常检测

2.4.1 联合优化

2.4.2 预测模型

2.4.3 重构模型

2.4.4 异常检测

2.5 异常检测流程