II导联心电图中心肌梗死检测与定位：基于多尺度残差模块融合改进通道注意力模型

吴秋岑; 卢学麒; 温耀棋; 洪永; 吴煜良; 陈超敏

doi:10.12122/j.issn.1673-4254.2025.08.22

南方医科大学学报 ›› 2025, Vol. 45 ›› Issue (08) : 1777 -1790. DOI: 10.12122/j.issn.1673-4254.2025.08.22

II导联心电图中心肌梗死检测与定位：基于多尺度残差模块融合改进通道注意力模型

吴秋岑 ¹ ,
卢学麒 ¹ ,
温耀棋 ¹ ,
洪永 ¹ ,
吴煜良 ² ,
陈超敏 ¹

作者信息 +

A myocardial infarction detection and localization model based on multi-scale field residual blocks fusion with modified channel attention

Qiucen WU ¹ ,
Xueqi LU ¹ ,
Yaoqi WEN ¹ ,
Yong HONG ¹ ,
Yuliang WU ² ,
Chaomin CHEN ¹

Author information +

文章历史 +

PDF (2240K)

摘要

目的提高心肌梗死（MI）检测和定位准确性，为临床诊断提供辅助决策支持。方法本文提出了一种基于多尺度残差模块融合改进通道注意力模型（MSF-RB-MCA）。该模型利用II导联心电图（ECG）信号检测和定位MI，通过多尺度残差模块提取不同层次的特征信息，并引入改进通道注意力自动调整特征权重，增强模型对MI区域的关注能力，从而提高MI检测与定位的精度。结果使用公开的PTB数据集对提出的模型进行了5折交叉验证。在MI检测任务中，模型在测试集上的准确率、特异性、敏感度分别达到99.96%、99.84%和99.99%；在MI定位任务中，准确率、特异性、敏感度分别为99.81%、99.98%和99.65%。检测和定位结果均优于其他几种模型。结论本研究提出的MSF-RB-MCA模型在基于II导联ECG信号的MI检测与定位方面表现出色，展现出其在可穿戴设备领域中的广泛应用前景。

Abstract

Objective We propose a myocardial infarction (MI) detection and localization model for improving the diagnostic accuracy for MI to provide assistance to clinical decision-making. Methods The proposed model was constructed based on multi-scale field residual blocks fusion modified channel attention (MSF-RB-MCA). The model utilizes lead II electrocardiogram (ECG) signals to detect and localize MI, and extracts different levels of feature information through the multi-scale field residual block. A modified channel attention for automatic adjustment of the feature weights was introduced to enhance the model's ability to focus on the MI region, thereby improving the accuracy of MI detection and localization. Results A 5-fold cross-validation test of the model was performed using the publicly available Physikalisch-Technische Bundesanstalt (PTB) dataset. For MI detection, the model achieved an accuracy of 99.96% on the test set with a specificity of 99.84% and a sensitivity of 99.99%. For MI localization, the accuracy, specificity and sensitivity were 99.81%, 99.98% and 99.65%, respectively. The performances of the model for MI detection and localization were superior to those of other comparison models. Conclusion The proposed MSF-RB-MCA model shows excellent performance in AI detection and localization based on lead II ECG signals, demonstrating its great potential for application in wearable devices.

Graphical abstract

关键词

心肌梗死 / 深度学习 / 多尺度 / 残差模块 / 改进通道注意力

Key words

myocardial infarction / deep learning / multi-scale / residual block / modified channel attention

引用本文

引用格式 ▾

吴秋岑,卢学麒,温耀棋,洪永,吴煜良,陈超敏. II导联心电图中心肌梗死检测与定位：基于多尺度残差模块融合改进通道注意力模型[J]. 南方医科大学学报, 2025, 45(08): 1777-1790 DOI:10.12122/j.issn.1673-4254.2025.08.22

登录浏览全文

4963

注册一个新账户忘记密码

根据世界卫生组织（WHO）的数据显示，随着年龄的增长，因心血管疾病（CVD）引发的死亡人数显著上升，其中大多数发生在老年人群中^［1］。心肌梗死（MI）是一种常见且危害性极大的CVD，由于冠状动脉被斑块、白细胞、胆固醇和脂肪等物质的积聚堵塞，导致心肌组织急性缺血性坏死^［2］。MI具有高发病率、高致残率和高病死率等特点，其早期准确诊断对患者的治疗和预后至关重要。

心电图（ECG）作为MI等CVD诊断的金标准工具之一，能够实时、无创地记录心脏电活动，在临床中发挥着不可替代的作用^［3］。MI的主要ECG特征包括ST段抬高、T波尖高或倒置以及病理性Q波的出现等^［4，5］。根据患者的ECG变化情况，医生可以迅速有效地判断MI区域。尽管ECG在MI的诊断中具有诸多优势，但其分析和解读面临挑战：信号复杂性和非平稳性增加了解读难度，易受到主观偏见和人为误差的影响。此外，标准的ECG 通常包括12个导联，包括 I、II、III（标准肢体导联）、V1-V6（胸前导联）以及aVR、aVL、aVF（增强肢体导联）^［6］，医生需要综合分析多导联信号才能做出准确诊断，这在处理长时间监测的动态ECG时更加耗时费力。因此，开发高效、准确的计算机辅助系统用于MI检测和定位，对于疾病的及时诊断和治疗至关重要。

当前用于MI检测和定位的计算机辅助算法主要分为机器学习（ML）和深度学习（DL）方法。传统ML方法通常采用“特征提取+分类器”的两级框架^［7］。在特征提取阶段，常用的技术包括主成分分析^［8］、小波变换^［8，9］和多项式拟合^{［10， 11］}、隐马尔可夫模型^［12］等，它们常用于从ECG信号中提取代表性特征。在分类阶段，常用的技术包括支持向量机^{［13， 14］}、随机森林^［10］、决策树^［13］、k-最近邻^［12］和神经网络^［14］等。尽管这些传统的ML技术在MI检测和定位中已经取得了优异的表现，甚至在某些情况下超过了心脏病专家的水平。然而，其特征提取与分类分离的架构^［15］可能导致信息丢失，且特征提取依赖人工设计^［16］，限制了模型性能和泛化能力。

随着DL的快速发展，卷积神经网络（CNN）和长短期记忆网络（LSTM）等DL模型能够无需人工干预自动提取数据特征^［17］。与传统ML方法不同，DL框架将特征提取和分类集成在一起，简化了分析流程并提高效率^［18］。例如，Acharya等^［2］提出的11层CNN在含噪声和去噪ECG数据上分别取得了93.53%和95.22%的分类准确率。Zhang等^［19］提出结合稀疏自编码器和袋装决策树的DL方法，显著提升了单导联ECG信号中MI的检测与定位。此外，Ahmad等^［20］提出了一种基于图像融合的DL模型，将一维II导联ECG信号转化为二维图像作为分类器输入，在MI检测中表现出优异效果。在上述研究中，均基于II导联ECG信号的DL模型在MI检测和定位中取得了良好的效果，但仍然存在以下几个挑战：特征提取的单尺度限制，现有方法多采用单尺度卷积操作，难以捕捉ECG信号中更为丰富的多尺度特征；不同心跳周期的重要性未区分，传统CNN对输入数据的神经元权重赋予相同的比重，而在实际ECG数据中，不同心跳周期的重要性差异显著，例如QRS波虽然持续时间较短，却包含了大量关键信息，这些特征在现有模型中可能被低估；模型复杂度较高，尽管基于II导联的自动检测和定位模型性能已优于人工分析，但其参数量较大，复杂度较高，识别准确率仍有提升空间。

针对上述存在的问题，本研究提出了一种基于II导联ECG信号的多尺度残差模块融合改进通道注意力模型（MSF-RB-MCA），用于进行MI检测和定位。本文的主要创新概述如下：（1）多尺度特征提取与融合：针对II导联ECG信号，采用不同大小的大核卷积提取多尺度特征，捕获ECG信号中丰富的局部和全局特征，并通过特征融合实现MI的智能检测和精确定位；（2）引入深度可分离卷积：在残差模块中使用深入可分离卷积代替传统卷积，不仅降低了模型参数量，还显著减少了计算开销，同时保持了对MI特征的高效提取能力；（3）嵌入改进的通道注意力：在残差块中集成了改进的通道注意力，以增强模型对ECG信号中关键特征的识别。模块通过动态调整特征图的权重，提高了模型对关键信息的敏感度，并加强了对MI特征区域的识别。

1 材料和方法

本研究的整体流程（图1）可分为4个关键步骤：数据采集、数据预处理、模型构建和模型评估。

1.1 实验数据

本研究采用Physikalisch-Technische Bun-desanstalt （PTB） ECG数据集^［21］进行实验。该数据集包含来自290名受试者的549条ECG记录，其中368条记录来自148例被诊断为MI的患者，另外80条记录来自52例健康对照组（HC）。每人有1~5条记录，每条记录均包含标准的12导联ECG（I、II、III、aVR、aVL、aVF、V1、V2、V3、V4、V5、V6）以及3个Frank导联（Vx、Vy、Vz），采样率为1000 Hz，分辨率为16位，范围为±16.384 mV。大多数ECG记录的持续时间通常为2 min，所有记录的最短时长为30 s。

对于MI患者记录，部分记录提供了MI具体发生位置的标签。据统计，该数据集有10种类型的MI，分别为：前壁心肌梗死（AMI）、前侧壁心肌梗死（ALMI）、前间隔心肌梗死（ASMI）、下壁心肌梗死（IMI）、下侧壁心肌梗死（ILMI）、下后壁心肌梗死（IPMI）、下侧后壁心肌梗死（IPLMI）、侧壁心肌梗死（LMI）、后壁心肌梗死（PMI）和后侧壁心肌梗死（PLMI），具体分类详情（表1）。

本研究重点分析了II导联的ECG信号。因其与心脏传导方向同轴，II导联的波幅最大且波形清晰，是ECG分析中最具诊断价值的导联之一^［18-21］。

1.2 数据预处理

原始ECG信号通常存在不同类型的噪声，例如基线漂移、电源线干扰以及由于肌肉收缩和电极移动引起的高频噪声。这些噪声都可能干扰特征点检测，并对整体检测和定位结果产生显著影响。因此，在进行模型训练之前，对所有原始ECG信号进行预处理至关重要。本研究的预处理主要包括小波去噪、心拍分割和归一化3个步骤。

1.2.1 小波去噪

采用基于离散小波变换的Daubechies6（DB6）小波基函数进行去噪^［22］。去噪前后对比（图2），显示去噪后的ECG信号更加平滑，基线水平一致，有利于后续的R峰定位。

1.2.2 心拍分割

采用Pan-Tompkins算法^{［23，24］}对经过降噪处理的ECG信号进行R峰定位，并展示R波提取的典型实例（图3）。以R峰位置为基准，向前选取250个样本点，向后选取400个样本点，从而构建一个包含651个样本点的单个心拍信号（图4），其中涵盖一个完整的P-QRS-T波形。

经过预处理后得到MI和HC心拍的数据统计（表2）。此外，对MI的记录进行进一步的定位划分，去除无效标签，并根据不同的定位标签对所有MI信号进行统计，最终得出10种类型的MI和HC心拍的统计结果（图5）。

1.2.3 归一化

采用Z-score标准化方法对其进行归一化处理^［25］，旨在解决信号幅度的缩放问题并减少测量误差。归一化后的心拍信号具有统一的均值和标准差，这不仅便于对不同信号进行比较和分析，还能有效提高模型训练的稳定性和检测性能^［26］。Z-score标准化的计算公式如式（1）：

Z =

x - μ δ

（1）

其中

x

为原始信号，

μ

为原始信号的平均值；

δ

为原始信号的标准差；

Z

为原始信号经过归一化处理后的数据。

归一化处理后的ECG数据输入到模型中，以实现对MI的自动检测与定位。

1.3 融合分类器

构建名为MSF-RB-MCA的集成网络模型（图6）。该模型主要由多尺度感受野（MSF）模块构成，每个分支主要由残差块（RB）和改良的通道注意力（MCA）组成。ECG信号首先通过顶部的卷积层进行通道扩展，随后将扩展后的特征信息分别输入到3个分支进行特征提取。最后，将各分支提取的特征进行融合，并通过包含Flatten层、Dropout层和全连接层（FC）的分类模块，实现对MI的检测与定位。模型的具体参数设置（表3）。

1.3.1 多尺度感受野模块

对于深度神经网络，提升性能的直接方法是增加网络宽度，即增加每层的通道数。然而，这种方法会导致网络参数量和计算成本显著增加，易引发过拟合，并显著增加计算成本。针对这一问题，本研究设计了MSF模块（图7）。通过1×11、1×13、1×15这3种不同尺度的大核卷积提取多尺度特征，充分捕获ECG信号中的丰富信息。较大的卷积核能够扩展感受野，从而捕捉ECG信号中的更长时间模式^{［27，28］}。此外，为了降低模型的参数量和计算成本，本研究采用深度可分离卷积（DS Conv）^［29］，将传统卷积分解为深度卷积（DW Conv）和逐点卷积（PW Conv）（图8）。DW Conv对输入的每个通道分别应用卷积操作，之后紧接着一个批量归一化（BN）层和一个ReLU激活函数。PW Conv是组合由深度卷积产生的特征，将它们映射到新的空间中。与DW Conv类似，PW Conv也包括BN层和ReLU激活函数。与传统卷积相比^［30］（图9），DS Conv通过将卷积操作分离为深度和逐点两个独立的步骤，显著减少了模型参数的数量，这使得模型更加轻量，便于在资源有限的设备上部署。

1.3.2 残差模块

在深度神经网络中，为了提升模型性能，增加网络的深度也是常见策略。然而，随着网络层数的不断增加，训练过程中会遇到一系列问题，例如梯度消失或梯度爆炸，这会导致网络在反向传播过程中难以收敛或模型变得不稳定。此外，随着层数增加，模型的参数量也会迅速膨胀，增加了训练的计算复杂度以及过拟合的风险。因此，优化深层神经网络结构成为研究者关注的重点之一。

为解决这些问题，本研究引入RB^［31］对模型进行优化。标准的RB是由2个卷积层和1个残差连接（RC）组成的一种特殊设计（图10）。具体的计算公式如式（2）、式（3）和式（4）：

y l = f R e L U C o n v x

（2）

y l + 1 =

Conv

y l

（3）

Output

= f R e L U x + y l + 1

（4）

其中，

y

为特定层的输出，

f R e L U

为激活函数，

x

为RB的输入，Conv为卷积运算，Output为RB的输出。

RB的核心优势在于其RC的设计，它允许模型直接将前一层的输出加到后一层的输入上。这种连接方式不仅有助于模型学习更深层次和复杂的特征，还能有效提升模型的性能。通过这种方式，RB有助于缓解梯度消失问题，使得深层网络的训练变得更加有效和稳定。

RB被广泛应用于ECG中，通过在不同层之间加入RC来解决梯度问题并保持信息完整性^［32］。本研究设计的MSF模块包含3个分支（图5），每个分支由四RB和4个MCA组成，每个RB包括2个DS Conv层、2个BN层和2个ReLU激活函数。MSF模块的3个分支具体参数设置（表4）。

1.3.3 注意力机制

注意力机制是一种嵌入DL模型的特殊结构，类似于人类的视觉注意功能。它通过模仿人类集中注意力于关键信息的能力，帮助模型聚焦于重要信息并过滤掉无关噪声，从而提升模型的特征提取能力和任务性能。在分类、分割等任务中，注意力机制已被广泛应用并证实能显著提升模型的表现。其核心原理是根据输入数据的重要性动态分配权重，强化关键信息的表达，同时削弱无用信息，提高特征的质量和分类的准确性。

通道注意力（CA）模块被广泛应用于轻量级卷积神经网络中，能够显著提升网络性能^［33］。与SENet^［34］和CBAM^［35］相比，CA模块在捕捉分类标签与特征图位置的关联性方面表现更为优越。CA模块利用全局平均池化和全局最大池化提取特征图的全局统计信息（图11A），从而生成权重分布。然而，这些传统池化方法在面对噪声时存在一定局限性。尤其是经过预处理去噪的ECG信号中，若仍存在残留噪声，可能会对特征提取的准确性造成影响。

为增强CA模块对噪声的鲁棒性，我们在原有架构中引入中值池化操作（图11B）。结合全局平均池化、全局最大池化和中值池化，改进后的CA模块能够更有效地应对噪声干扰。中值池化对异常值具有良好的抑制能力，能显著提高特征提取的质量，从而增强模型的整体性能。实验结果表明，引入中值池化后的CA模块在处理噪声数据时表现出更高的鲁棒性，进一步优化了模型的分类精度和稳定性。

尽管中值池化增强了CA模块的特征提取能力，但通道之间的信息混合仍可能不足，限制了特征表达的丰富性，无法充分发挥注意力机制的潜力。为解决这一问题，本研究进一步在改进后的CA模块中引入了通道洗牌操作（图11B）。将特征图划分为若干组，对分组后的特征图进行通道重新排列，通过打乱组内通道顺序并恢复至原始形状，促使不同通道间的信息交互更充分。通道洗牌操作有效增强了特征表达能力，有助于进一步提升模型的整体性能。

经过2次优化后的CA模块在特征提取质量和噪声鲁棒性方面表现显著提升，相较于原始CA模块，其对模型整体性能的提升尤为突出。这些改进为模型在ECG信号处理任务中提供了更为可靠的技术支持。

两次改进CＡ模块的具体过程如下：

（1）池化操作：给定一个特征

F ∈ R H × W × C

，为了有效的获取空间上的更全面的全局信息表示，改进后的CA同时使用了全局最大池化、全局中值池化和全局平均池化，分别得到

F m a x c ∈ R 1 × 1 × C

、

F m d e c ∈ R 1 × 1 × C

、

F a v g c ∈ R 1 × 1 × C

，具体的计算公式如式（5）、式（6）和式（7）：

F m a x c = M a x P o o l F

（5）

F m e d c = M e d P o o l F

（6）

F a v g c = A v g P o o l F

（7）

（2）共享MLP处理：将每个池化结果通过一个共享的多层感知器（MLP），MLP由Conv-ReLU-Conv构成，分别获得

M a x c ∈ R 1 × 1 × C

、

M e d c ∈ R 1 × 1 × C

和

A v g c ∈ R 1 × 1 × C

，具体的计算公式如式（8）、式（9）和式（10）：

M a x c = M L P F m a x c

（8）

M e d c = M L P F m e d c

（9）

A v g c = M L P F A v g c

（10）

（3）融合池化结果：将3个池化结果进行求和，通过sigmoid函数来获得注意力权重表示

M c

，具体的计算公式如式（11）：

M c = s i g m o i d A v g c + M e d c + A v g c

（11）

（4）加权输入特征图：将通道注意力权重

M c

与原始输入特征

F ∈ R H × W × C

进行元素级相乘，得到加权后的特征，具体的计算公式如式（12）：

F ‘ = M c ⊙ F

（12）

其中，⊙ 表示元素级相乘。

（5）通道洗牌：为了进一步混合和共享信息，应用通道洗牌操作。增强后的特征图被分成一定数量的组。对分组后的特征图进行转置操作，打乱各组内的通道顺序。随后，将打乱后的特征图恢复为原始形状C×H×W。这种方式能够更好地混合特征信息，增强特征表达能力，具体的计算公式如式（13）：

F s h u f f l e = C h a n n e l S h u f f l e F ’

（13）

其中，

F s h u f f l e

是混洗后的特征图，

F ’

是输入特征图。

1.3.4 多分支特征融合

采用GAP层来处理来自3个分支的特征信息。每个分支经过GAP层处理后，其输出特征向量表示为

x G A P i

（

i = 1,2, 3

）。这些特征向量通过一下公式进行拼接操作，具体的计算公式如式（14）：

Y = F c o n x G A P 1, C A P 2, G A P 3

（14）

其中，

F c o n

表示拼接操作，

Y

表示拼接后的特征信息。完成特征融合后，最后通过包含Flatten层、Dropout层和FC层的分类模块，实现对MI的检测与定位。

1.4 模型训练

本研究在MI检测和定位实验中使用相同的深度学习模型，使用PyTorch框架进行网络搭建。实验运行环境为Windows 10系统，内存32 GB，处理器为Intel i7-10700K，显卡为NVIDIA Geforce RTX 2080Ti。

针对MI的检测与定位问题，为了提升网络性能，本研究采用交叉熵损失函数计算损失，并使用Adam自适应优化器优化模型参数。具体设置为：批量大小为32，动量常数为0.937，初始学习率为0.001，权重衰减系数为0.0005。整个训练过程进行了60轮迭代。数据集按照6∶2∶2的比例分层采样（图12），划分为训练集、验证集和测试集，图中展示了心拍数据的分配情况。

为了进一步提升模型的稳健性和评估精度，本研究在训练集中引入5折交叉验证策略。在每次迭代中记录模型的性能指标，并将5次迭代的结果取平均值，作为模型整体性能的最终评估。

1.5 模型评估

为全面评估模型在测试数据上的性能，本文选用多种评价指标，包括准确度（Acc）、精密度（Pre）、灵敏度（Sen）、特异性（Spe）以及F1分数（F1）。这些指标可以从多个角度衡量模型的分类能力，确保评估结果的科学性和全面性。具体的计算公式如式（15）、式（16）、式（17）、式（18）和式（19）：

A c c = T P + T N T P + F N + T N + F P × 100 %

（15）

P r e = T P T P + F P × 100 %

（16）

S p e = T N T N + F P × 100 %

（17）

S e n = T P T P + F N × 100 %

（18）

F 1 = 2 * S E N * P R E S E N + P R E × 100 %

（19）

其中，真阳性（TP）表示被正确预测为MI的样本数量，真阴性（TN）表示被正确预测为HC的样本数量，假阳性（FP）表示HC被误预测为MI的样本数量，假阴性（FN）表示MI被误预测为HC的样本数量。

2 结果

2.1 多尺度卷积核大小对实验的影响

一维卷积层在提取ECG信号特征方面表现优异，而卷积核的大小直接影响模型的分类性能。本研究针对模型中3个并行卷积分支的卷积核大小，系统研究其对MI检测与定位性能的影响。将3个并行卷积分支的卷积核大小分别设置为1×3、1×5、1×7，逐步增加2直至达到1×15、1×17和1×19，并比较不同设置下模型的性能（表5）。实验数据显示，当3个并行卷积核的大小分别设置为1×11、1×13和1×15时，模型在MI检测和定位任务中的准确率达到最高值。

不同大小的卷积核对特征提取的侧重点各有不同。较小的卷积核更擅长提取局部细节信息，而较大的卷积核能够捕获更广泛的全局特征。然而，过大的卷积核可能导致局部细节丢失，而过小的卷积核可能无法充分捕获全局信息。通过组合1×11、1×13和1×15这3种卷积核大小，不同分支可以在局部与全局特征之间形成良好的互补，从而提升模型的特征提取能力和分类性能。因此，本研究最终选择将卷积分支的卷积核大小设置为1×11、1×13和1×15。

2.2 心肌梗死检测

MI检测是为了分出HC和患有MI的患者两大类别。进行5折交叉验证（表6），在每一折中，模型的准确率均超过99.93%，平均准确率达到了99.96%。此外，模型的平均准确率、平均特异度、平均灵敏度、平均精确率和平均F1评分分别为99.96%、99.84%、99.99%、99.97%和99.98%。

在5折交叉验证中，第一折（Fold 1）实验获得最佳的MI检测结果。采用t-SNE^［36］可视化方法对Fold 1分类任务进行可视化（图13），结果显示，两类特征点之间存在明显的分类边界，模型能够准确提取HC和MI的特征，实现有效区分。

MI检测的混淆矩阵及性能结果（表7）。数据集包含59588个样本，其中49 172个MI样本被正确识别，显示出接近100%的平均灵敏度和较低的漏诊率。在10 409个HC样本中，有10 392个被准确识别，仅有17个被错误地分类为MI。

2.3 心肌梗死定位

MI定位任务需要针对不同MI患者的发病部位进行精确定位，是一个多分类问题。列出使用5折交叉验证得到的MI定位分类结果（表8），5折交叉验证的平均准确率、平均特异度、平均灵敏度、平均精确率和平均F1评分分别为99.81%、99.98%、99.65%、99.86%和99.75%，每一折的准确率都在99%以上，5折交叉验证的结果差异也较小。

在5折交叉验证的MI定位实验中，第一折（Fold 1）取得了最佳结果。类似于MI检测的可视化分析，这里同样采用了t-SNE^［36］可视化方法对Fold 1分类任务进行可视化（图14），图中不同类别的特征点分布清晰分离，并且呈现出明显的分类边界。模型在MI定位任务中可以有效提取区分不同类别的特征，充分展现其对特征空间的良好学习能力。

在5折交叉验证中，MI定位的混淆矩阵结果和性能（表9、10）。混淆矩阵中，对角线元素的值越大，表示网络模型的分类性能越优越。结果显示，对于所有的MI心拍，只有7个被识别为HC，而所有类型的MI和HC的心电心拍，模型定位的准确率都在99%以上，并且在LMI和PMI类型上能够达到100%的准确率，验证了该模型定位的有效性。

2.4 消融实验

设计并比较以下4种模型：（1）Baseline模型：从MSF-RB-MCA模型中去除RB模块的RC和MCA模块，将这一模型记为“Baseline”模型；（2）Baseline-RB模型：在Baseline模型中加入RC，记为“Baseline-RB”模型；（3）Baseline-MCA模型：在Baseline模型中加入MCA模块，记为“Baseline-MCA”模型；（4）本研究提出的MSF-RB-MCA模型：在Baseline模型中同时加入了MCA模块和RC。

在消融实验中，除了模型结构外，其他实验设置，包括数据集、损失函数、优化器等，均保持一致（图15）。

Baseline模型在MI检测和定位任务中的初始准确率仅为97.50%和96.96%（图15）。当Baseline模型引入RC后，MI检测和定位的准确率分别提升至98.69%和98.53%；当Baseline模型融入MCA模块后，MI检测和定位的准确率分别提高至99.42%和99.34%。此外，当Baseline模型同时融合RC和MCA模块时，MI检测和定位的准确率显著提升至99.96%和99.81%。

2.5 MSF-RB-MCA模型复杂度实验

实验分别针对检测和定位两种任务进行评估，并最终取其平均值作为结果。在相同的实验条件下，将MSF-RB-MCA与2种先进模型进行对比，结果显示，MSF-RB-MCA模型的参数量、复杂度以及每个心拍的平均测试时间均优于其他对比模型（表11）。

2.6 不同注意力机制对实验的影响

将SENet、CBAM和CA 3种额外的注意力机制集成到模型中，分别记为“MSF-RB-SENet”、“MSF-RB-CBAM”和“MSF-RB-CA”，并在相同条件下进行训练。在测试集上的分类准确率进行比较，结果显示，嵌入MCA注意力机制的模型在测试集上的准确率优于其他3种模型（表12）。

2.7 对比实验

对比实验中所列举的模型均基于PTB数据集的II导联信号开展研究，并使用相同的数据集划分比例和相同的损失函数进行训练和测试，以保证实验结果可比性。本文提出的MSF-RB-MCA模型在MI检测和定位的准确率上均优于上述其他5种模型（表13）。本研究提出的模型能够识别的MI部位种类达到10类，涵盖了PTB数据集中MI病例的所有种类。

3 讨论

MI的早期诊断对挽救生命和确保患者及时接受治疗具有关键意义。作为诊断心脏电活动异常的主要工具，ECG能够直观地反映心脏活动的变化。然而，仅依赖人工对ECG信号进行视觉评估不仅耗时，而且面临较大的挑战。因此，在临床环境中引入计算机辅助诊断系统，不仅能够实现MI的快速诊断，还能够提供客观、可靠的结果，这具有重要的临床价值。

本研究提出了一种创新的集成模型——MSF-RB-MCA，该模型基于多尺度残差模块并融合了改进通道注意力，旨在实现MI的自动检测与精准定位。研究以PTB数据集中的II导联ECG信号为对象，通过信号预处理将原始信号分解为单个心拍信号，并采用MSF模块提取不同层次的特征信息。在MSF模块中引入DS Conv代替传统卷积操作，显著减少了模型参数量和计算复杂度，有效提升了模型的推理效率，为其在嵌入式设备和可穿戴设备中的部署应用提供了可能。我们在MSF模块中还引入了RC，防止关键信息丢失，有助于缓解梯度消失问题，提升模型的稳定性。此外，在RC后集成MCA机制，使模型能够动态调整特征权重，突出关键特征，增强对MI区域的关注能力，从而实现对ECG信号中异常区域的精准检测与定位。为确保MSF-RB-MCA模型的泛化能力，采用5折交叉验证方法，有效防止过拟合。本实验探讨了不同卷积核大小对模型性能的影响，实验结果表明，当多尺度卷积核大小设置为1×11、1×13和1×15时，模型性能达到最佳。此外，本研究设计了消融实验以评估MCA模块和RC结构对整体模型性能的具体贡献，并对不同注意力机制的效果进行对比分析。实验结果显示，引入RC与MCA模块虽略微增加了模型参数量，但对MI检测与定位任务的性能提升显著，尤其是在准确率方面表现尤为突出。最终，模型在MI检测和定位任务中的准确率分别达到99.96%和99.81%，充分验证了所提出模块设计在提升模型性能方面的有效性和实用价值。

与现有方法相比，MSF-RB-MCA模型在MI检测与定位的准确率上表现出显著优势。当前，大多数研究存在依赖多层传统CNN进行特征提取、仅基于单尺度提取特征以及对ECG信号的每个片段赋予相等权重等问题。这些方法尽管能够有效提取某些特征，但往往伴随着参数量大、过拟合风险高以及模型性能受限的不足。例如，Acharya等^［2］提出了一种基于11层CNN的模型，利用PTB数据集的II导联信号进行MI检测，在含噪和去噪的ECG数据上分别取得了93.53%和95.22%的平均分类准确率。然而，该方法对ECG信号的每个波段赋予了相同权重，未能充分挖掘信号中不同区域的重要性，尤其是对QRS复合波段这一关键区域的特征贡献关注不足。其单尺度特征提取策略难以捕获心电信号中的多尺度、多层次复杂信息。Feng等^［33］提出了一种结合16层CNN和LSTM的多通道自动分类算法，使用PTB数据集的II导联信号进行MI检测，并取得了95.4%的分类准确率。尽管该研究通过引入多通道输入方法增强了模型性能，但分类准确率仍未达到临床应用的高标准。该方法未充分考虑ECG信号中不同区域的重要性差异，导致关键特征的提取能力不足。相比之下，本文提出的MSF-RB-MCA模型，通过多尺度残差网络进行特征提取，并融合了MCA，使模型能够聚焦于ECG波形中具有诊断意义的关键特征。同时，采用DS Conv替代传统卷积操作，可显著降低模型的参数量与计算复杂度，有效提升整体运算效率。该模型不仅显著提高了MI检测与定位的准确率，还可有效防止过拟合，并大幅降低计算成本，展现出卓越的诊断性能和实用价值。

为评估MSF-RB-MCA模型在实际临床环境中的应用潜力，本研究进行了模型复杂度对比实验，MSF-RB-MCA模型的参数量、复杂度以及每个心拍的平均测试时间分别为2.70 M、36.68 M和0.62 ms，这3项指标均优于其他对比模型，在计算资源与模型效果之间达成了良好的平衡，展现出其在可穿戴设备领域中的潜在应用价值。

基于现有研究基础，未来将从以下方面进行深入研究：（1）便携式健康监测设备：进一步优化模型并将其部署于可穿戴设备中，为患者提供便捷的实时MI检测服务，帮助医生实时掌握患者的健康状态；（2）模型优化策略：实施额外的策略（例如，剪枝压缩、硬件加速等），以进一步优化模型，减轻在资源受限环境中与模型部署相关的挑战；（3）多导联信号与临床信息融合：本研究仅关注II导联ECG信号，未来将探索其他导联信号，并结合临床信息（如性别、年龄等），使模型能够捕获MI的多个维度，从而提高决策效率；（4）标准化ECG信号预处理与数据平台：建立统一的ECG信号预处理标准和数据平台至关重要，整合来自不同地区、不同设备及不同采集环境的多源MI数据，以进行全面的模型训练与评估，从而提升模型在不同数据集上的泛化能力和适用性。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	World Health Organization. Cardiovascular diseases (CVDs)[EB/OL]. [2021-12-26]. doi：10.1002/9781118910573.ch5

[2]	Acharya UR, Fujita H, Oh SL, et al. Application of deep convolutional neural network for automated detection of myocardial infarction using ECG signals[J]. Inf Sci, 2017, 415: 190-8. doi：10.1016/j.ins.2017.06.027

[3]	Cho Y, Kwon JM, Kim KH, et al. Artificial intelligence algorithm for detecting myocardial infarction using six-lead electrocardiography[J]. Sci Rep, 2020, 10(1): 20495. doi：10.1038/s41598-020-77599-6

[4]	Xiong P, Lee SM, Chan G. Deep learning for detecting and locating myocardial infarction by electrocardiogram: a literature review[J]. Front Cardiovasc Med, 2022, 9: 860032. doi：10.3389/fcvm.2022.860032

[5]	Jian JZ, Ger TR, Lai HH, et al. Detection of myocardial infarction using ECG and multi-scale feature concatenate[J]. Sensors: Basel, 2021, 21(5): 1906. doi：10.3390/s21051906

[6]	Liu XW, Wang H, Li ZJ, et al. Deep learning in ECG diagnosis: a review[J]. Knowl Based Syst, 2021, 227: 107187. doi：10.1016/j.knosys.2021.107187

[7]	Cai JX, Sun WW, Guan JF, et al. Multi-ECGNet for ECG arrythmia multi-label classification[J]. IEEE Access, 2020, 8: 110848-58. doi：10.1109/access.2020.3001284

[8]	Bhaskar NA. Performance analysis of support vector machine and neural networks in detection of myocardial infarction[J]. Procedia Comput Sci, 2015, 46: 20-30. doi：10.1016/j.procs.2015.01.043

[9]	Al-Naima FM, Ali AH, Mahdi SS. Data acquisition for myocardial infarction classification based on wavelets and Neural Networks[C]//2008 5th International Multi-Conference on Systems, Signals and Devices. July 20-22, 2008. Amman. IEEE, 2008: 1-6. doi：10.1109/ssd.2008.4632817

[10]	Sun L, Lu Y, Yang K, et al. ECG analysis using multiple instance learning for myocardial infarction detection[J]. IEEE Trans Biomed Eng, 2012, 59(12): 3348-56. doi：10.1109/tbme.2012.2213597

[11]	Liu B, Liu JK, Wang GQ, et al. A novel electrocardiogram parameterization algorithm and its application in myocardial infarction detection[J]. Comput Biol Med, 2015, 61: 178-84. doi：10.1016/j.compbiomed.2014.08.010

[12]	Chang PC, Lin JJ, Hsieh JC, et al. Myocardial infarction classification with multi-lead ECG using hidden Markov models and Gaussian mixture models[J]. Appl Soft Comput, 2012, 12(10): 3165-75. doi：10.1016/j.asoc.2012.06.004

[13]	Cao D, Lin D, Lv Y. ECG codebook model for Myocardial Infarction detection[C]//2014 10th International Conference on Natural Computation (ICNC). IEEE, 2014: 797-801. doi：10.1109/icnc.2014.6975939

[14]	Lu HL, Ong K, Chia P. An automated ECG classification system based on a neuro-fuzzy system[C]//Computers in Cardiology 2000. Vol.27 (Cat. 00CH37163). Cambridge, MA, USA. IEEE, 2000: 387-390.

[15]	Zhang DD, Yang S, Yuan XH, et al. Interpretable deep learning for automatic diagnosis of 12-lead electrocardiogram[J]. iScience, 2021, 24(4): 102373. doi：10.1016/j.isci.2021.102373

[16]	Jun TJ, Nguyen HM, Kang D, et al. ECG arrhythmia classification using a 2-D convolutional neural network[EB/OL]. 2018: 1804.06812. doi：10.48550/arXiv.1804.06812

[17]	Kiranyaz S, Ince T, Gabbouj M. Real-time patient-specific ECG classification by 1-D convolutional neural networks[J]. IEEE Trans Biomed Eng, 2016, 63(3): 664-75. doi：10.1109/tbme.2015.2468589

[18]	Al Rahhal MM, Bazi Y, Almubarak H, et al. Dense convolutional networks with focal loss and image generation for electrocardiogram classification[J]. IEEE Access, 2019, 7: 182225-37. doi：10.1109/access.2019.2960116

[19]	Zhang JS, Lin F, Xiong P, et al. Automated detection and localization of myocardial infarction with Staked sparse autoencoder and TreeBagger[J]. IEEE Access, 2019, 7: 70634-42. doi：10.1109/access.2019.2919068

[20]	Ahmad Z, Tabassum A, Guan L, et al. ECG heartbeat classification using multimodal fusion[J]. IEEE Access, 2021, 9: 100615-26. doi：10.1109/access.2021.3097614

[21]	Goldberger AL, Amaral LA, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation, 2000, 101(23): E215-20. doi：10.1161/01.cir.101.23.e215

[22]	Singh BN, Tiwari AK. Optimal selection of wavelet basis function applied to ECG signal denoising[J]. Digit Signal Process, 2006, 16(3): 275-87. doi：10.1016/j.dsp.2005.12.003

[23]	Pan JP, Tompkins WJ. A real-time QRS detection algorithm[J]. IEEE Trans Biomed Eng, 1985, BME-32(3): 230-6. doi：10.1109/tbme.1985.325532

[24]	Miotto R, Wang F, Wang S, et al. Deep learning for healthcare: review, opportunities and challenges[J]. Brief Bioinform, 2018, 19(6): 1236-46. doi：10.1093/bib/bbx044

[25]	Fei NY, Gao YZ, Lu ZW, et al. Z-score normalization, hubness, and few-shot learning[C]//2021 IEEE/CVF International Conference on Computer Vision (ICCV). October 10-17, 2021. Montreal, QC, Canada. IEEE, 2021: 142-151. doi：10.1109/iccv48922.2021.00021

[26]	Zhang X, Lin MJ, Hong Y, et al. MSFT: a multi-scale feature-based transformer model for arrhythmia classification[J]. Biomed Signal Process Control, 2025, 100: 106968. doi：10.1016/j.bspc.2024.106968

[27]	Le KH, Pham HH, Nguyen TBT, et al. LightX3ECG: a lightweight and eXplainable deep learning system for 3-lead electrocardiogram classification[J]. Biomed Signal Process Control, 2023, 85: 104963. doi：10.1016/j.bspc.2023.104963

[28]	Cheng JY, Zou QX, Zhao YX. ECG signal classification based on deep CNN and BiLSTM[J]. BMC Med Inform Decis Mak, 2021, 21(1): 365. doi：10.1186/s12911-021-01736-y

[29]	Sandler M, Howard A, Zhu ML, et al. MobileNetV2: inverted residuals and linear bottlenecks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. June 18-23, 2018. Salt Lake City, UT. IEEE, 2018: 4510-4520. doi：10.1109/cvpr.2018.00474

[30]	Kattenborn T, Leitloff J, Schiefer F, et al. Review on Convolutional Neural Networks (CNN) in vegetation remote sensing[J]. ISPRS J Photogramm Remote Sens, 2021, 173: 24-49. doi：10.1016/j.isprsjprs.2020.12.010

[31]	Targ S, Almeida D, Lyman K. Resnet in resnet: generalizing residual architectures[EB/OL]. 2016: 1603.08029.

[32]	He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 27-30, 2016. Las Vegas, NV, USA. IEEE, 2016: 770-778. doi：10.1109/cvpr.2016.90

[33]	Hou QB, Zhou DQ, Feng JS. Coordinate attention for efficient mobile network design[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). June 20-25, 2021. Nashville, TN, USA. IEEE, 2021: 13708-13717. doi：10.1109/cvpr46437.2021.01350

[34]	Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. June 18-23, 2018. Salt Lake City, UT. IEEE, 2018: 7132-7141. doi：10.1109/cvpr.2018.00745

[35]	Woo S, Park J, Lee JY, et al. CBAM: convolutional block attention module[C]//Computer Vision – ECCV 2018. Cham: Springer, 2018: 3-19. doi：10.1007/978-3-030-01234-2_1

[36]	Van der Maaten L, Hinton G. Visualizing data using t-SNE[J]. J Machine Learning Res, 2008, 9(11)：1305-12.

[37]	Feng K, Pi XT, Liu HY, et al. Myocardial infarction classification based on convolutional neural network and recurrent neural network[J]. Appl Sci, 2019, 9(9): 1879. doi：10.3390/app9091879