基于深度可分离卷积与注意力机制的单导联心房颤动轻量级分类网络

洪永 ,  张鑫 ,  林铭俊 ,  吴秋岑 ,  陈超敏

南方医科大学学报 ›› 2025, Vol. 45 ›› Issue (03) : 650 -660.

PDF (1687KB)
南方医科大学学报 ›› 2025, Vol. 45 ›› Issue (03) : 650 -660. DOI: 10.12122/j.issn.1673-4254.2025.03.23

基于深度可分离卷积与注意力机制的单导联心房颤动轻量级分类网络

作者信息 +

A lightweight classification network for single-lead atrial fibrillation based on depthwise separable convolution and attention mechanism

Author information +
文章历史 +
PDF (1726K)

摘要

目的 设计一个深度学习模型,实现模型复杂度和模型性能的平衡,以便于集成到可穿戴心电监护设备上,实现本地的房颤自动诊断。 方法 从公开数据集LTAFDB、AFDB和NSRDB上分别收集了84例、25例房颤患者和18例无明显心律失常受试者的数据进行实验和测试。提出了一个基于深度可分离卷积并融合通道空间信息的轻量级注意网络—DSC-AttNet,引入深度可分离卷积代替标准卷积,降低模型参数量和计算量,实现模型的高效和轻量化;并嵌入多层混合注意力机制以在不同尺度上计算通道信息和空间信息的注意权重,提高模型的特征表达能力。在LTAFDB上进行十折交叉验证,并在AFDB和NSRDB上进行外部独立测试。 结果 DSC-AttNet在测试集上的十折平均准确率达到97.33%,精确率达到97.30%,均优于其他4个对比模型以及3个经典模型。模型在外部测试集上的准确率分别达到92.78%和99.97%,优于3个经典模型。且DSC-AttNet的参数量为1.01M,计算量为27.19 G,小于3个经典模型。 结论 该房颤分类方法具有较小的复杂度,达到了更好的分类性能,并且泛化能力较好,具有良好的临床应用前景和推广能力。

Abstract

Objective To design a deep learning model that balances model complexity and performance to enable its integration into wearable ECG monitoring devices for automated diagnosis of atrial fibrillation. Methods This study was performed based on data from 84 patients with atrial fibrillation, 25 patients with atrial fibrillation, and 18 subjects without obvious arrhythmia collected from the publicly available datasets LTAFDB, AFDB, and NSRDB, respectively. A lightweight attention network based on depthwise separable convolution and fusion of channel-spatial information, namely DSC-AttNet, was proposed. Depthwise separable convolution was introduced to replace standard convolution and reduce model parameters and computational complexity to realize high efficiency and light weight of the model. The multilayer hybrid attention mechanism was embedded to compute the attentional weights of the channels and spatial information at different scales to improve the feature expression ability of the model. Ten-fold cross-validation was performed on LTAFDB, and external independent testing was conducted on AFDB and NSRDB datasets. Results DSC-AttNet achieved a ten-fold average accuracy of 97.33% and a precision of 97.30% on the test set, both of which outperformed the other 4 comparison models as well as the 3 classical models. The accuracy of the model on the external test set reached 92.78%, better than those of the 3 classical models. The number of parameters of DSC-AttNet was 1.01M, and the computational volume was 27.19G, both smaller than the 3 classical models. Conclusion This proposed method has a smaller complexity, achieves better classification performance, and has a better generalization ability for atrial fibrillation classification.

Graphical abstract

关键词

心电图 / 心房颤动 / 卷积块注意模块 / MobileNet / 轻量级卷积神经网络

Key words

electrocardiogram / atrial fibrillation / convolutional block attention module / MobileNet / lightweight convolutional neural network

引用本文

引用格式 ▾
洪永,张鑫,林铭俊,吴秋岑,陈超敏. 基于深度可分离卷积与注意力机制的单导联心房颤动轻量级分类网络[J]. 南方医科大学学报, 2025, 45(03): 650-660 DOI:10.12122/j.issn.1673-4254.2025.03.23

登录浏览全文

4963

注册一个新账户 忘记密码

心房颤动(AF)是一种常见的快速性心律失常,是缺血性卒中的重要病因。2022年湖北省人民医院率领中国房颤中心联盟单位完成的一项流行病学调查发现,我国成人房颤标准化患病率为1.6%,并存在显著的地域差异1。房颤的患病率与年龄正相关,年龄越大,患病率越高,且全球各国的各项房颤流行病学发现,房颤患病率及发病率存在显著增加趋势。在智慧时代的发展趋势下,单导联心电图逐渐成为房颤筛查的首选工具23,可以对心电信号进行持续数天的长程监测,所以对房颤检测有较高的灵敏度和特异性。但持续数天的心电监测产生的心电数据长达24~168 h,甚至更久,人工诊断要花费成倍的时间去分析,这不仅效率低还容易出错。所以越来越多的计算机自动辅助诊断算法应用于长程心电图的自动分析,可以辅助医生进行疾病诊断,提高工作效率。
基于心电图的房颤自动诊断方法是基于人工智能技术实现的,包括机器学习方法和深度学习方法。在过去几十年里,人们使用小波变换45、波形形态特征和R-R间期变异性分析67、熵值计算89等方法提取手工特征,并基于支持向量机1011、决策树12、随机森林13、线性判别分析分类器14、径向基函数15、聚类16等机器学习算法训练出模型,用于房颤的自动诊断。但机器学习方法依赖于领域专业知识来设计手工特征,其优化特征表示的过程比较耗时耗力,且其较适合在中小规模数据集上进行模型拟合,对于大规模数据集,在算法的计算方面和存储需求方面存在困难。
近年来,深度学习方法具备处理和学习大规模数据集的能力,能够直接从原始数据中进行特征提取并学习。基础的卷积神经网络和循环神经网络及其变体广泛应用于疾病诊断,Pourbabaee 等17将深度 CNN 应用于原始心电图时间序列信号,仅使用一个全连接层学习时域中的代表性特征。Faust等18提取RR间隔信号,应用长短期记忆网络进行AF的自动检测。而卷积神经网络和循环神经网络的混合架构表现出更好的效果,Kumar等19提出了一个包含卷积和循环神经网络的深度学习模型,该模型分析了心电图数据的时间和形态学特征,以区分心房颤动与正常窦性心律。注意力机制的发展应用,让网络的效果进一步提高。Laghari等20提出密集网络结合双向递归神经网络,从心电数据中自动检测AF,联合注意机制提取重要特征。由于循环神经网络会对序列的每一个点的嵌入进行隐藏层的计算,当序列较长、嵌入维度高的情况下,循环神经网络会带来很大的参数量和计算量,在实际应用中会对设备的存储和计算有较高的需求。此外,为了降低深度学习算法的计算成本,在计算机视觉领域,轻量级卷积神经网络被提出来并有了成熟的发展,已经表现出良好的性能,如SqueezeNet21、MobileNet22等。Li等23的研究应用了MobileNet网络的深度可分离卷积模块设计了一个轻量级模型,用两个不同结构的网络通道进行特征提取,并采用交叉引导机制融合两个通道的特征,对心房颤动和正常窦性心律进行分类。网络虽然轻量了,但其分类性能和泛化能力未达到较高的标准。
针对上述问题,本文设计了一个基于深度可分离卷积并融合通道空间信息的轻量级模型。以一维心电信号为输入,堆叠深度可分离卷积模块以提取心电信号的局部特征,嵌入混合注意力机制,充分利用空间注意和通道注意来推断中间特征图的空间点和通道相关性特征的重要性。最后,经过一个全局注意力模块,增强重要的特征,抑制不相关的特征。本文所提出的模型实现了模型更轻量并且分类性能和泛化能力更高的效果。

1 材料和方法

1.1 实验数据集

为了评估所提出的方法,本研究使用了3个公开的心电数据集,分别是长期房颤数据集(LTAFDB)24、MIT-BIH房颤数据集(AFDB)25和MIT-BIH正常窦性心律数据集(NSRDB)26,其中LTAFDB数据集用于训练、验证和测试,AFDB、NSRDB数据集用于外部独立测试,来评估模型的泛化性能。数据集可以从PhysioNet网站26获得,这些数据集的详情如下:

LTAFDB:该数据集包含来自84名阵发性或持续性房颤受试者的84个长期ECG记录,所有记录由双通道ECG信号组成,在128 Hz下以12位分辨率在20 mV范围内进行数字化。记录的持续时间各不相同,通常为24~25 h;)AFDB:该数据集包括25个不同AF患者的长期心电图记录,每个记录持续10 h,包含两个ECG信号通道,采样率为每秒250个样本。节奏注释文件和节拍注释文件分别提供。其中有2个记录缺乏心电图数据,因此排除在研究之外;NSRDB:该数据库提供了18例无明显心律失常受试者的长期心电图记录,每个记录持续25h左右,包括两个信号通道,采样率为128Hz。

1.2 数据预处理

从数据集中提取单导联的心电信号,并进行滤波、裁剪、噪声段筛查、标签设置,形成实验用数据集(图1)。由于房颤的临床识别依赖于一定持续时间的心电图信息,较短的持续时间会降低房颤的检出率,而较长的持续时间会带来计算量的增加,因此本文选择30 s长度的心电图作为输入,这也符合《2020ESC/EACTS心房颤动诊断与管理指南》规定的房颤确诊条件,即标准的12导联心电图或≥30 s单导联心电图记录到没有可识别的P波,且RR间期不规则(不伴房室传导阻滞时)的心电事件,可确诊为房颤27

由于动态心电图是在患者日常生活状态下连续24 h或更长时间记录其心电活动的全过程,不可避免地会存在运动和噪声伪影,一般情况下的噪声经过滤波器即可去除,但如果干扰严重会出现无效的心电段,即完全是噪声的数据。因此在数据处理时需要筛查出严重噪声段并排除出数据集,以防止模型训练和检测时出现较大的误差。本文采用心搏信号质量指数(bSQI)检测严重噪声段,其原理是用两种QRS检测算法,对同一个ECG信号进行R波检测,如果两个算法检测出来的R波符合度较高,即bSQI数值较高,则信号质量较好,其计算公式为:

bSQI=2×NmN1+N2

其中N1N2分别表示两种QRS检测算法检测到的R峰个数,Nm表示两种算法检测到的相同R峰的个数。对于噪声数据,其没有正常的心电波形,也没有R峰(图2),这将导致两种检测算法检测到的位置不一致,那么计算得到的bSQI值较低。将bSQI小于0.8的心电图段认定为低质量的噪声段,排除在研究之外。

为了保证所用心电信号的一致性,对AFDB数据集重采样至128 Hz。从数据集中提取出第一个导联“ECG0”的心电信号,使用带通频率范围为1~20 Hz的三阶巴特沃斯滤波器去除基线漂移和高频噪声,以便进一步分析。根据节律标签“AFIB”和“N”不重复的截取出30 s的AF段和NSR段,每段由3840个采样点组成。本文采用Hamilton算法28和Christov算法29计算心电段的bSQI指数。此外,采用z-score方法对心电数据进行归一化处理,以消除偏移效应对分类结果的影响,同时使得3个数据集的幅度保持在一个范围。

1.3 数据划分

图3显示了模型开发和独立验证数据集的数据选择过程。对于LTAFDB,质量筛查之后,数据集由133 240个心电片段组成,其中包括65 314个(49.0%)AF片段和67 926个(51.0%)NSR片段。本文采用十倍交叉验证来评估模型的性能,因此将LTAFDB数据集依据标签和患者进行分层分组抽样,分为十个折叠,每个折叠的患者不重复,且保证每个折叠的AF段和NSR段基本平衡,十个折叠的样本个数和患者个数如图3所示,每次训练都选择其中连续的两个折叠分别为测试集和验证集,其余为训练集,共进行10次训练。同样,AFDB数据集经过质量筛查之后,共有20 485个心电片段,其中AF片段6726个,NSR片段13 759个,全部用于独立测试。NSRDB数据集筛查后共有45 927个心电片段,均为NSR类别。

1.4 DSC-AttNet网络模型

本文提出的DSC-AttNet模型采用基于MobileNetV1结构的骨干网络,DSC-AttNet的整体网络架构主要包括两个部分:心电特征提取器和分类模块。心电特征提取器包含深度可分离卷积模块(DSC)和融合通道空间信息的卷积块注意模块(CBAM),以及提高特征表达能力的全局注意力模块,用来提取心电数据的时序特征。最后通过FC层和dropout层组成的分类模块进行AF分类(图4)。

MobileNet是一种依赖于DSC的轻量级CNN,在模型性能和速度上进行了折中,本文选择MobileNet作为该DSC-AttNet的主干提取器,并设计网络宽度只到512,以降低通道维度过宽带来的显存占用和过拟合风险。第1层采用的是标准卷积核,使模型高效地提取心电的基本特征,保证信息的完整性,其后堆叠了11个DSC模块,用于进一步优化特征。卷积核的大小统一为1×3,该大小在许多经典的模型中被证实其在性能、效率和灵活性之间达到了良好的平衡。此外,将混合注意模块CBAM嵌入到网络的特征提取部分,使其关注到更多能分辨房颤和正常窦性心律的特征信息,能够更好地提取心电特征。

1.4.1 深度可分离卷积模块

深度可分离卷积相比于标准卷积具有参数量少、计算更少的优点。DSC模块和其他传统CNN的卷积模块之间的主要区别是,传统CNN卷积模块包括一个标准卷积,其后跟随批处理归一化(BN)层和修正线性单元(ReLU)层(图5A),而DSC由一个深度卷积层(DConv)和1×1 逐点卷积层(PConv)组成,每层后都跟随BN层和ReLU6层(图5B)。ReLU6相对于ReLU对输入的最大输出值做了约束,使得即使在低精度设备时,也能够又很好的数值分辨率。

对于输入特征映射,深度可分离卷积模块首先在每个通道上执行带有一个滤波器的DConv(图6),然后将DConv的结果进行PConv,得到DSC的最终输出结果。DConv和PConv的公式如下式:

DConv(θd,x)(l)=θd(l)x(l)
PConv(θp,x)(l)=c=0Cθp(c,l)x(c,l)

式中x表示输入序列,l表示序列的位置,θ表示卷积核的权重, C表示输入通道数,表示元素的点积。深度卷积无法扩展特征映射的数量,因此在深度卷积之后,再进行逐点卷积。通过调整逐点卷积的卷积核数来实现特征映射数量的扩展,以保证深度可分卷积能够从多个角度提取心电的复杂特征。

1.4.2 CBAM模块

与人类的视觉注意类似,深度CNN中的注意机制可以使模型将注意力集中在有用的信息上,同时忽略不需要的噪声。注意机制被证明在很多分类、分割等任务中有帮助,最典型的代表之一是SENet,它只是压缩每个2-D特征映射来重新校准通道之间的权重。虽然它可以有效地建立通道间的相互依赖关系,但它只涉及通道注意CA),而忽略了空间注意(SA)。Woo等30提出了CBAM,其中的SA机制进一步推进了这一思想,在空间维度上进行了注意计算。其中CA在多个特征映射中找到所需特征的能力较强,而SA在探测特征映射中的重要特征时尤为突出,因此结合CA和SA的优点,本文在网络中引入了混合注意机制CBAM。CBAM的流程是,输入特征先经过CA模块关注到重要的通道,再经过SA模块关注到通道内重要的特征(图7)。

CA模块(图8A)同时对输入特征在特征维度进行最大池化和平均池化,然后通过多层感知器(MLP)对池化后的特征进行处理,最后通过sigmoid运算得到通道注意力的权重系数WcF

WcF=σMLP(avgpool(F))+MLP(maxpool(F))

SA模块(图8B)同时对输入特征在通道维度进行最大池化和平均池化,然后将两个通道缝合在一起,最后通过卷积运算得到空间注意的权重系数WsF

WsF=σc1×3([avgpoolF;maxpoolF])

最后,将输入特征与权重系数相乘,得到新的特征F'

F'=Ws(WcFF)

1.5 模型训练

本文的DSC-AttNet网络模型使用AdamW优化器更新网络参数,选择交叉熵函数作为损失函数进行模型训练。初始学习率为1.0e-03,批大小为64。为了提高模型的泛化性能,本文对训练数据集进行了一些随机数据增强操作,即在训练过程中对训练心电数据应用随机平移和随机噪声,这些数据增强操作都以0.5的概率应用到训练集上。实验程序采用十倍交叉验证和早期停止策略,如果连续10个epoch验证集的损失没有提高,则停止训练。该模型基于torch 1.12.1和cuda 12.6在Python 3.8.16中实现。所有实验均在NVIDIA GeForce RTX 3060GPU和AMD Ryzen 7 5800X CPU上进行,RAM为32 GB。

1.6 评价指标

本研究采用准确性(Acc)、灵敏度(Sen)、特异性(Spe)、精确度(Pre)和F1评分(F1)等评价指标来评估模型的分类性能。准确性是模型正确区分AF段和NSR段的能力,灵敏度是模型正确分类AF段的能力,特异性是模型正确分类NSR段的能力,精确度指的是真正AF段在预测AF段的比例,F1表示同时考虑精确度和灵敏度的模型的综合性能评价。它们的定义公式如下:

Acc=TP+TNTP+TN+FP+FN
Sen=TPTP+FN
Spe=TNFP+FN
Pre=TPTP+FP
F1=2×Pre×SenPre+Sen

其中,TP为真阳性,指真正AF段被模型预测为AF的片段个数;TN为真阴性,指真正NSR段被模型预测为NSR的片段个数;FP为假阳性,指真正NSR段被模型预测为AF的片段个数;FN为假阴性,指真正AF段被模型预测为NSR的片段个数。

2 结果

2.1 对比实验分析

对本文所提出的方法与其他分类模型进行了对比实验,使用相同的数据、相同的数据处理流程和训练策略对ResNet18、MobileNetV1和EfficientNetB0这3个常用的经典CNN网络进行训练,并在测试集上进行评估。此外,还与近几年的几项房颤分类研究的结果进行对比,由于未提供源代码,因此直接从文献里引用其分类的结果。本文采用的是患者间的训练方法,因此只从文献里引用其患者间的分类结果。

实验结果显示,本文提出的方法达到最好的分类性能,准确率达到97.33%(表1),高于其他研究模型和经典模型,说明本文方法诊断房颤更加准确。且各个指标的数值相差不大,相比于其他研究较为平稳,说明本文模型对两类样本预测能力均衡,整体表现比较稳定。

此外,为了进一步了解所提出的模型的分类过程,选择了FC层之前的不同层提取特征图,然后使用t-SNE可视化方法对分类任务进行可视化(图9)。第1层标准卷积模块后,AF和NSR特征点是混合的,如图9A所示,两类特征分布在一个聚类中,没有明确的边界。经过多层深度可分离卷积模块和注意力模块,两类特征点彼此逐渐远离,存在明显的分类边界(图9B)。通过可视化技术可以直观地看到,DSC-AttNet模型可以准确提取AF和NSR的特征。

对本文所提出的网络和其他3个常用的经典CNN网络进行了泛化能力评估,在AFDB上的评估指标结果显示(表2),本文提出的DSC-AttNet准确率达到92.78%,F1指数达到89.11%,总体性能比经典神经网络提高1%~5%。在NSRDB上的评估指标结果显示(表3),DSC-AttNet对N类的诊断准确率达到99.97%,高于其他模型。

本文统计了各模型的复杂性度量(表4),DSC-AttNet的参数量为1.01M,计算量为27.19G,在分类精度和泛化能力比经典模型优秀的情况下,本文模型的参数量和计算复杂度要比经典模型小很多,利于在资源受限的场景下应用。

2.2 消融实验分析

本文进行消融实验以进一步分析网络中每个模块的有效性,本文对以下四种配置的模型进行实验:(1)MobileNetV1的结构中,去除后两个深度可分离卷积模块,使网络最宽只到512个通道数,并且使用两层全连接层,记为“Baseline”;(2)加入CBAM模块,记为“+CBAM”;(3)加入全局注意力块,记为“+Global Attention”;(4)同时加入CBAM模块和全局注意力块,即为本文的模型,记为“DSC-AttNet”。 使用相同的数据、相同的数据处理流程和训练策略,评估指标都取十折的平均值。消融结果可以看出,引入CBAM和全局注意力块,提高了模型的准确率、精确度和F1分数(表5)。

2.3 DSC-AttNet模型对其他心律失常的检测能力分析

进一步从LTAFDB上提取窦性心动过缓(SBR)、室上性心动过速(SVTA)、房性二联律(AB)3个类别的数据,与AF类和NSR类组成五类别数据集。由于SBR、SVTA、AB3类的数据段较少,因此对这3类进行有重叠的裁剪,并将裁剪长度降低为10s,数据预处理同图1。最终的五类别数据集,N、AF、SBR、SVTA、AB样本分别为1500、1500、1488、1438、1352,共7278条数据,送入到DSC-AttNet模型中进行训练和测试,仍保证训练集验证集测试集的患者不会重复。五分类结果如表6所示,所提模型DSC-AttNet在五类心律失常的分类准确率达到了 71.20%,精确率达到所有模型中最高,为77.31%,表明模型在多类别心律失常分类任务中具有一定的检测能力,较能有效区分不同类型的心律失常。

3 讨论

纵观近几年的房颤分类研究,部分研究同时进行了患者内和患者间的评估实验,可以发现,使用患者内评估机制时,分类准确率都可以达到很高的标准,如Li23等的患者内实验,准确率达到99.57%,Mousavi34等的患者内实验,准确率达到99.40%。这是因为患者内评估机制,在将数据集划分为训练集、验证集和测试集时,没有限制每个病人的样本只能出现在一个集合里,这导致了在训练集和测试集极大可能出现同一个病人的样本,使得模型的测试准确率非常高。本文采用患者间的评估机制,避免同一个病人的样本同时出现在不同集合里,这样进行的实验比较符合实际应用,因为在实际应用中模型评估的都是未见的数据。

在这项研究中,为了进行性能比较,实现了3个经典模型,并采用相同的数据和训练策略与本文模型进行了对比实验。表1给出了对比实验结果,所提出的DSC-AttNet模型的准确率、精确率和F1分数为97.33%、97.30%和97.31%,均高于经典模型,在灵敏度和特异度上只比MobileNetV1和EfficientNetB0低0.2%~0.4%,但MobileNetV1和EfficientNetB0的准确率较低,都只有95.64%。此外,与近几年的四个相关文献的实验结果相比,DSC-AttNet也具有更好的性能,准确率是所有算法中最好的,精确率也高于IMC-ResNet模型。模型MGNN32以RR间期序列为输入,分别用1×5和1×7的卷积核分两通道进行底层特征提取,其注意力模块采用SE模块,对通道之间的相互依赖进行建模,其灵敏度和F1分数较差,表明模型识别AF类的能力差,其原因有可能是输入RR间期序列相比于心电信号段少了很多信息,如心电信号段上消失的p波和代替它的f波信息。IMC-ResNet34模型通过多尺度转置卷积和多尺度扩张卷积组成的多尺度信息交互模块,结合残差块进行特征提取,但其有较低的特异性和精确度,其精确度只有89.51%。LDSNet23是由两条卷积路径和交叉引导机制组成的轻量级网络,虽然模型够轻量,但相应的其分类准确率只有94.57%。模型MT-DCNN33是一个多任务模型,同时进行了心电数据的重建任务以防止模型过拟合,其分类准确率和灵敏度均低于本文的分类精度。且相比于MGNN过低的灵敏度、LDSNet过低的准确率和特异度、IMC-ResNet过低的特异度和精确率,本模型的各个指标之间更加平衡,在误诊和漏诊之间达到了很好的平衡。

为了评估模型的泛化性能,对本文模型和3个经典模型进行外部独立测试。从外部测试集AFDB上的结果来看,所有模型的评价指标整体都小于训练测试集的结果,这可能是因为对于不同来源的数据集,一是存在不同患者群体的生理特性差异,比如患者年龄、性别、健康状态的分布差异,这些差异会导致心电图上的疾病表征具有特异性,那么在AFDB上进行测试时,由于这些差异会导致模型在训练时学到的特征对部分未见数据失效,引起房颤诊断能力下降;二是不同数据集的标注标准不完全一致,不同标注人员的判断差异可能导致一些心电表征在不同数据集上的标签不一致,那么进行泛化测试时,模型的性能会有所下降。所提出的模型DSC-AttNet相较于对比模型有更高的准确率和F1分数,其中灵敏度和特异度较其他指标下降更多,可能是因为上述不同数据集的两个差异的存在导致了假阳性和假阴性的增加,这在指标灵敏度和特异度上表现更明显。从外部测试集NSRDB上的结果来看,各模型对N类的识别能力都很高,DSC-AttNet的准确率最高,为99.97%。总体来说,所提模型的综合泛化能力更高。

在常用的卷积方法(标准卷积、分组卷积和深度可分离卷积)中,标准卷积的特征表达能力更强,但计算量较高,不利于模型的轻量化设计。深度可分离卷积具有较低的计算成本,但其特征表示能力会弱于其他两种卷积方法。所以在使用深度可分离卷积以降低模型复杂度的同时,需要保持性能不受影响。深度可分离卷积近年来常用于减轻网络复杂度,如Franc等35将深度可分离卷积与Inception Net结合开发了Xception Net,保留了多尺度卷积的优点,同时降低了网络的计算成本。Chen等人36利用深度可分离卷积设计了一种轻量级网络,既能准确提取图像的边界特征,又能有效降低算法的计算成本。因此,为降低房颤分类算法的计算成本,本文设计了基于深度可分离卷积模块进行主干特征提取的模型,DSC-AttNet的参数量和计算复杂度要比经典模型小很多,参数量只有1.01M,计算量为27.19G。对比于MGNN模型,本文模型参数量更小,但由于MGNN模型的输入维度只有32,因此计算复杂度会小很多。对比于LDSNet模型,其计算量和参数量最少,但其分类性能最低,只有94.57%,这表明参数量太小会影响模型的特征表达能力和分类性能,这不利于实际的诊断应用。因此,本文所提DSC-AttNet在模型复杂度和性能之间达到了很好的平衡。

本文所提DSC-AttNet通过引入CBAM模块及全局注意力模块,增强模型对心电数据的学习能力,在模型参数量较低的情况下依旧保持可靠的精度。CBAM模块串联了通道注意力和空间注意力机制,这种双重注意力机制不仅增强了特定通道的权重,从而突出关键信息,还聚焦于局部空间位置的显著特征。对于心电信号来说,可能存在瞬时变化,即在特定时间窗口内出现重要特征形态,那么空间注意力机制将突出这部分特征。对DSC-AttNet模型设计为在不同位置穿插 CBAM 模块,以对不同层次的特征进行逐层优化,在训练时能够动态调整不同层次的特征重要性。多个CBAM模块对特征优化的累积,使得模型的整体特征学习得到增强。对模型进行消融实验,引入CBAM提高了分类模型的准确性和精确度,准确率提高到97.21%。但引入全局注意力块时,基线模型的性能下降,这可能是因为,全局注意力引入了额外的权重学习来调整特征表达,在某些情况下原始特征已经足够具有区分性了,注意力可能会干扰这些特征,反而降低了模型性能。当同时引入CBAM和全局注意力块,模型的性能进一步提高,准确率达到97.33%,精确度提高到97.30%,F1分数提高到97.31%。这是因为,CBAM通过自适应地调整通道和空间的权重,有效突出重要特征和抑制不相关的背景信息。而全局注意力块则有助于从全局视角重构特征,捕捉到全局上下文之间的复杂关系。将这两种注意力机制结合,可以使得模型在提取特征时既能局部关注重要的细节,也能全局把握数据中的重要模式,从而提高了特征的表达能力。

对于DSC-AttNet模型对其他心律失常类别的检测潜力,五类别检测实验的结果显示(表6),所有模型的分类指标均低于二分类的结果,这不仅是因为五分类的任务更复杂,还与数据集的样本容量有关,五分类数据集里每个类别只有1500条左右,且部分类别还是重叠裁剪进行扩增的,而二分类数据集每个类别均有6万多条,而且是不重叠裁剪。所以,数据样本太少,那么模型的鲁棒性就越差,在未见数据集上就很难得到很好的泛化效果。其中,DSC-AttNet达到了最高的精确率,为77.13%。但其各分类指标均低于MobileNetV1和EfficientNetB0,可能的原因是对于更为复杂的五分类实验,对模型的特征表达能力要求越高,这与MobileNetV1和EfficientNetB0的参数量和计算量明显高于DSC-AttNet相符合。因此,对于多类别心律失常分类任务来说,模型不适合太轻量化,且需要更丰富的样本来进行模型优化。

DSC-AttNet复杂度低,在房颤分类中提供了更有效率和更高精度的模型。基于模型的轻便性,可以在边缘设备如单导联心电图设备、智能手环等硬件上部署,进行本地的心电信号实时分析,给出房颤诊断参考。未来将获取一定的硬件支持,进一步结合实际硬件平台,针对模型的推理速度、能耗等进行全面评估。尽管该模型在LTAFDB上表现出良好的性能,但其在AFDB上的泛化性能有待提高,下一步将对模型进行改进,以达到更好的泛化性能,同时也收集更广泛、更复杂的真实临床数据集,以囊括不同患者群体,以促进模型在复杂场景下的推广性。此外,还会进一步研究信号降噪算法来应对动态心电图的噪声问题。

参考文献

[1]

Shi SB, Tang YH, Zhao QY, et al. Prevalence and risk of atrial fibrillation in China: a national cross-sectional epidemiological study[J]. Lancet Reg Health West Pac, 2022, 23: 100439.

[2]

苏 晞, 张劲林, 韩宏伟, . 单导联心电图记录系统进行心房颤动机会性筛查的首个国内经验[J]. 中华心律失常学杂志, 2017, 21(6): 485-8.

[3]

Halcox JPJ, Wareham K, Cardew A, et al. Assessment of remote heart rhythm sampling using the AliveCor heart monitor to screen for atrial fibrillation: the REHEARSE-AF study[J]. Circulation, 2017, 136(19): 1784-94.

[4]

Daqrouq K, Alkhateeb A, Ajour MN, et al. Neural network and wavelet average framing percentage energy for atrial fibrillation classification[J]. Comput Methods Programs Biomed, 2014, 113(3): 919-26.

[5]

Fuadah YN, Lim KM. Optimal classification of atrial fibrillation and congestive heart failure using machine learning[J]. Front Physiol, 2022, 12: 761013.

[6]

Bashar SK, Hossain MB, Ding E, et al. Atrial fibrillation detection during sepsis: study on mimic iii icu data[J]. IEEE J Biomed Health Inform, 2020, 24(11): 3124-35.

[7]

Bashar SK, Han D, Zieneddin F, et al. Novel density poincaré plot based machine learning method to detect atrial fibrillation from premature atrial/ventricular contractions[J]. IEEE Trans Biomed Eng, 2021, 68(2): 448-60.

[8]

García-Isla G, Mainardi L, Corino VDA. A detector for premature atrial and ventricular complexes[J]. Front Physiol, 2021, 12: 678558.

[9]

Gupta K, Bajaj V, Ahmad Ansari I. Atrial fibrillation detection using electrocardiogram signal input to LMD and ensemble classifier[J]. IEEE Sens Lett, 2023, 7(6): 7002904.

[10]

Asgari S, Mehrnia A, Moussavi M. Automatic detection of atrial fibrillation using stationary wavelet transform and support vector machine[J]. Comput Biol Med, 2015, 60: 132-42.

[11]

Abdul-Kadir NA, Mat Safri N, Othman MA. Dynamic ECG features for atrial fibrillation recognition[J]. Comput Methods Programs Biomed, 2016, 136: 143-50.

[12]

Luongo G, Rees F, Nairn D, et al. Machine learning using a single-lead ECG to identify patients with atrial fibrillation-induced heart failure[J]. Front Cardiovasc Med, 2022, 9: 812719.

[13]

Kalidas V, Tamil LS. Detection of atrial fibrillation using discrete-state Markov models and Random Forests[J]. Comput Biol Med, 2019, 113: 103386.

[14]

Li XY, Shi XL, Handa BS, et al. Classification of fibrillation organisation using electrocardiograms to guide mechanism-directed treatments[J]. Front Physiol, 2021, 12: 712454.

[15]

Mateo J, Joaquín Rieta J. Radial basis function neural networks applied to efficient QRST cancellation in atrial fibrillation[J]. Comput Biol Med, 2013, 43(2): 154-63.

[16]

Chen B, Maslove DM, Curran JD, et al. A deep learning model for the classification of atrial fibrillation in critically ill patients[J]. Intensive Care Med Exp, 2023, 11(1): 2.

[17]

Pourbabaee B, Roshtkhari MJ, Khorasani K. Deep convolutional neural networks and learning ECG features for screening paroxysmal atrial fibrillation patients[J]. IEEE Trans Syst Man Cybern Syst, 2017, 48(12): 2095-104.

[18]

Faust O, Shenfield A, Kareem M, et al. Automated detection of atrial fibrillation using long short-term memory network with RR interval signals[J]. Comput Biol Med, 2018, 102: 327-35.

[19]

Kumar D, Peimankar A, Sharma K, et al. Deepaware: a hybrid deep learning and context-aware heuristics-based model for atrial fibrillation detection[J]. Comput Methods Programs Biomed, 2022, 221: 106899.

[20]

Laghari AA, Sun YQ, Alhussein M, et al. Deep residual-dense network based on bidirectional recurrent neural network for atrial fibrillation detection[J]. Sci Rep, 2023, 13(1): 15109.

[21]

Iandola FN, Han S, Moskewicz MW, et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size[EB/OL]. 2016: 1602.07360.

[22]

Howard AG, Zhu ML, Chen B, et al. MobileNets: efficient convolutional neural networks for mobile vision applications[EB/OL]. 2017: 1704.04861.

[23]

Li YJ, Chen M, Wang Y, et al. Diagnosis of atrial fibrillation based on lightweight detail-semantic network[J]. Biomed Signal Process Contr, 2023, 85: 105025.

[24]

Petrutiu S, Sahakian AV, Swiryn S. Abrupt changes in fibrillatory wave characteristics at the termination of paroxysmal atrial fibrillation in humans[J]. Europace, 2007, 9(7): 466-70.

[25]

Moody GB, Mark RR. New method for detecting atrial fibrillation using r-r intervals[J]. Comput Cardiol, 1983: 227-30.

[26]

Goldberger AL, Amaral LA, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation, 2000, 101(23): E215-20.

[27]

谭 琛. 《2020 ECS/EACTS心房颤动诊断和管理指南》解读[J]. 中国循证心血管医学杂志, 2021, 13(2): 129-32.

[28]

Hamilton P. Open source ECG analysis[C]//Computers in Cardiology. September 22-25, 2002, Memphis, TN, USA. IEEE, 2002: 101-4.

[29]

Christov II. Real time electrocardiogram QRS detection using combined adaptive threshold[J]. Biomed Eng Online, 2004, 3(1): 28.

[30]

Woo S, Park J, Lee JY, et al. CBAM: convolutional block attention module[C]//Computer Vision-ECCV 2018. Cham: Springer International Publishing, 2018: 3-19.

[31]

Liu S, Wang AG, Deng XT, et al. MGNN: a multiscale grouped convolutional neural network for efficient atrial fibrillation detection[J]. Comput Biol Med, 2022, 148: 105863.

[32]

Prabhakararao E, Dandapat S. Atrial fibrillation burden estimation using multi-task deep convolutional neural network[J]. IEEE J Biomed Health Inform, 2022, 26(12): 5992-6002.

[33]

Sun YH, Li YJ, Chen M, et al. IMC-ResNet: Atrial fibrillation detection method based on interlayer multiscale coupling[J]. Biomed Signal Process Contr, 2024, 97: 106683.

[34]

Mousavi SS, Afghah F, Razi A, et al. ECGNET: Learning where to attend for detection of atrial fibrillation with deep visual attention[J]. IEEE EMBS Int Conf Biomed Health Inform, 2019: 10.1109/BHI.2019.8834637.

[35]

Chollet F. Xception: deep learning with depthwise separable convolutions[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). July 21-26, 2017, Honolulu, HI, USA. IEEE, 2017: 1800-7.

[36]

Chen LC, Zhu YK, Papandreou G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation[C]// Computer Vision-ECCV 2018. Cham: Springer International Publishing, 2018: 833-51.

基金资助

国家重点研发计划(2023YFC2414500)

国家重点研发计划(2023YFC2414502)

RIGHTS & PERMISSIONS

版权所有©《南方医科大学学报》编辑部2021

AI Summary AI Mindmap
PDF (1687KB)

348

访问

0

被引

详细

导航
相关文章

AI思维导图

/