心房颤动(房颤)是最常见的心律失常之一
[1]。研究表明,房颤患者缺血性卒中风险是非房颤患者的近5倍
[2]。同时,房颤显著增加其他严重并发症的风险,如心力衰竭、冠状动脉疾病和老年痴呆症等
[3]。房颤风险随着年龄增长具有持续升高的趋势
[4],中国人口老龄化的现状将进一步加剧房颤患病现状,增加国内医疗卫生负担。因此,亟待开发有效的风险预测工具,以识别未来房颤高风险个体,从而指导制定针对性的预防策略。
研究表明心房结构的病理性重塑在房颤发病数年前已经形成
[5]。因此,房颤患者发作前的窦性心律期间可能已存在亚临床心脏电信号改变。心电图是临床上广泛使用的低成本、易获取的检查;其不仅是心血管疾病诊断的辅助工具,近年来也逐渐在心血管疾病风险预测中展现出独特价值
[6]。基于心电信息的房颤预测模型具备优秀的预测性能
[7, 8]。然而,模型开发队列大多来自于美洲人群,种族及地区的异质性可能导致群体间的心电图特征产生细微差异
[9],因此既往模型在欧洲人群进行测试时的预测效能显著降低
[8]。此外,模型在其他种族及地区,尤其是亚洲地区的泛化性尚未得到充分验证。原有模型在美洲人群中的有效性可能无法直接适用于亚洲人群。因此,开发针对亚洲人群的房颤预测模型具有重要临床意义。既往国内研究基于房颤发作前6 min的动态心电图数据开发了阵发性房颤识别的人工智能模型
[10],但目前尚未有针对中国人群长期房颤风险预测的相关探索。
本研究首次基于中国人群的心电大数据,量化提取窦性心律期间的心电特征,创新性采用多种特征降维算法对心电特征进行分析并筛选出最具预测价值的特征,确保了在大数据背景下的可解释性。进一步建立早期房颤风险预测模型,并对其进行内部测试,以期为中国及亚洲人群房颤预测及预防提供新工具和新思路。
1 资料和方法
1.1 临床资料
回顾性分析2009年~2023年于解放军总医院进行心电图检查的患者资料。纳入标准:年龄≥18岁;接受过2次或以上心电图检查(最近一次心电图用于定义研究终点)。排除标准:所有心电图均未出现正常窦性心律;心电图质量差、干扰或伪差;正常窦性心律心电图与定义研究终点的心电图间隔小于1年。最终30 383例患者纳入本研究,包括男性15 516例,女性14 867例;年龄51.0(36.0,62.0)岁。共计86 666份心电图用于研究分析,其中30 383份心电图用于确定研究终点,剩余的56 283份正常窦性心电图用于模型训练及内部测试。本研究通过了解放军总医院伦理委员会批准(伦理批号:S2019-318-03)。
1.2 研究终点及分组
研究终点为患者所有心电图中首次出现房颤心律的时间或直至最后一份心电图的时间。房颤心律定义为心电图上P波消失,代之以大小不等、形态不同的f波,R-R间期不等。心电信息由两位或以上心电图医师进行测量、校正及诊断。根据研究终点将患者分为两组:房颤组,即所有心电图中至少一次显示房颤节律的患者;非房颤组,即整个研究期间均未出现房颤节律的患者。最终1370例患者归入房颤组,29 013例患者归入非房颤组。将患者按7∶3的比例随机划分为训练集和内部测试集。使用训练集中患者的所有正常窦性心电图进行模型训练,使用内部测试集中患者的首份正常窦性心电图测试模型表现。
1.3 设备参数及特征提取
研究所用心电图均由经验丰富的心电图技师严格遵循常规心电图检查操作指南及GE Marquette心电图机标准化操作手册进行采集。在患者静息状态下,取平卧位,使用美国GE Healthcare公司生产的12导联心电图机,以500 Hz的采样频率,持续10 s,进行心电数据采集与存储。采集结束后的原始波形数据、检查日期、患者年龄及性别存储于MUSE v8心电信息系统中,用于后续分析。使用经过严格验证的GE Marqeute12SL心电分析算法,对每份标准12导联心电图进行自动分析及特征提取,从标准10 s 12导联心电图中共计提取633个心电特征。该算法包括信号滤波处理、波形检测、定位及分析等步骤。此外,心电图技师对每份心电图进行重新判读及审核以确保心电采集质量及诊断准确性。
1.4 特征筛选
采用单因素Cox比例风险回归,分析心电特征与房颤的相关性,过滤掉
P≥0.05的特征。根据机器学习特征筛选指南,进一步删除方差接近于零及高度相关的特征(
r>0.75)。接着,采用最小绝对值收敛和选择算子(LASSO)回归进一步筛选具有预测价值的心电特征
[11],通过十折交叉验证,确定惩罚系数λ=0.00 026,将此时具有非零系数的变量保留进入后续分析。此外,本研究采用Boruta算法进行特征筛选,计算比较候选特征与“影子特征”的Z值,若特征的 Z 值大于影子特征的最大Z值,则认为该特征重要
[12]。将两种算法筛选的心电特征取交集,进入后续模型开发,结合Schoenfeld残差检验法和图形检验法综合判定纳入特征是否符合Cox比例风险假设。
1.5 模型开发及测试
根据患者心电特征、年龄及性别构建以下两种预测模型:基于筛选的心电特征拟合多因素Cox回归模型,并通过向后逐步回归法消除冗余变量,最终构建心电模型,并开发了在线网页动态列线图(
https://ecgpredictcvd.shinyapps.io/ECGpredictAF/);基于心电模型评分及年龄、性别构建的复合模型。采用卡方统计量减去自由度评估各心电特征在心电模型中的相对重要性
[13]。使用内部测试集数据对模型进行评价,针对构建的模型分别绘制受试者工作特征(ROC)曲线,获得曲线下面积(AUROC),评价各模型的区分度。计算复合模型相较于心电模型的净重新分类指数和综合判别改善指数,评价复合模型的增益预测价值。采用Hosmer-Lemeshow检验绘制校准曲线以评价模型校准度。采用决策曲线分析,并计算决策曲线下面积(AUDC)评价模型的临床净获益。
1.6 统计学方法
采用R 4.3.1进行统计学分析。采用Shapiro-Wilk检验对计量资料进行正态性检验;若符合正态分布,则表示为均数±标准差,组间比较采用独立样本t检验;若不符合正态分布,则以中位数(P25,P75)表示,组间比较采用Mann-Whitney秩和检验。计数资料表示为构成比或率(%),通过卡方检验进行组间比较。双侧P<0.05为差异有统计学意义。
2 结果
2.1 两组患者临床基线资料
表1对比了房颤组与非房颤组患者的基线特征。在房颤组中,中位年龄为70(60,78)岁,868例(63.4%)为男性;非房颤组患者的中位年龄为50(35,61)岁,男性14 648人(50.5%)。两组患者年龄和性别差异有统计学意义(
P<0.001)。训练集与测试集的患者房颤发生率分别为4.5%(956/21268)、4.5%(414/9115)。两组患者年龄、性别及房颤发生率的差异均无统计学意义(
P>0.05,
表2)。
2.2 心电特征筛选及模型训练
经单因素Cox回归(
P≥0.05)及去除高度相关变量(
r>0.75)后剩余162个特征,进行LASSO回归后,筛选出140个重要心电特征。基于随机森林分类的Boruta算法及去除高度相关变量后筛选出151个重要心电特征。两种算法均认为重要的特征共计98个,进入后续模型训练。采用多因素Cox回归训练模型,并通过向后逐步回归法消除冗余变量,最终构建包含69个心电特征的心电模型。对未来房颤预测重要性前五的心电特征为III、avR和aVL导联的QRS波群偏斜,以及V
1和aVR导联的P波峰值振幅(
图1)。此外,拟合了基于心电模型评分、年龄、性别的复合模型。
2.3 模型性能评价
2.3.1 模型区分度评价
各模型的ROC曲线分析见
图2。在训练集中复合模型预测5年房颤风险的AUROC为0.80(95%
CI:0.78-0.81),高于心电模型(0.75,95%
CI:0.74-0.77)。在测试集中复合模型预测5年房颤风险的AUROC为0.81(95%
CI:0.78-0.83),高于心电模型(0.77,95%
CI:0.74-0.80)。表明复合模型对房颤风险预测有较高的区分度。复合模型与心电模型相比,净重新分类指数为0.123,综合判别改善指数为0.04(
P<0.05)复合模型对房颤预测能力优于单纯的心电模型。
2.3.2 模型校准度
校准曲线显示,在训练集中,复合模型和心电模型的校准曲线均接近对角线,表明两种模型在训练集上的预测5年无房颤生存概率与实际5年无房颤生存概率较为一致(
图3A)。复合模型的校准曲线略优于心电模型,特别是在高预测概率区间范围表现出更好的校准性能。在测试集中,复合模型在高预测概率区间的校准曲线更接近对角线(
图3B)。
2.3.3 临床净获益分析
决策曲线分析显示,在训练集中和测试集中,复合模型的临床净获益在绝大多数风险阈值范围内均高于心电模型(
图4)。训练集中,复合模型的AUDC为0.0117,高于心电模型(0.0097);测试集中,复合模型的AUDC仍优于心电模型(0.0039
vs 0.0032)。
3 讨论
2022年,美国麻省总医院使用MUSE系统存储的心电数据及临床数据,基于深度学习算法开发了房颤预测模型(CH-AI模型),该模型显著优于经典的CHARGE-AF模型
[8]。深度学习模型可从原始心电波形中识别出复杂心电特征关系,因此往往具有更卓越的性能
[14]。然而,该模型在预测英国人群的房颤风险时区分度欠佳。既往研究表明人为添加不易察觉的心电干扰会显著降低模型准确性。因此,由于种族异质性导致的细微心电差异可能是模型区分度下降的原因
[9, 15]。因此,本研究基于中国人群的心电大数据库,通过更具可解释性的方法,构建针对中国人群的房颤预测模型。
本研究纳入3万多例患者的5万余份窦性心电图,结合LASSO回归和Boruta特征筛选算法,采用Cox比例风险回归,开发并验证了基于心电大数据的房颤风险预测模型。与心电模型模型相比,复合模型表现出更强的区分度,在测试集中AUROC达到0.81,与先前的预测模型表现接近
[16-18]。校准曲线分析显示与心电模型相比,加入基本人口统计学指标后的复合模型更接近理想参考线。但在较低的无房颤生存概率区间内,预测概率略高于实际概率,表明模型可能稍低估了实际房颤风险。决策曲线分析证明了复合模型AUDC高于心电模型,表明其具有更高的临床净获益。多方位模型评价证明了复合模型具有良好的预测性能及临床适用性。
年龄是房颤公认的危险因素,先前开发的模型均强调了年龄在房颤预测中的重要性,这与本研究的结果相一致。性别是房颤的既定危险因素。研究表明,男性群体的房颤发病率显著高于女性群体。因此,在既往房颤预测模型开发中,性别通常被选作其中的预测因子。男性群体在高血压、冠心病等慢性疾病发病率及吸烟、饮酒史方面均高于女性群体,这些因素是房颤的已知危险因素,一定程度上解释了性别与房颤风险的相关性及对房颤风险评估的预测价值。此外,本研究发现P波峰值振幅、P波峰值时间、P波持续时间、PR间期对房颤具有重要预测价值。既往诸多研究也证实了P波相关参数与房颤风险的相关性
[19-22],大型流行病学研究已将这些P波参数认定为了房颤危险因素
[23]。PR间期代表电信号从窦房结发出,经房室结传导至浦肯野纤维所需的时间。心脏结构和传导系统的退行性改变可导致PR间期延长,一定程度上解释了PR间期延长与房颤之间的关联
[24]。此外,本研究发现QRS波偏移是房颤的重要预测因子,其计算方法为QRS复合波正向和负向最大振幅的绝对值之和。既往研究发现与年龄密切相关的心电图变化是QRS复合波
[25]。表现为随着年龄的增长,R波与S波振幅减小。这部分解释了较低的QRS波偏移与房颤风险增加的关联性。
研究基于心电图的量化特征,结合年龄和性别构建的复合模型表现出较好的房颤预测性能,可为针对性的预防干预措施提供依据。房颤管理指南指出,适度锻炼、体重管理、戒烟戒酒可有效降低房颤发病风险
[26]。因此,筛查房颤高风险人群,对高危个体进行针对性干预可能降低房颤及相关并发症的发病风险。此外,模型算法可以直接集成到心电图机中,无需额外输入任何临床变量即可实时评估房颤风险,便于临床应用,节省大量成本和时间。
本研究存在一定局限性。首先,本研究是一项单中心单一心电图机来源的研究,无外部测试以验证模型外推性。其次,研究所用心电特征由特定算法提取,不同品牌的心电图机算法存在差异。因此,模型在应用于其他心电图机数据时需重新校准。另外,部分心电特征与房颤风险呈现复杂非线性关联,需要使用机器学习的方法实现更优的拟合,未来有必要进一步构建基于机器学习的房颤预测模型。此外,本研究仅基于常规10 s 12导联心电大数据库,未能获取其他临床信息,因此无法对房颤类型进一步分类,未能检验模型对不同房颤类型的预测有效性的差异。最后,由于MUSE心电系统中仅存储了年龄和性别的人口统计学信息,因此本研究无法直接与现有的房颤风险评分模型比较。
综上,研究发现P波峰值振幅、P波持续时间、PR间期、QRS波偏移等心电参数对房颤风险预测具有重要价值。本研究基于窦性心律期间的心电图定量特征及年龄和性别,在中国人群中开发了用于预测房颤的复合模型,为房颤的早期风险评估及预防干预提供了低成本、高效能的筛查工具。