急性心肌梗死(acute myocardial infarction,AMI)是由冠状动脉急性、持续性缺血缺氧引起的心肌细胞坏死,也是目前全球心血管疾病死亡最常见的临床急症之一,而且患者在治疗出院后的心肌梗死再发率也在显著增加
[1]。尽管目前经皮冠状动脉介入术(percutaneous coronary intervention,PCI)是治疗急性心肌梗死的常用手段
[2],然而患者术后仍会出现出血、心肌损伤、支架再狭窄、心肌梗死再发等心血管不良事件的风险
[3-4],有约17.8%的AMI患者在行PCI术后1年发生主要心血管不良事件(major adverse cardiovascular events,MACE)
[5]。而PCI目前建立的MACE模型预测表现大多一般(曲线下面积在0.65左右),且运用Cox、logistic等单一模型而较少应用随机生存森林一类的集成学习。本研究借助随机生存森林(random survival forest,RSF)模型,从一般人口学特征、术前检查信息、血液检验指标和手术相关信息等多方面综合分析AMI患者术后的影响因素,并构建PCI预后评分,为临床心血管个性化治疗提供参考。
1 资料与方法
1.1 研究对象
本研究回顾性收集从2018年1月至2022年6月所有在江西省南昌大学第二附属医院符合PCI手术标准并行PCI术的心肌梗死患者,疾病诊断分类标准依据ICD-10的分类,均术后随访1年以上。手术指征包括慢性稳定型冠心病有较大范围心肌缺血证据、不稳定心绞痛、非ST段抬高性心肌梗死及急性ST段抬高性心肌梗死。
纳入标准:①年龄≥18岁;②临床确诊急性心肌梗死(AMI)③胸痛12 h 内;④病变血管直径大小>1.5 mm;⑤左回旋支(left circumflex artery,LCX)、左前降支(left anterior descending,LAD)、右冠状动脉(right coronary artery,RCA)3处至少有一个部位的管径狭窄>50%;⑥院内行PCI治疗,并且至少植入支架1枚;⑦有完整详细的电子病历,有定期复查及随访结果记录。排除标准:①有PCI、冠状动脉旁路移植术(coronary artery bypass grafting,CABG)治疗史;②并发其他心脏疾病需行外科手术;③左主干病变管腔狭窄>50%;④有近期或活动性出血;⑤脑内肿块或动脉瘤;⑥对阿司匹林或氯吡格雷过敏或碘化造影剂过敏;⑦入院时已发生严重感染、严重肝功能不全、恶性肿瘤等疾病。
为了充分评估术后主要心血管不良事件的风险预测因子,本研究评分模型拟纳入影响因素不超过20项,参考 Richard 提出的临床预测模型样本量计算方法进行计算
[6],至少应纳入患者3 500例。从4个主要类别中选择了特征,包括一般信息如年龄、性别、体重指数(body mass index,BMI)、既往病史等,术前检查如心率、收缩压(systolic blood pressure,SBP)、舒张压(diastolic blood pressure,DBP)、Kiliip、左室射血分数(left ventricular ejection fraction,LVEF)等、血液检查如白细胞(white blood cell,WBC)、血红蛋白(haemoglobin,Hb)、红细胞压积(hematocrit,HCT)、超敏心肌肌钙蛋白(high-sensitive cardiac troponin,hs.cTn)、脑钠肽(brain natriuretic peptide,BNP)等,以及手术信息如血管狭窄程度、病变冠脉支数、支架数目等。通过门诊病历、再入院记录及电话随访等方式获取,包括心血管事件、死亡、生存、拒访、失访等信息。本研究在南昌大学第二附属医院伦理委员会监督下完成,调查开展前均获得研究对象的知情同意。
1.2 随访结局
本研究中的PCI手术随访结局是术后1年内首次发生MACE,包括心源性死亡、心肌梗死、心绞痛发作、心力衰竭、再次血运重建、恶性心律失常、支架血栓等
[7]。疾病诊断由国际疾病分类代码第十版(ICD-10)定义。
1.3 质量控制
在回顾性收集患者相关信息前,对调查问卷及人员进行专家咨询和人员培训,数据录入结束当天进行信息核对。在收集随访信息前,记录收集的结局信息和时间;对于出现心血管不良事件的患者,明确其事件类型。
1.4 统计学方法
使用SPSS 26.0和R 4.2.1进行统计分析,计量资料采用四分位数[
Md (
P25,
P75)]表示,计数资料采用频数及构成比进行描述。计量资料的差异性比较采用
t检验或
U检验分析,计数资料则采用
χ2检验分析。检验水准
α=0.05。当某一变量的缺失比例超过30%,则剔除该变量,对符合要求的缺失变量进行链式方程(multiple imputation by chained equations,MICE)多重插补
[8]。在数据填补后,对不平衡数据进行过采样处理
[9]。使用
Z值归一化法对变量进行归一处理以减少偏差,并采用十倍交叉验证的Lasso回归确定纳入模型的变量
[10]。同时,按照7∶3的比例划分训练集和验证集,构建随机生存森林(RSF)模型
[11]和Cox比例风险模型,采用受试者工作特征曲线(receiver operating characteristic,ROC)下面积(area under curve,AUC)和校准曲线评估模型性能。根据RSF模型拟合结果借助shiny程序包绘制风险计算器。研究过程见
图1。
2 结果
2.1 患者一般情况
研究最终共纳入3 880例AMI患者,其中术后1年内发生主要心血管不良事件473例(12.2%)。所有患者中男性2 862例、STEMI 1 233例、高血压2 220例、糖尿病1 151例、肾功能不全523例。纳入患者的基线人口学特征和临床特征(按MACE分组)见
表1。各变量差异统计学分析结果显示,有高血压病史(
χ2 =4.080,
P=0.043)、糖尿病病史(
χ2 =7.031,
P=0.008)、肾功能不全病史(
χ2 =4.188,
P=0.041)、LVEF偏低(
χ2 =19.219,
P<0.001)、HCT偏低(
χ2 =8.091,
P=0.017)、BNP偏高(
χ2 =11.247,
P=0.001)、Cre偏高(
χ2 =13.060,
P=0.001)、eGFR偏低(
χ2 =19.169,
P=0.002)及血管狭窄程度高(
χ2 =18.076,
P=0.001)的患者术后更易发生MACE。由于结局事件的不平衡分布,对其进行随机过采样处理(
n=5 000)。患者被随机分为训练组(70%)和验证组(30%),训练组3 500例,验证组1 500例,两组间各变量差异无统计学意义(
表2)。
图2也显示,2组间的MACE累积风险发生率曲线经log-rank检验差异无统计学意义(
P=0.760)。
2.2 变量筛选
研究共有78个基线特征变量(缺失比例<30%)作为Lasso回归的候选预测因子。Lasso回归选择部分似然偏差最小的lambda值,最终选取性别、急性心肌梗死类型、高血压、糖尿病、肾功能不全、BMI、LVEF、HCT、BNP、Cre、eGFR、病变冠脉支数、血管狭窄程度、手术方法、植入支架数等15个变量。变量的部分基线特征(Lasso回归筛选结果)见
表1。
以1年内主要心血管不良事件作为结局变量,Lasso回归所选特征作为自变量,进行单因素和多因素Cox回归分析。单因素Cox回归结果显示,有高血压、糖尿病、肾功能不全、LVEF较低(40%~50%和30%~40%)、HCT较低、BNP较高、eGFR 3期的患者预后较差,Cre较低的患者预后较好。多因素Cox回归结果显示,糖尿病、LVEF较低(30%~40%)、血管狭窄程度是术后MACE发生的危险因素。
2.3 模型拟合
将上述选择的15个变量作为独立预测因子用于随机生存森林(RSF)模型开发。在训练过程中选择树的棵树为2 000,从而保证拟合结果的稳健性,并在验证集中对构建的RSF模型进行验证。为了评估RSF模型的判别性能,还比较了RSF模型和Cox模型的C指数和AUC。训练集中,RSF模型的C指数为0.850,AUC为0.850(95%CI=0.843~0.857);Cox模型的C指数为0.606,AUC为0.606(95%CI=0.596~0.616)。验证集中,RSF模型的C指数为0.774,AUC为0.774(95%CI=0.761~0.787);Cox模型的C指数为0.597,AUC为0.597(95%CI=0.581~0.613)。见
图3。同时,预测事件概率的校准曲线表明,该模型在预测1年心血管不良事件风险方面具有较高的准确性(
图4)。
根据变量在RSF模型中的权重来评估变量的重要性,表明单变量对模型的贡献。结果显示,狭窄分级、eGFR、LVEF、支架数量、病变冠状动脉数量、HCT、肾功能不全和高血压与MACE的高风险相关(
图5)。狭窄分级、eGFR和LVEF是该模型的3个主要相关危险因素。
2.4 风险分组
根据RSF模型拟合后的变量重要性对个体风险评分进行计算后,根据风险评分的最佳截断点(Score=133)将患者分为高危组和低危组,高危组585例,低危组3 295例。Log-rank检验结果显示,2组间的主要心血管不良事件累积发生率曲线差异有统计学意义(
P<0.001)。见
图6。
2.5 模型可视化
为了进一步表现RSF模型的结果,绘制了1个PCI术后1年MACE的风险计算器,它可以通过输入相关信息计算每个患者的术后1年MACE风险分值,从而帮助临床医生根据患者风险选择适当的治疗方案。见
图7。以1名有高血压病史、肾功能不全病史、BMI正常、LVEF在40%~50%水平、HCT正常、BNP偏高、Cre偏高、CKD 4期、3支病变冠脉且狭窄程度为严重狭窄、植入3个支架的女性STEMI患者为例,输入相关信息计算可得,该患者的风险评分为216分,属于MACE高危组。
3 讨论
本研究随访的AMI患者术后1年MACE的发病率为12.2%,这与Kong FY等
[12]随访结果类似
[12]。研究还开发了1个基于随机生存森林的预测模型和预后评分用于预测AMI患者PCI术后MACE风险,模型纳入了性别、急性心肌梗死类型、高血压、糖尿病、肾功能不全、BMI、LVEF、HCT、BNP、Cre、eGFR、病变冠脉支数、血管狭窄程度、手术方法、植入支架数等15个变量作为独立预测因子。ROC曲线和校准曲线结果均表明该模型在预测MACE风险上相较于传统模型Cox回归表现更好。此外,基于模型构建的评分能有效地将患者分为不同的风险组,以便临床心血管医生选择合适的治疗策略,从而提高AMI患者术后生活生命质量。
本研究应用随机生存森林算法开发了AMI患者术后MACE的风险预测模型,并与传统生存模型进行了比较。ROC曲线结果显示,RSF模型预测性能优于Cox模型,且在验证集中并未表现出过拟合现象。同时绘制的校准曲线也显示了其在1年MACE上良好的预测性能。Cox回归作为传统经典的生存分析方法
[13-14],目前随着影响因素间的内在交互效应而逐渐显现出不足
[15]。而本研究中的随机生存森林模型将随机森林算法和Cox回归相结合,通过综合多元因素进行非线性生存分析,从而预测AMI患者在行PCI术后1年发生MACE的风险。该模型不仅能很好地区分不同风险人群,而且具有良好的可解释性,可用于临床预后评分构建和患者累计风险曲线绘制。
在RSF模型中,血管狭窄程度、eGFR、LVEF、植入支架数、HCT和肾功能不全是术后心血管不良事件的重要影响因素。血管狭窄程度和LVEF是反映冠状动脉和心脏功能状态的重要指标。在本研究中,血管狭窄程度越高、LVEF越低,术后MACE风险越高,这与李瑞等
[16]研究一致。张鑫等
[17]的前瞻性研究虽并未对LVEF进行分组,但结果仍表明不同水平的LVEF与6个月、12个月、24个月的MACE有关。肾脏状态一直被认为心血管事件的影响因素。术前eGFR水平作为肾功能指标之一,本研究依据KDIGO发布的指南
[18]进行分组,eGFR水平越低的AMI患者相较于正常AMI患者术后预后情况更差,这与赵圣吉等
[19]的研究结果一致,其影响机制可能与肾功能下降引起的蛋白尿等导致血管物质大量丢失有关
[20-21]。而肾功能不全同样反映了患者机体肾脏存在受损,功能状况的下降
[22]。HCT作为临床上判断是否需要补充电解质的实验检查指标之一,其水平的变化也与肾脏功能、心脏状况有关
[23]。此外,研究还发现,植入支架数、病变冠脉支数是预后影响因素,与文献报道一致
[24]。而支架放置和冠脉造影作为PCI术的重要组成部分,植入支架的数目和病变冠脉的数量能在一定程度上反映AMI的严重程度
[25]。
本研究仍存在一些局限性。首先是本研究是单一中心现场,需要进一步的多中心临床队列来提高样本的代表性,从而检验模型及评分的可推广性。其次,此次研究所纳入的临床变量主要是术前检查检验信息和手术信息,后续研究拟增加AMI患者术后指标的收集和分析,提高模型的稳定性和评分的可靠性。
综上所述,本研究构建的RSF模型及评分综合了血管狭窄程度、eGFR、LVEF、植入支架数、HCT和肾功能不全等15个临床因素,能有效预测AMI患者术后MACE发病风险并进行风险分层,帮助临床心血管医生制定个性化治疗方案。