吻合口漏是先天性食管闭锁术后的严重并发症,可导致张力性气胸、脓毒症甚至死亡
[1]。尽早识别危险因素并及时消除危险因素是有效的方法。目前已有较多的文献报道了并确定了一些危险因素
[2- 3],但目前多数文献报道的危险因素并没有深入分析,绝大多数文献只是单纯分析找出了潜在的危险因素,并没有进一步分析相应的风险因素的截断值,使得临床医务工作者对吻合口漏的危险因素的认知仅仅停留在表面。由于无法获得某一危险因素的具体截断值,也就无法通过调整危险因素高于或者低于某个临界值从而降低吻合口漏的风险,这为实际临床工作中有效规避相应的风险因素增加了巨大困难。除此之外,实际临床工作中困扰医务人员另一个较为棘手的问题是,即使当知晓术后出现吻合口漏危险因素后,仍不能快速、直观地计算出某一患儿术后出现吻合口漏的具体概率值;这种信息的不足增加了临床决策的难度,同时也限制了对患儿进行个体化的、精准的治疗方案的制定。
近年来机器学习技术在生物医学研究领域得到了广泛的应用。机器学习的引入为分析危险因素的截断值提供了新的思路,使得全面、准确地评估先天性食管闭锁术后吻合口漏的发生概率成为可能。同时,机器学习在风险分层、诊断分类和生存预测等任务上的强大表现为解决上述问题提供了可能
[4-5]。然而,在先天性食道闭锁领域,这类研究非常少。本研究将机器学习风险预测模型与临床基本指标相结合,为临床工作提供准确可靠的预测模型。此外,本研究采用机器学习技术,通过纳入术前和术中相关变量,并使用多种机器学习算法进行比较,构建了一种术后发生吻合口漏的风险预测模型,并计算出相应危险因素的截断值,同时构建了在线交互式网页计算工具,方便临床医务人员迅速计算出术后出现吻合口漏具体概率。
1 资料与方法
1.1 样本量估算
以二分类结局的研究为例,查阅文献及经验,通常认为每个变量至少需要纳入10个事件,同时,参考既往文献[
6],对于二分类预测模型,样本量的计算公式N=exp{(-0.508+0.259ln(φ)+0.504ln(P)-ln(MAPE))/0.544},本研究纳入的候选预测危险因素为9个,估算出样本量约为240~250例。
1.2 研究对象
本课题组共收集了2009年1月至2021年12月在重庆医科大学附属儿童医院胸心外科接受手术治疗的251例Ⅲ型先天性食道闭锁患者的临床资料,包括患儿人口学特征(出生体重、胎龄、年龄、性别)、手术资料(手术体重、手术日龄、术前白蛋白、术前是否合并肺部感染、合并复杂性先天性心脏病、断端距离)和术后资料(术后白蛋白)。
为了减少干扰因素,本研究收集的所有的病例为行开放手术的患儿,排除胸腔镜手术的病例。采用食管造影和胸部CT三维重建评估气管食管瘘情况,术前应用超声心动图评估先天性心脏病。纳入标准:所有经过食道造影剂胸部CT确诊为Ⅲ型先天性食道闭锁患儿。排除标准:①非Ⅲ型先天性食道闭锁患儿。②临床资料不完全者。③行胸腔镜手术者。本研究方案经本院伦理委员会批准(批准文号:2022-334)同意。
1.3 定义及纳入因素
吻合口漏定义为术后行食道造影在影像学上表现为出现造影剂渗漏并不伴随气道显影,如欧乃派克从吻合口渗漏。纳入病例根据是否发生吻合口漏将患儿分为吻合口漏组和非吻合口漏组。吻合口漏患儿均采用保守治疗,措施包括加强胸腔引流,全静脉营养支持以及应用广谱抗生素。吻合口漏表现为气促、呼吸困难或发绀,患侧呼吸音减弱,胸部X线片部分患者可见大量气胸或液气胸。纳入候选的危险因素为是否合并肺部感染、合并复杂性先天性心脏病、术前白蛋白水平、术后白蛋白水平、出生体质量、手术体质量、胎龄、性别、断端距离作为预测指标。
术前蛋白水平数据来源于术前血液生化检查,术后蛋白水平来源于术后第1天血液生化检查。复杂先天性心脏病的定义为因心力衰竭需要内科或外科治疗的先天性心脏病或紫绀型先天性心脏病
[7]。食道断端距离定义为术中在对食道近端及远端修剪完毕后,吻合食管前测量断端之间的距离。肺部感染定义为术前发生的肺炎,包括以下2项标准:影像学检查(胸部CT或胸部X线)提示或痰培养阳性。
1.4 数据统计
临床资料利用医院电子病历里系统及数字化病例系统进行收集,资料收集者为临床一线护士,为了保证数据收集质量,本研究将由1名医生对1名护士进行培训,由医生参与培训相关指标意义及如何判断其临床参考价值,充分理解每一项因素,完成相关培训后再进行数据收集,同时为了避免不同人员对相关数据理解不一致的情况,所有数据均由同一名护士进行收集。在数据收集过程中,严格按照纳入与排除标准进行数据收集。
1.5 统计学方法及模型构建
1.5.1 变量的筛选
1.5.1.1 单因素分析
分类变量采用卡方检验,计量资料若符合正态分布使用均数±标准差(x±s)表示,2组比较采用t检验,偏态分布资料使用中位数及四分位数间距进行描述,组间比较采用Wilcoxon秩和检验,P<0.05为差异有统计学意义。在进行单因素分析之前,先使用多重共线性检验,筛除多重共线性的变量,将VIF>10的因素剔除,然后再将变量进行单因素分析,检验水准α=0.05。
1.5.1.2 LASSO回归
在LASSO回归(least absolute shrinkage and selection operator,LASSO)分析中,随着λ值增加,变量回归系数逐步归零(λ越大对变量较多的线性模型的惩罚力度就越大)。最终获得一个变量较少的模型,从模型中逐步选出特征变量。
1.5.1.3 影响因子重要度排序
本文使用基于LASSO算法方法实现特征选择,根据变量的得分将候选危险因素进行排序,本研究选择前5个排在前面的候选危险因素。最后本研究将上述3种方式所筛选获得的危险因素取交集,筛选出危险因素。
1.5.2 模型的构建
将整个数据集按照8∶2的比例随机分为训练组和测试组,其中80%的训练数据集用于构建不同的机器学习模型。此外,剩下的20%测试集还将进行内部验证,以确定预测性能并识别最佳预测因子。采用支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、逻辑回归模型(logistic regression,LR)、XGboost分类(eXtreme Gradient Boosting,XGBoost)、高斯朴素贝叶斯(gaussian naive bayes,GNB)这5种机器学习算法来构建预测术后出现吻合口漏的危险因素模型。使用受试者工作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under the curve,AUC)敏感度、特异度和准确度作为模型预测效能的评价指标。同时,本研究将采用Hosmer-Lemeshow检验对模型的校准度进行评价。
1.6 手术方式
所有患儿均采用开胸入路,选择右侧第4肋间作为切口,如影响手术则结扎奇静脉。切断气管食管瘘,并缝闭气管侧瘘管,轻轻游离并修剪近端和远端食管,尽量避免损伤食管血管供应,测量断端之间的距离。采用Vicryl 6-0进行单层端端吻合。在完成吻合之前,胃管经鼻通过食管进入胃。常规置入16F胸腔闭式引流管。
2 结 果
2.1 单因素分析
总共收集251例临床资料。首先进行共线性检测,结果发现所有的危险因素方差膨胀因子(variance inflation factor,VIF)均小于10,具体结果见
表1。共发生吻合口漏43例(17.1%),表现为纵隔炎、胸腔积液或气胸。平均出生体质量为(2.9±0.5) kg。出生孕周为39(38.0,40.0)周。62例患儿合并复杂先天性心脏病。术前蛋白水平为(34.2±4.7) g/L,术后蛋白水平为30.9(25.8,35.7) g/L(
表1)。将术后出现吻合口漏与未出现吻合口漏的患儿进行单因素分析。其中是否合并肺部感染、是否合并复杂先心、出生体质量、术前蛋白水平、断端距离在2组之间有统计学差异。所有发生吻合口漏患儿均接受保守治疗,其中13例死亡或放弃治疗,原因包括严重脓胸、脓毒症、治疗费用高或治疗时间长且无愈合迹象。其余30例(69.7%)患者吻合口漏愈合。19例术后痰培养为阳性,药敏试验结果显示肺炎克雷伯菌是最常见的细菌(6例),其次为铜绿假单胞菌(5例)。所有吻合口漏患儿均接受全肠外营养直至吻合口漏愈合,未出现与全肠外营养相关的严重并发症。
2.2 LASSO回归
在LASSO回归分析中,使用十倍交叉验证最小距离的标准误差的λ为0.048,产生了4个非零系数的特征变量(
图1),对应模型的变量选择为:断端距离、是否合并复杂先心、术前蛋白水平、是否合并肺部感染。
2.3 影响因子重要度排序
使用基于LASSO方法实现特征选择(
图2),重要度排序(由高到低)分别为:是否合并肺部感染、是否合并复杂先心、断端距离、出生体质量、术前蛋白水平、术后蛋白水平、手术体质量、孕周、性别。
2.4 模型的构建及评价
根据上述3种方式所筛选获得的危险因素取交集,筛选出危险因素为是否合并肺部感染、断端距离、是否合并复杂先心、术前白蛋白水平,进一步,本研究采用限制性立方样条分别计算术前白蛋白水平及断端距离的截断值,经计算,术前蛋白水平的截断值为33.9 g/L,断端距离截断值为2.0 cm(
图3、
图4)。
利用筛选出的危险因素进行模型构建,本研究采用SVM、RF、LR、XGboost分类、GNB这5种机器学习算法来构建预测食道闭锁术后出现吻合口漏概率模型。使用ROC曲线中的AUC值、敏感度、特异性和准确率作为模型预测效能的评价指标,同时,本研究将采用Hosmer-Lemeshow检验对模型的校准度进行评价(图
5~
8)。训练集及测试集的具体结果见
表2及
表3。根据训练集AUC结果显示XGboost分类及RF极有可能存在过拟合现象,在逻辑回归模型中,训练集的AUC为0.828,准确度为0.772,F1分数为0.532,验证集的AUC为0.799,准确度为0.765,F1分数为0.544。
在校准曲线中SVM、RF、LR、XGboost分类、GNB这5种机器学习算法的Brier Score(
图7)分别为0.123、0.098、0.096、0.116、0.094。Brier Score越小表示模型的概率预测越准确,误差越小。
综合考虑ROC曲线中的AUC值、DCA曲线(
图8)及校准曲线的结果,本课题组认为逻辑回归模型(LR)模型有较为稳定的结果输出。
2.5 风险列线图预测模型及在线交互式网页计算工具构建
根据上面机器学习结果,逻辑回归模型为最理想的计算模型,利用逻辑回归模型,构建包含断端距离、是否合并复杂先心、术前蛋白水平、是否肺部感染共4个食道闭锁术后出现吻合口漏的独立风险因素的预测模型,并绘制相应列线图并展示(
图9)。计算总分后根据列线图可获得所对应食道闭锁术后出现吻合口漏的概率。为了方便临床一线工作者快速、准确地计算出食道闭锁术后发生吻合口漏的具体概率,本研究构建了在线交互式网页计算工具,具体网址为:
https://yixuetongji.shinyapps.io/dynnomapp/,更进一步,为了更好的体现个性化护理,方便将该模型运用于实际临床工作中,让临床一线医务人员迅速辨别某一病例是否为术后出现吻合口漏高危或低危患儿,本研究将所有样本所得到的出现吻合口漏的概率进行分度,按照获得的概率的第25百分位数、第75百分位数分为低风险组(≤0.25分位数)、中风险组(0.25分位数-0.75分位数)及高风险组(>0.75分位数),得到的风险阈值分别为51%及56%,即低风险区间为风险值小于51%,中风险区间为51%~56%,高风险区间为风险值大于56%(见
图10)。医务人员可以根据计算得到的概率方便、迅速定位于术后出现吻合口漏为高危或者低危组。如
图11所展示,该患儿术前合并复杂先心、术前合并肺部感染、断端距离为2.1 cm,术前蛋白水平为27.8 g/L,计算出该患儿术后出现吻合口漏概率为78.4%,参照风险分层,该患儿为术后出现吻合口漏的高危患儿。
3 讨 论
吻合口漏作为Ⅲ型先天性食道闭锁患儿术后严重并发症,总体发生率为15%~20%,甚至高达30%
[8-9],大量文献探讨了术后出现吻合口漏的危险因素,但多数文献并没有对相应危险因素进一步分析。临床医务工作者在实际工作中无法得知相应危险因素是否高于或者低于某一标准而增加术后出现吻合口漏的风险,也无法计算某一患儿术后出现吻合口漏的具体概率,从而判断术后高危或者低危出现吻合口漏。
本研究利用SVM、RF、LR、XGboost分类、GNB这5种机器学习算法来构建预测食道闭锁术后出现吻合口漏的危险因素模型。确定LR模型有更好的稳定性,并发现断端距离、术前蛋白水平、是否合并肺部感染及是否合并复杂先心是术后出现吻合口漏的危险因素,利用限制性立方样条得到了断端距离及术前蛋白水平的截断值分别为2 cm及33.9 g/L。同时,本研究构建了在线交互式网页计算工具,极大地方便了医务工作者临床实际使用。利用计算出的概率,比对本研究获得的危险分层,就可得知术后是否是出现吻合口漏概率分层。
通过获得危险因素的截断值,医务人员可具体判断各个危险因素对吻合口漏发生的影响。截断值是一种阈值,表示某一危险因素的具体数值,使得在该数值以上或以下,患者发生吻合口漏的风险会显著增加或降低。这种客观、精确的信息让医务人员能够更全面、深入地了解患者的风险状况。
首先,截断值的引入使医务人员能够更直观地对患儿术后出现吻合口漏的风险进行预判。通过将患儿相应指标的实际情况与截断值进行对比,可以事先预判患儿是否是发生吻合口漏的高危群体,从而更有针对性地采取预防措施,降低吻合口漏的概率。其次,截断值的使用有助于实现个体化治疗。医务人员可以根据患者的具体情况,通过比较各项危险因素的截断值,为每位患者制定量身定制的治疗计划,使得治疗更具针对性。例如,若某一患儿术前蛋白水平低于33.9 g/L,入院后即需要补充蛋白,努力将蛋白维持在33.9 g/L以上。另外,截断值的引入还有助于深化对危险因素作用机制的理解。通过对截断值的分析,医务人员能够更好地理解某一危险因素何时会成为临界点。这为进一步的研究提供了方向,有助于发现新的治疗方向或制定更有效的干预策略。
除此之外,本研究还构建了一个交互式网页计算工具,它可以为医务人员提供了实时、直观地计算患儿术后出现吻合口漏的概率。这种工具的用户友好性是其一大优势,使医生、护士等临床一线人员无需专业的统计学知识,通过简单的界面输入患者信息即可获得实时的吻合口漏概率值。首先,实时计算的优势在于及时性。医务人员可以在临床中迅速获取患者的风险评估结果,无需等待繁琐的计算过程。这使得在紧急情况下,医生能够迅速制定治疗计划,提高了临床工作的效率。其次,交互式网页计算工具易于操作。医生、护士等专业人员无需深入了解数学模型的复杂性,通过直观的界面输入患者信息,就能够得到清晰地计算出术后出现吻合口漏的概率。降低了使用门槛,使更多的医务人员能够充分利用这一工具。同时,当医务人员获得该结果后,可以更好的与家属进行沟通,避免医患矛盾升级,获得家属的理解。此外,交互式网页计算工具的使用有助于促进医疗团队之间的协作。实时计算结果可以在团队内共享,不同专业人员之间能够就患者的风险情况展开讨论。这种协作模式有助于制定更全面、协同的治疗决策,提高了团队整体的工作效率和治疗质量。
文献报道吻合口漏的危险因素包括吻合技术差、编织缝线的使用、双层吻合、断端距离长、术后输血、吻合口张力高和胃食管反流
[1]。其他研究表明,吻合口漏的独立危险因素是长间隙
[10]、分期修补、胸腔镜手术和吻合口张力高
[11-12],上述研究获得的危险因素与本研究发现的危险因素相似。断端距离大,吻合口张力就大,引起营养血管的牵拉,最终导致食管供血减少,此外,长段缺失型食管闭锁通常需要广泛游离食管残端,这也会损伤食管的血管供应。本研究计算出断端距离的截断值(
HR/
OR=1)为2.0 cm,这表明当断端距离超过2.0 cm后出现吻合口漏的风险将显著增加。术前白蛋白也是导致吻合口漏的重要危险因素,其截断值(
HR/
OR=1)为33.9 g/L。低蛋白血症常导致组织水肿,组织间液增多,加重缺氧缺血,绝大多数外科医生都注意到术后补充蛋白是重要的术后支持治疗,但往往忽略了术前补充蛋白,食道闭锁患儿术前由于食道畸形的存在,无法进食,加之患儿术前甚至需呼吸机辅助呼吸,消耗极大,极易出现新生儿硬肿症的发生,从而导致术后出现吻合口漏。由于食道闭锁特殊的解剖生理结构气管食管瘘的存在,胃内容物(如胃酸甚至消化道分泌的胆汁样物质)可能进入气道,加重了气道及肺部损伤,导致患儿术前就出现肺部感染,若该患儿需气管插管,则术前可能出现严重的肺部感染,甚至感染一些毒力较强的细菌,如肺炎克雷伯菌,术后往往更容易出现吻合口漏。术前合并复杂先心患者因伴发心力衰竭,而心力衰竭导致水潴留、尿少,组织水肿明显、气管插管时间延长,加重肺部感染,同样也会更容易出现吻合口漏。
随着机器学习方法逐步在临床医学研究中的广泛开展,人工智能和机器学习备受青睐,机器学习建立的模型可以利用所有患者的数据集实现早期动态监测,从而节省临床医生的时间
[13],目前已广泛应用于重症监护医学
[14-15] 、急诊医学
[16]和神经医学等领域
[17]。本研究利用机器学习,构建了准确的食道闭锁术后吻合口漏的预测模型,同时获得相应危险因素的截断值,构建了交互式网页计算工具,这是利用机器学习模型在新生儿食道闭锁领域的初步探索。由于经验的缺乏,本研究有一些局限性。首先,这是1项回顾性单中心分析,病例的选择均为本中心的治疗经验,所有数据均来自本院,由于医疗实践和医疗环境的差异,该模型在应用于其他医疗机构时的有效性可能会有所不同。因此,通过使用独立的外部数据集来验证模型的可泛化性和外推性至关重要。且它是在欠发达地区进行的,受到经济和技术方面的限制。其次,由于食道闭锁发病率不高,无法形成大样本数据,同时术后出现吻合口漏病例的样本量不够大,并且为回顾性研究,使得模型在训练集及测试集中的稳定性有所欠缺,未来需扩大样本量甚至多中心合作。第三,该交互式网页计算工具没有在临床大规模运用。虽然没有在临床运用,但在构建模型过程中使用了交叉验证及测试集验证,保证了较好的准确度,在风险因素筛选中,本研究使用了单因素分析、LASSO回归及重要度排序,尽可能获得准确的风险因素,下一步,本研究将该工具在临床使用规模。