基于机器学习算法构建食道闭锁术后吻合口漏概率在线交互式网页计算工具及相应风险分层系统

魏晓钦; 项明; 申玉洁; 邱宏翔; 廖福清; 潘征夏; 吴春; 习林云

doi:10.13406/j.cnki.cyxb.003623

重庆医科大学学报 ›› 2024, Vol. 49 ›› Issue (11) : 1457 -1464. DOI: 10.13406/j.cnki.cyxb.003623

临床研究

基于机器学习算法构建食道闭锁术后吻合口漏概率在线交互式网页计算工具及相应风险分层系统

作者信息 +

Construction of an online interactive calculation tool and corresponding risk stratification system for the probability of postoperative anastomotic leak in esophageal atresia based on machine learning algorithms

Author information +

文章历史 +

PDF (2559K)

摘要

目的利用机器学习技术对食道闭锁术后出现吻合口漏进行预测，寻找导致术后出现吻合口漏的危险因素，计算相应截断值，并制作交互式网页计算工具，方便医务人员快速计算术后出现吻合口漏的具体风险概率。方法收集2009年1月至2021年12月在重庆医科大学附属儿童医院胸心外科接受手术治疗的251例Ⅲ型先天性食道闭锁患者的临床资料。包括患儿人口学特征、手术资料和术后资料。本课题组采用支持向量机（support vector machine，SVM）、随机森林（random forest，RF）、逻辑回归模型（logistic regression，LR）、XGboost分类（eXtreme gradient boosting，XGBoost）、高斯朴素贝叶斯（gaussian naive bayes，GNB）这5种机器学习算法来构建预测食道闭锁术后吻合口漏的预测模型。利用受试者工作特征（receiver operating characteristic，ROC）曲线的曲线下面积（area under thecurve，AUC）评价效度，同时综合F1分数、准确率、灵敏度及特异度，Hosmer-Lemeshow检验Brier分数评价校准度及临床决策曲线（decision curve analysis，DCA曲线）对模型的校准度及稳定性进行评价。利用限制性立方样条分别计算相应危险因素的截断值，最后制作交互式网页计算工具，构建术后吻合口漏风险分层系统，方便医务人员快速使用。结果通过对候选风险因素进行单因素分析、重要度排序、LASSO回归（least absolute shrinkage and selection operator，LASSO）筛选出危险因素为断端距离、是否合并复杂先心、术前蛋白、是否合并肺部感染。在5种机器学习算法中，逻辑回归模型在ROC曲线和DCA性能及校准曲线综合指标方面表现最佳，在逻辑回归模型中，训练集的AUC为0.828，准确度为0.772，F1分数为0.532，验证集的AUC为0.799，准确度为0.765，F1分数为0.544。提示该模型用于预测Ⅲ型先天性食道闭锁术后出现吻合口漏有较好的区分度及校准度。利用限制性立方样条，计算了断端距离及术前蛋白的截断值分别为2 cm及33.9 g/L，临床医务人员可以利用在线交互式网页计算工具，输入相应危险因素的结果，计算出某1个患者术后出现吻合口漏的具体概率值。结论逻辑回归模型可较好地预测Ⅲ型先天性食道闭锁患儿术后出现吻合口漏危险因素，在线交互式网页计算工具可以迅速地计算出术后吻合口漏的概率，方便医务人员使用。

Abstract

Objective To predict postoperative anastomotic leak in esophageal atresia using machine learning techniques，to identify the risk factors for postoperative anastomotic leak，to calculate corresponding cut-off values，to develop an interactive web-based tool，and to help healthcare professionals quickly calculate the specific risk probability of postoperative anastomotic leak. Methods Clinical data were collected from 251 patients with type Ⅲ congenital esophageal atresia who underwent surgical treatment in our hospital from January 2009 to December 2021，including demographic features，surgical data，and postoperative data. Five machine learning algorithms，i.e.，support vector machine（SVM），random forest （RF），logistic regression（LR），XGBoost，and Gaussian naive Bayes（GNB），were used to construct a predictive model for anastomotic leak after esophageal atresia repair. The area under the ROC curve（AUC），F1 score，accuracy，sensitivity，and specificity were used to evaluate the validity of the model，the Hosmer-Lemeshow test and Brier score were used to evaluate the degree of calibration，and the decision curve analysis （DCA curve） was used to evaluate the degree of calibration and stability. Restricted cubic spline techniques were used to calculate the cut-off value of each risk factor，and then an interactive web-based calculation tool was developed to establish a risk stratification system for postoperative anastomotic leak，which was used to facilitate healthcare professionals in convenient application. Results The univariate analysis，importance ranking，and LASSO regression were performed for candidate risk factors，and the results showed that the distance between the ends of the esophageal gap，presence or absence of complex congenital heart disease，preoperative protein level，and presence or absence of pulmonary infection were the risk factors for postoperative anastomotic leak. Among the five machine learning algorithms，the logistic regression model exhibited the best performance in terms of AUC，DCA，and calibration curve，with an AUC of 0.828，an accuracy of 0.772，and an F1 score of 0.532 in the training set and an AUC of 0.799，an accuracy of 0.765，and an F1 score of 0.544 in the validation set，suggesting that the model had good discriminatory ability and degree of calibration in predicting postoperative anastomotic leak in type Ⅲcongenital esophageal atresia. Meanwhile，the restricted cubic spline analysis showed that the distance between the ends of the esophageal gap and preoperative protein level had a cut-off value of 2 cm and 33.9 g/L，respectively，and healthcare professionals could use the online interactive web-based tool to input the results of related risk factors and calculate the specific probability of postoperative anastomotic leak for a given patient. Conclusion The logistic regression model can predict the risk factors for postoperative anastomotic leak in patients with type Ⅲ congenital esophageal atresia，and the online interactive web-based tool is designed to quickly calculate the probability of postoperative anastomotic leak，thereby providing convenience for healthcare professionals.

Graphical abstract

关键词

食道闭锁 / 机器学习 / 预测

Key words

esophageal atresia / machine learning / prediction

引用本文

引用格式 ▾

魏晓钦,项明,申玉洁,邱宏翔,廖福清,潘征夏,吴春,习林云. 基于机器学习算法构建食道闭锁术后吻合口漏概率在线交互式网页计算工具及相应风险分层系统[J]. 重庆医科大学学报, 2024, 49(11): 1457-1464 DOI:10.13406/j.cnki.cyxb.003623

登录浏览全文

4963

注册一个新账户忘记密码

吻合口漏是先天性食管闭锁术后的严重并发症，可导致张力性气胸、脓毒症甚至死亡^[1]。尽早识别危险因素并及时消除危险因素是有效的方法。目前已有较多的文献报道了并确定了一些危险因素^{[2- 3]}，但目前多数文献报道的危险因素并没有深入分析，绝大多数文献只是单纯分析找出了潜在的危险因素，并没有进一步分析相应的风险因素的截断值，使得临床医务工作者对吻合口漏的危险因素的认知仅仅停留在表面。由于无法获得某一危险因素的具体截断值，也就无法通过调整危险因素高于或者低于某个临界值从而降低吻合口漏的风险，这为实际临床工作中有效规避相应的风险因素增加了巨大困难。除此之外，实际临床工作中困扰医务人员另一个较为棘手的问题是，即使当知晓术后出现吻合口漏危险因素后，仍不能快速、直观地计算出某一患儿术后出现吻合口漏的具体概率值；这种信息的不足增加了临床决策的难度，同时也限制了对患儿进行个体化的、精准的治疗方案的制定。

近年来机器学习技术在生物医学研究领域得到了广泛的应用。机器学习的引入为分析危险因素的截断值提供了新的思路，使得全面、准确地评估先天性食管闭锁术后吻合口漏的发生概率成为可能。同时，机器学习在风险分层、诊断分类和生存预测等任务上的强大表现为解决上述问题提供了可能^[4-5]。然而，在先天性食道闭锁领域，这类研究非常少。本研究将机器学习风险预测模型与临床基本指标相结合，为临床工作提供准确可靠的预测模型。此外，本研究采用机器学习技术，通过纳入术前和术中相关变量，并使用多种机器学习算法进行比较，构建了一种术后发生吻合口漏的风险预测模型，并计算出相应危险因素的截断值，同时构建了在线交互式网页计算工具，方便临床医务人员迅速计算出术后出现吻合口漏具体概率。

1 资料与方法

1.1 样本量估算

以二分类结局的研究为例，查阅文献及经验，通常认为每个变量至少需要纳入10个事件，同时，参考既往文献[6]，对于二分类预测模型，样本量的计算公式N=exp{（-0.508+0.259ln（φ）+0.504ln（P）-ln（MAPE））/0.544}，本研究纳入的候选预测危险因素为9个，估算出样本量约为240~250例。

1.2 研究对象

本课题组共收集了2009年1月至2021年12月在重庆医科大学附属儿童医院胸心外科接受手术治疗的251例Ⅲ型先天性食道闭锁患者的临床资料，包括患儿人口学特征（出生体重、胎龄、年龄、性别）、手术资料（手术体重、手术日龄、术前白蛋白、术前是否合并肺部感染、合并复杂性先天性心脏病、断端距离）和术后资料（术后白蛋白）。

为了减少干扰因素，本研究收集的所有的病例为行开放手术的患儿，排除胸腔镜手术的病例。采用食管造影和胸部CT三维重建评估气管食管瘘情况，术前应用超声心动图评估先天性心脏病。纳入标准:所有经过食道造影剂胸部CT确诊为Ⅲ型先天性食道闭锁患儿。排除标准：①非Ⅲ型先天性食道闭锁患儿。②临床资料不完全者。③行胸腔镜手术者。本研究方案经本院伦理委员会批准（批准文号：2022-334）同意。

1.3 定义及纳入因素

吻合口漏定义为术后行食道造影在影像学上表现为出现造影剂渗漏并不伴随气道显影，如欧乃派克从吻合口渗漏。纳入病例根据是否发生吻合口漏将患儿分为吻合口漏组和非吻合口漏组。吻合口漏患儿均采用保守治疗，措施包括加强胸腔引流，全静脉营养支持以及应用广谱抗生素。吻合口漏表现为气促、呼吸困难或发绀，患侧呼吸音减弱，胸部X线片部分患者可见大量气胸或液气胸。纳入候选的危险因素为是否合并肺部感染、合并复杂性先天性心脏病、术前白蛋白水平、术后白蛋白水平、出生体质量、手术体质量、胎龄、性别、断端距离作为预测指标。

术前蛋白水平数据来源于术前血液生化检查，术后蛋白水平来源于术后第1天血液生化检查。复杂先天性心脏病的定义为因心力衰竭需要内科或外科治疗的先天性心脏病或紫绀型先天性心脏病^[7]。食道断端距离定义为术中在对食道近端及远端修剪完毕后，吻合食管前测量断端之间的距离。肺部感染定义为术前发生的肺炎，包括以下2项标准:影像学检查（胸部CT或胸部X线）提示或痰培养阳性。

1.4 数据统计

临床资料利用医院电子病历里系统及数字化病例系统进行收集，资料收集者为临床一线护士，为了保证数据收集质量，本研究将由1名医生对1名护士进行培训，由医生参与培训相关指标意义及如何判断其临床参考价值，充分理解每一项因素，完成相关培训后再进行数据收集，同时为了避免不同人员对相关数据理解不一致的情况，所有数据均由同一名护士进行收集。在数据收集过程中，严格按照纳入与排除标准进行数据收集。

1.5 统计学方法及模型构建

1.5.1 变量的筛选

1.5.1.1 单因素分析

分类变量采用卡方检验，计量资料若符合正态分布使用均数±标准差（x±s）表示，2组比较采用t检验，偏态分布资料使用中位数及四分位数间距进行描述，组间比较采用Wilcoxon秩和检验，P<0.05为差异有统计学意义。在进行单因素分析之前，先使用多重共线性检验，筛除多重共线性的变量，将VIF>10的因素剔除，然后再将变量进行单因素分析，检验水准α=0.05。

1.5.1.2 LASSO回归

在LASSO回归（least absolute shrinkage and selection operator，LASSO）分析中，随着λ值增加，变量回归系数逐步归零（λ越大对变量较多的线性模型的惩罚力度就越大）。最终获得一个变量较少的模型，从模型中逐步选出特征变量。

1.5.1.3 影响因子重要度排序

本文使用基于LASSO算法方法实现特征选择，根据变量的得分将候选危险因素进行排序，本研究选择前5个排在前面的候选危险因素。最后本研究将上述3种方式所筛选获得的危险因素取交集，筛选出危险因素。

1.5.2 模型的构建

将整个数据集按照8∶2的比例随机分为训练组和测试组，其中80%的训练数据集用于构建不同的机器学习模型。此外，剩下的20%测试集还将进行内部验证，以确定预测性能并识别最佳预测因子。采用支持向量机（support vector machine，SVM）、随机森林（random forest，RF）、逻辑回归模型（logistic regression，LR）、XGboost分类（eXtreme Gradient Boosting，XGBoost）、高斯朴素贝叶斯（gaussian naive bayes，GNB）这5种机器学习算法来构建预测术后出现吻合口漏的危险因素模型。使用受试者工作特征（receiver operating characteristic，ROC）曲线的曲线下面积（area under the curve，AUC）敏感度、特异度和准确度作为模型预测效能的评价指标。同时，本研究将采用Hosmer-Lemeshow检验对模型的校准度进行评价。

1.6 手术方式

所有患儿均采用开胸入路，选择右侧第4肋间作为切口，如影响手术则结扎奇静脉。切断气管食管瘘，并缝闭气管侧瘘管，轻轻游离并修剪近端和远端食管，尽量避免损伤食管血管供应，测量断端之间的距离。采用Vicryl 6-0进行单层端端吻合。在完成吻合之前，胃管经鼻通过食管进入胃。常规置入16F胸腔闭式引流管。

2 结果

2.1 单因素分析

总共收集251例临床资料。首先进行共线性检测，结果发现所有的危险因素方差膨胀因子（variance inflation factor，VIF）均小于10，具体结果见表1。共发生吻合口漏43例（17.1%），表现为纵隔炎、胸腔积液或气胸。平均出生体质量为（2.9±0.5） kg。出生孕周为39（38.0，40.0）周。62例患儿合并复杂先天性心脏病。术前蛋白水平为（34.2±4.7） g/L，术后蛋白水平为30.9（25.8，35.7） g/L（表1）。将术后出现吻合口漏与未出现吻合口漏的患儿进行单因素分析。其中是否合并肺部感染、是否合并复杂先心、出生体质量、术前蛋白水平、断端距离在2组之间有统计学差异。所有发生吻合口漏患儿均接受保守治疗，其中13例死亡或放弃治疗，原因包括严重脓胸、脓毒症、治疗费用高或治疗时间长且无愈合迹象。其余30例（69.7%）患者吻合口漏愈合。19例术后痰培养为阳性，药敏试验结果显示肺炎克雷伯菌是最常见的细菌（6例），其次为铜绿假单胞菌（5例）。所有吻合口漏患儿均接受全肠外营养直至吻合口漏愈合，未出现与全肠外营养相关的严重并发症。

2.2 LASSO回归

在LASSO回归分析中，使用十倍交叉验证最小距离的标准误差的λ为0.048，产生了4个非零系数的特征变量（图1），对应模型的变量选择为：断端距离、是否合并复杂先心、术前蛋白水平、是否合并肺部感染。

2.3 影响因子重要度排序

使用基于LASSO方法实现特征选择（图2），重要度排序（由高到低）分别为：是否合并肺部感染、是否合并复杂先心、断端距离、出生体质量、术前蛋白水平、术后蛋白水平、手术体质量、孕周、性别。

2.4 模型的构建及评价

根据上述3种方式所筛选获得的危险因素取交集，筛选出危险因素为是否合并肺部感染、断端距离、是否合并复杂先心、术前白蛋白水平，进一步，本研究采用限制性立方样条分别计算术前白蛋白水平及断端距离的截断值，经计算，术前蛋白水平的截断值为33.9 g/L，断端距离截断值为2.0 cm（图3、图4）。

利用筛选出的危险因素进行模型构建，本研究采用SVM、RF、LR、XGboost分类、GNB这5种机器学习算法来构建预测食道闭锁术后出现吻合口漏概率模型。使用ROC曲线中的AUC值、敏感度、特异性和准确率作为模型预测效能的评价指标，同时，本研究将采用Hosmer-Lemeshow检验对模型的校准度进行评价（图5~8）。训练集及测试集的具体结果见表2及表3。根据训练集AUC结果显示XGboost分类及RF极有可能存在过拟合现象，在逻辑回归模型中，训练集的AUC为0.828，准确度为0.772，F1分数为0.532，验证集的AUC为0.799，准确度为0.765，F1分数为0.544。

在校准曲线中SVM、RF、LR、XGboost分类、GNB这5种机器学习算法的Brier Score（图7）分别为0.123、0.098、0.096、0.116、0.094。Brier Score越小表示模型的概率预测越准确，误差越小。

综合考虑ROC曲线中的AUC值、DCA曲线（图8）及校准曲线的结果，本课题组认为逻辑回归模型（LR）模型有较为稳定的结果输出。

2.5 风险列线图预测模型及在线交互式网页计算工具构建

根据上面机器学习结果，逻辑回归模型为最理想的计算模型，利用逻辑回归模型，构建包含断端距离、是否合并复杂先心、术前蛋白水平、是否肺部感染共4个食道闭锁术后出现吻合口漏的独立风险因素的预测模型，并绘制相应列线图并展示（图9）。计算总分后根据列线图可获得所对应食道闭锁术后出现吻合口漏的概率。为了方便临床一线工作者快速、准确地计算出食道闭锁术后发生吻合口漏的具体概率，本研究构建了在线交互式网页计算工具，具体网址为:https://yixuetongji.shinyapps.io/dynnomapp/，更进一步，为了更好的体现个性化护理，方便将该模型运用于实际临床工作中，让临床一线医务人员迅速辨别某一病例是否为术后出现吻合口漏高危或低危患儿，本研究将所有样本所得到的出现吻合口漏的概率进行分度，按照获得的概率的第25百分位数、第75百分位数分为低风险组（≤0.25分位数）、中风险组（0.25分位数-0.75分位数）及高风险组（>0.75分位数），得到的风险阈值分别为51%及56%，即低风险区间为风险值小于51%，中风险区间为51%～56%，高风险区间为风险值大于56%（见图10）。医务人员可以根据计算得到的概率方便、迅速定位于术后出现吻合口漏为高危或者低危组。如图11所展示，该患儿术前合并复杂先心、术前合并肺部感染、断端距离为2.1 cm，术前蛋白水平为27.8 g/L，计算出该患儿术后出现吻合口漏概率为78.4%，参照风险分层，该患儿为术后出现吻合口漏的高危患儿。

3 讨论

吻合口漏作为Ⅲ型先天性食道闭锁患儿术后严重并发症，总体发生率为15%～20%，甚至高达30%^[8-9]，大量文献探讨了术后出现吻合口漏的危险因素，但多数文献并没有对相应危险因素进一步分析。临床医务工作者在实际工作中无法得知相应危险因素是否高于或者低于某一标准而增加术后出现吻合口漏的风险，也无法计算某一患儿术后出现吻合口漏的具体概率，从而判断术后高危或者低危出现吻合口漏。

本研究利用SVM、RF、LR、XGboost分类、GNB这5种机器学习算法来构建预测食道闭锁术后出现吻合口漏的危险因素模型。确定LR模型有更好的稳定性，并发现断端距离、术前蛋白水平、是否合并肺部感染及是否合并复杂先心是术后出现吻合口漏的危险因素，利用限制性立方样条得到了断端距离及术前蛋白水平的截断值分别为2 cm及33.9 g/L。同时，本研究构建了在线交互式网页计算工具，极大地方便了医务工作者临床实际使用。利用计算出的概率，比对本研究获得的危险分层，就可得知术后是否是出现吻合口漏概率分层。

通过获得危险因素的截断值，医务人员可具体判断各个危险因素对吻合口漏发生的影响。截断值是一种阈值，表示某一危险因素的具体数值，使得在该数值以上或以下，患者发生吻合口漏的风险会显著增加或降低。这种客观、精确的信息让医务人员能够更全面、深入地了解患者的风险状况。

首先，截断值的引入使医务人员能够更直观地对患儿术后出现吻合口漏的风险进行预判。通过将患儿相应指标的实际情况与截断值进行对比，可以事先预判患儿是否是发生吻合口漏的高危群体，从而更有针对性地采取预防措施，降低吻合口漏的概率。其次，截断值的使用有助于实现个体化治疗。医务人员可以根据患者的具体情况，通过比较各项危险因素的截断值，为每位患者制定量身定制的治疗计划，使得治疗更具针对性。例如，若某一患儿术前蛋白水平低于33.9 g/L，入院后即需要补充蛋白，努力将蛋白维持在33.9 g/L以上。另外，截断值的引入还有助于深化对危险因素作用机制的理解。通过对截断值的分析，医务人员能够更好地理解某一危险因素何时会成为临界点。这为进一步的研究提供了方向，有助于发现新的治疗方向或制定更有效的干预策略。

除此之外，本研究还构建了一个交互式网页计算工具，它可以为医务人员提供了实时、直观地计算患儿术后出现吻合口漏的概率。这种工具的用户友好性是其一大优势，使医生、护士等临床一线人员无需专业的统计学知识，通过简单的界面输入患者信息即可获得实时的吻合口漏概率值。首先，实时计算的优势在于及时性。医务人员可以在临床中迅速获取患者的风险评估结果，无需等待繁琐的计算过程。这使得在紧急情况下，医生能够迅速制定治疗计划，提高了临床工作的效率。其次，交互式网页计算工具易于操作。医生、护士等专业人员无需深入了解数学模型的复杂性，通过直观的界面输入患者信息，就能够得到清晰地计算出术后出现吻合口漏的概率。降低了使用门槛，使更多的医务人员能够充分利用这一工具。同时，当医务人员获得该结果后，可以更好的与家属进行沟通，避免医患矛盾升级，获得家属的理解。此外，交互式网页计算工具的使用有助于促进医疗团队之间的协作。实时计算结果可以在团队内共享，不同专业人员之间能够就患者的风险情况展开讨论。这种协作模式有助于制定更全面、协同的治疗决策，提高了团队整体的工作效率和治疗质量。

文献报道吻合口漏的危险因素包括吻合技术差、编织缝线的使用、双层吻合、断端距离长、术后输血、吻合口张力高和胃食管反流^[1]。其他研究表明，吻合口漏的独立危险因素是长间隙^[10]、分期修补、胸腔镜手术和吻合口张力高^[11-12]，上述研究获得的危险因素与本研究发现的危险因素相似。断端距离大，吻合口张力就大，引起营养血管的牵拉，最终导致食管供血减少，此外，长段缺失型食管闭锁通常需要广泛游离食管残端，这也会损伤食管的血管供应。本研究计算出断端距离的截断值（HR/OR=1）为2.0 cm，这表明当断端距离超过2.0 cm后出现吻合口漏的风险将显著增加。术前白蛋白也是导致吻合口漏的重要危险因素，其截断值（HR/OR=1）为33.9 g/L。低蛋白血症常导致组织水肿，组织间液增多，加重缺氧缺血，绝大多数外科医生都注意到术后补充蛋白是重要的术后支持治疗，但往往忽略了术前补充蛋白，食道闭锁患儿术前由于食道畸形的存在，无法进食，加之患儿术前甚至需呼吸机辅助呼吸，消耗极大，极易出现新生儿硬肿症的发生，从而导致术后出现吻合口漏。由于食道闭锁特殊的解剖生理结构气管食管瘘的存在，胃内容物（如胃酸甚至消化道分泌的胆汁样物质）可能进入气道，加重了气道及肺部损伤，导致患儿术前就出现肺部感染，若该患儿需气管插管，则术前可能出现严重的肺部感染，甚至感染一些毒力较强的细菌，如肺炎克雷伯菌，术后往往更容易出现吻合口漏。术前合并复杂先心患者因伴发心力衰竭，而心力衰竭导致水潴留、尿少，组织水肿明显、气管插管时间延长，加重肺部感染，同样也会更容易出现吻合口漏。

随着机器学习方法逐步在临床医学研究中的广泛开展，人工智能和机器学习备受青睐，机器学习建立的模型可以利用所有患者的数据集实现早期动态监测，从而节省临床医生的时间^[13]，目前已广泛应用于重症监护医学^[14-15] 、急诊医学^[16]和神经医学等领域^[17]。本研究利用机器学习，构建了准确的食道闭锁术后吻合口漏的预测模型，同时获得相应危险因素的截断值，构建了交互式网页计算工具，这是利用机器学习模型在新生儿食道闭锁领域的初步探索。由于经验的缺乏，本研究有一些局限性。首先，这是1项回顾性单中心分析，病例的选择均为本中心的治疗经验，所有数据均来自本院，由于医疗实践和医疗环境的差异，该模型在应用于其他医疗机构时的有效性可能会有所不同。因此，通过使用独立的外部数据集来验证模型的可泛化性和外推性至关重要。且它是在欠发达地区进行的，受到经济和技术方面的限制。其次，由于食道闭锁发病率不高，无法形成大样本数据，同时术后出现吻合口漏病例的样本量不够大，并且为回顾性研究，使得模型在训练集及测试集中的稳定性有所欠缺，未来需扩大样本量甚至多中心合作。第三，该交互式网页计算工具没有在临床大规模运用。虽然没有在临床运用，但在构建模型过程中使用了交叉验证及测试集验证，保证了较好的准确度，在风险因素筛选中，本研究使用了单因素分析、LASSO回归及重要度排序，尽可能获得准确的风险因素，下一步，本研究将该工具在临床使用规模。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Spitz L， Kiely E， Brereton RJ. Esophageal atresia:five year experience with 148 cases[J]. J Pediatr Surg，1987，22（2）：103-108．

[2]	Hong SM， Chen Q， Cao H，et al. Developing a new predictive index for anastomotic leak following the anastomosis of esophageal atresia：preliminary results from a single centre[J]. J Cardiothorac Surg，2022，17（1）：131．

[3]	Bowder AN， Lal DR. Advances in the surgical management of esophageal atresia[J]. Adv Pediatr，2021，68：245-259．

[4]	Zhang LM， Zhang F， Xu FS，et al. Construction and evaluation of a sepsis risk prediction model for urinary tract infection[J]. Front Med，2021，8：671184．

[5]	Xu FS， Zhang LM， Wang ZC，et al. A new scoring system for predicting In-hospital death in patients having liver cirrhosis with esophageal varices[J]. Front Med，2021，8：678646．

[6]	Riley RD， Ensor J， Snell KIE，et al. Calculating the sample size required for developing a clinical prediction model[J]. BMJ，2020，368：m441．

[7]	Tan Tanny SP， Beck C， King SK，et al. Survival trends and syndromic esophageal atresia[J]. Pediatrics，2021，147（5）：e2020029884．

[8]	Upadhyaya VD， Gangopadhyaya AN， Gupta DK，et al. Prognosis of congenital tracheoesophageal fistula with esophageal atresia on the basis of gap length[J]. Pediatr Surg Int，2007，23（8）：767-771．

[9]	Laberge JM， Lévesque D， Baird R. Anastomotic stricture after esophageal atresia repair:a critical review of recent literature[J]. Eur J Pediatr Surg，2013，23（3）：204-213．

[10]	Shah R， Varjavandi V， Krishnan U. Predictive factors for complications in children with esophageal atresia and tracheoesophageal fistula[J]. Dis Esophagus，2015，28（3）：216-223．

[11]	Nice TT， Tuanama Diaz B， Shroyer M，et al. Risk factors for stricture formation after esophageal atresia repair[J]. J Laparoendosc Adv Surg Tech A，2016，26（5）：393-398．

[12]	Michaud L， Guimber D， Sfeir R，et al. Anastomotic stenosis after surgical treatment of esophageal atresia:frequency，risk factors and effectiveness of esophageal dilatations[J]. Arch Pediatr，2001，8（3）：268-274．

[13]	Li Q， Fan QL， Han QX，et al. Machine learning in nephrology:scratching the surface[J]. Chin Med J，2020，133（6）：687-698．

[14]	Kendale S， Kulkarni P， Rosenberg AD，et al. Supervised machine-learning predictive analytics for prediction of postinduction hypotension[J]. Anesthesiology，2018，129（4）：675-688．

[15]	Hever G， Cohen L， O’Connor MF，et al. Machine learning applied to multi-sensor information to reduce false alarm rate in the ICU[J]. J Clin Monit Comput，2020，34（2）：339-352．

[16]	Lee S， Mohr NM， Street WN，et al. Machine learning in relation to emergency medicine clinical and operational scenarios:an overview[J]. West J Emerg Med，2019，20（2）：219-227．

[17]	Glaser JI， Benjamin AS， Farhoodi R，et al. The roles of supervised machine learning in systems neuroscience[J]. Prog Neurobiol，2019，175：126-137．