基于机器学习胃癌术后患者下肢深静脉血栓形成预测模型构建与验证

寿培苑, 陈文斌, 支绍册, 洪广亮, 李疆, 戴晓琴

南通大学学报(医学版) ›› 2026, Vol. 46 ›› Issue (01) : 23 -28.

PDF
南通大学学报(医学版) ›› 2026, Vol. 46 ›› Issue (01) : 23 -28. DOI: 10.16424/j.cnki.cn32-1807/r.2026.01.005

基于机器学习胃癌术后患者下肢深静脉血栓形成预测模型构建与验证

    寿培苑, 陈文斌, 支绍册, 洪广亮, 李疆, 戴晓琴
作者信息 +

Author information +
文章历史 +
PDF

摘要

目的:以机器学习(machine learning, ML)法构建胃癌术后患者下肢深静脉血栓形成(deep vein thrombosis,DVT)预测模型,并对其性能进行验证。方法:对2016年1月—2024年12月在温州医科大学附属第一医院胃肠外科接受根治性手术的180例胃癌患者进行回顾性研究,收集患者的临床资料,使用合成少数过采样技术(synthetic minority over-sampling technique, SMOTE)来处理不平衡的数据,并基于LASSO回归确定DVT形成的预测因素。应用类别型特征梯度提升机(categorical boosting, CatBoost)、极端梯度提升机(extreme gradient boosting, XGBoost)、轻量梯度提升机(light gradient boosting machine, LightGBM)、随机森林算法(random forest, RF)、梯度提升决策树(gradient boosting decision tree,GBDT)、自适应提升算法(adaptive boosting, AdaBoost)、决策树算法(decision tree)、K最临近(K-nearest neighbors, KNN)、朴素贝叶斯算法(Naive Bayes, NB)、Logistic回归共10种ML算法构建预测模型。利用准确率、精确度、召回率、F1值、灵敏度、假阴性率(false negative rate, FNR)、假阳性率(false positive rate, FPR)、马修斯相关系数(Matthews correlation coefficient,MCC)、ROC曲线评估和比较模型的预测能力。最后通过SHAP分析变量在预测模型中的重要性。结果:通过LASSO回归筛选出胃癌术后患者DVT的预测变量:年龄、卧床时间、钠、载脂蛋白B、D-二聚体、血红蛋白、白蛋白、钙、ALT是DVT形成的显著预测因素。构建多个ML模型,其中CatBoost模型具有最佳预测性能,其在验证集中的各项性能指标均优于其他模型(AUC=0.918,准确率:0.848,召回率:0.900,精确度:0.818,F1值:0.857,MCC:0.699)。结论:ML可用于预测DVT形成风险,其中CatBoost模型具有最佳预测性能,并可为临床胃癌术后患者并发DVT预防提供指导。

关键词

胃癌 / 血栓形成 / 机器学习 / 预测模型

Key words

引用本文

引用格式 ▾
寿培苑, 陈文斌, 支绍册, 洪广亮, 李疆, 戴晓琴. 基于机器学习胃癌术后患者下肢深静脉血栓形成预测模型构建与验证[J]. 南通大学学报(医学版), 2026, 46(01): 23-28 DOI:10.16424/j.cnki.cn32-1807/r.2026.01.005

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/