基于多种机器学习算法构建并验证维持性血液透析患者全因死亡风险预测模型

王娇, 周怡君, 孙文娟, 周静怡, 王依娜

南京医科大学学报(自然科学版) ›› 2026, Vol. 46 ›› Issue (2) : 247 -255.

PDF
南京医科大学学报(自然科学版) ›› 2026, Vol. 46 ›› Issue (2) : 247 -255.

基于多种机器学习算法构建并验证维持性血液透析患者全因死亡风险预测模型

    王娇, 周怡君, 孙文娟, 周静怡, 王依娜
作者信息 +

Author information +
文章历史 +
PDF

摘要

目的:基于不同机器算法构建并验证维持性血液透析(maintenance hemodialysis,MHD)患者全因死亡预测模型。方法:收集江苏省4所医院血液透析中心共694例患者的临床资料,其中无锡市3所三级甲等医院血液透析中心在2017年1月—2023年12月有591例MHD患者,盐城市1所二级甲等医院血液透析中心在2024年1—12月有103例MHD患者。将591例研究对象以7∶3的比例随机分为训练集(n=414)和验证集(n=177),训练集用于构建模型,验证集用于内部验证;将103例研究对象作为测试集,用于外部验证。通过最小绝对值选择与收缩算子(least absolute selection and shrinkage operator,LASSO)方法筛选预测因子,采用10种机器学习算法构建MHD患者全因死亡风险预测模型,绘制受试者工作特征(receiver operating characteristic,ROC)曲线评估模型预测效果。运用校准曲线评估模型预测概率的准确性,决策曲线分析(decision curve analysis,DCA)评估模型在不同决策阈值下的临床净收益。外部验证采用ROC曲线下面积(area under curve,AUC)评价最优模型泛化能力,通过Shapley加法解释(Shapley additive exPlanations,SHAP)对各变量因素进行重要性排序。结果:MHD患者全因死亡发生率为42.6%(252/591),10种机器学习算法模型中,支持向量机(support vector machine,SVM)模型的预测效能最优,ROC曲线下AUC为0.928,灵敏度为89.47%,精确度为0.919,校准曲线、DCA评价预测模型一致性及获益性良好,Brier分数为0.089,表明模型在内部数据集上的预测误差较小,校准性能良好。外部验证AUC为0.835,说明模型具有较强的泛化能力。SHAP图显示全因死亡发生的影响因素重要性排序分别为独自居住、带涤纶套中心静脉导管(tunneled cuffed catheter,TCC)、前白蛋白、白蛋白、查尔森合并症指数(Charlson comorbidity index,CCI)评分、全段甲状旁腺激素(intact parathyroid hormone total,iPTH)<300 pg/mL、年龄、初中及以下学历、尿素氮肌酐比值、糖尿病肾病、大专及以上学历、性别。结论:基于SVM构建的维持性血液透析患者全因死亡预测模型具有良好的预测效果,有助于识别高风险患者,为临床决策及干预提供依据。

关键词

机器学习算法 / 血液透析 / 全因死亡 / 预测模型 / 验证

Key words

引用本文

引用格式 ▾
基于多种机器学习算法构建并验证维持性血液透析患者全因死亡风险预测模型[J]. 南京医科大学学报(自然科学版), 2026, 46(2): 247-255 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/