机器学习模型预测糖尿病前期发生风险

宁夏医科大学学报 ›› 2025, Vol. 47 ›› Issue (01) : 82 -88.

PDF
宁夏医科大学学报 ›› 2025, Vol. 47 ›› Issue (01) : 82 -88. DOI: 10.16050/j.cnki.issn1674-6309.2025.01.013

机器学习模型预测糖尿病前期发生风险

作者信息 +

Author information +
文章历史 +
PDF

摘要

目的 利用简单易得的体检数据,基于机器学习算法构建精准、高灵敏度的糖尿病前期风险预测模型,并对最优模型构建列线图进行可视化,为早期识别糖尿病相关危险因素提供理论依据。方法 选取2019年9月至2020年9月,宁夏医科大学总医院健康管理中心筛检的76 618例非糖尿病患者的体检资料,非糖尿病前期人群为正类样本,糖尿病前期人群为负类样本,通过欠采样技术,调整正负样本比例为1∶1,最终选择6 153例研究对象。利用Lasso回归筛选特征变量,使用Logistic回归、支持向量机(SVM)、随机森林(RF)、极端梯度提升(XGBoost)模型和人工神经网络机器学习算法构建预测模型。选择灵敏度、特异度、准确度、F1值和曲线下面积(AUC)作为评价指标,进行变量重要性评估利用模型构建列线图。结果 Lasso回归筛选出年龄、身体质量指数(BMI)、舒张压、收缩压、甘油三酯等11个特征。Logistic回归模型和XGBoost模型的表现较优秀,Logistic回归模型的准确度、灵敏度、特异度、F1值和AUC分别是0.749 2、0.723 7、0.774 6、0.756 0、0.825 6,XGBoost模型的准确度、灵敏度、特异度、F 1值和AUC分别是0.751 3、0.809 8、0.692 5、0.765 7、0.828 8。XGBoost模型SHAP特征重要排序前5名分别是年龄、甘油三酯、天门冬/丙氨酸、收缩压和BMI。列线图对于糖尿病前期发生风险的预测与实际风险之间吻合良好。结论 与现有糖尿病前期筛查模型相比,Logistic回归模型和XGBoost模型对糖尿病前期人群筛选能力更强,列线图可直观清晰地预测糖尿病前期发生风险。

关键词

糖尿病前期 / 机器学习 / 预测 / 列线图

Key words

引用本文

引用格式 ▾
机器学习模型预测糖尿病前期发生风险[J]. 宁夏医科大学学报, 2025, 47(01): 82-88 DOI:10.16050/j.cnki.issn1674-6309.2025.01.013

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

65

访问

0

被引

详细

导航
相关文章

AI思维导图

/