基于机器学习构建甲状腺乳头状癌中央区淋巴结转移预测模型及可解释性分析

方明宇, 陈玉琳

齐齐哈尔医学院学报 ›› 2026, Vol. 47 ›› Issue (1) : 25 -30.

PDF
齐齐哈尔医学院学报 ›› 2026, Vol. 47 ›› Issue (1) : 25 -30.

基于机器学习构建甲状腺乳头状癌中央区淋巴结转移预测模型及可解释性分析

    方明宇, 陈玉琳
作者信息 +

Author information +
文章历史 +
PDF

摘要

目的 探讨甲状腺乳头状癌(PTC)患者中央区淋巴结转移(CLNM)的关键影响因素,基于机器学习算法构建并验证高效的CLNM预测模型。方法 选择2021年2月—2025年1月本院收治的730例PTC患者作为研究对象,按7︰3比例随机分为建模组(n=511)和验证组(n=219)两组。在建模组中采用Lasso回归筛选与CLNM相关的影响因素,基于筛选出的特征变量分别构建XGBoost、支持向量机(SVM)、轻量级梯度提升机(LightGBM)、随机森林(RF)、朴素贝叶斯(NB)和人工神经网络(ANN)共6种机器学习预测模型。采用受试者工作特征曲线下面积(AUC)、准确率、精确率、召回率和F1分数等指标评估各模型的预测效能,并使用SHAP方法分析最优模型的特征重要性。结果 建模组与验证组CLNM发生率分别为40.1%(205/511)、37.0%(81/219)。Lasso回归筛选出7个关键预测变量:性别、甲状腺包膜受累、淋巴结长径与短径比值、淋巴结高血供、淋巴结钙化、淋巴结高回声团及淋巴结囊性变。在6种机器学习模型中,XGBoost模型的预测效能最优,其在建模组和验证组中的AUC值分别为0.840和0.841。SHAP分析显示,对XGBoost模型预测贡献度最大的前3个特征依次为性别、淋巴结高血供和淋巴结钙化。结论 本研究构建的XGBoost模型对PTC患者CLNM具有良好的预测能力,结合SHAP分析提供模型决策的可解释性,有助于临床术前风险评估和个体化手术方案制定。

关键词

甲状腺乳头状癌 / 中央区淋巴结转移 / 机器学习 / 预测模型

Key words

引用本文

引用格式 ▾
基于机器学习构建甲状腺乳头状癌中央区淋巴结转移预测模型及可解释性分析[J]. 齐齐哈尔医学院学报, 2026, 47(1): 25-30 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

1

访问

0

被引

详细

导航
相关文章

AI思维导图

/