基于因果特征选择和深度森林构建DLBCL复发风险预测模型

王雪嫚, 张岩波, 余红梅, 曹红艳, 周洁, 郭玉娇, 于凯, 李永奥, 杨娜, 张艳, 郑婷婷, 赵志强, 罗艳虹

中国卫生统计 ›› 2026, Vol. 43 ›› Issue (02) : 196 -201+216.

PDF
中国卫生统计 ›› 2026, Vol. 43 ›› Issue (02) : 196 -201+216.

基于因果特征选择和深度森林构建DLBCL复发风险预测模型

    王雪嫚, 张岩波, 余红梅, 曹红艳, 周洁, 郭玉娇, 于凯, 李永奥, 杨娜, 张艳, 郑婷婷, 赵志强, 罗艳虹
作者信息 +

Author information +
文章历史 +
PDF

摘要

目的 基于山西省某肿瘤医院2011—2021年弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者数据构建DLBCL患者早期复发风险预测模型,为DLBCL患者的个性化临床治疗方案提供决策依据。方法使用多阶段因果特征选择(multistage causal feature selection,MCFS)筛选变量,并与三种传统特征选择算法[最小绝对收缩与选择算子准则(least absolute shrinkage and selection operator,LASSO)、递归特征消除(recursive feature elimination,RFE)、KBest]和两种因果特征选择算法[最大-最小爬山法(max-min hill-climbing,MMHC)、IAMB(incremental association Markov blanket)]进行对比,利用SMOTE-ENN(synthetic minority oversampling technique and edited nearest neighbor)处理类别不平衡数据,结合深度森林(deep forest,DF)构建模型,与XGBoost、支持向量机(support vector machine,SVM)、逻辑回归(logistic regression,logistic)、随机森林(random forest,RF)、朴素贝叶斯(naive Bayes,NB)比较预测性能。结果 利用MCFS方法筛选出14个影响DLBCL患者早期复发的主要因素,MCFS结合DF取得了最优的预测结果(accuracy=0.9624,recall=0.9525,specificity=0.9180,G-means=0.9573,MSE=0.0376),其他模型效果次之。结论 针对真实的DLBCL数据集,使用多阶段因果特征选择MCFS结合DF进行复发风险预测,模型达到预期效果。

关键词

弥漫性大B细胞淋巴瘤 / 因果特征选择 / 因果网络图 / 复发预测 / 深度森林

Key words

引用本文

引用格式 ▾
王雪嫚, 张岩波, 余红梅, 曹红艳, 周洁, 郭玉娇, 于凯, 李永奥, 杨娜, 张艳, 郑婷婷, 赵志强, 罗艳虹. 基于因果特征选择和深度森林构建DLBCL复发风险预测模型[J]. 中国卫生统计, 2026, 43(02): 196-201+216 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/