基于最优变分贝叶斯逻辑回归构建可解释的弥漫性大B细胞淋巴瘤复发预测模型

郭玉娇, 张岩波, 余红梅, 曹红艳, 周洁, 王雪嫚, 于凯, 李永奥, 杨娜, 张艳, 郑婷婷, 赵志强, 罗艳虹

中国卫生统计 ›› 2025, Vol. 42 ›› Issue (6) : 871 -877.

PDF
中国卫生统计 ›› 2025, Vol. 42 ›› Issue (6) : 871 -877.

基于最优变分贝叶斯逻辑回归构建可解释的弥漫性大B细胞淋巴瘤复发预测模型

    郭玉娇, 张岩波, 余红梅, 曹红艳, 周洁, 王雪嫚, 于凯, 李永奥, 杨娜, 张艳, 郑婷婷, 赵志强, 罗艳虹
作者信息 +

Author information +
文章历史 +
PDF

摘要

目的 应用一种具有显著特征估计的最优变分贝叶斯逻辑回归(optimal variational Bayesian logistic regression model with a salient feature estimation, OVBLR-SFE)算法构建弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma, DLBCL)患者两年内的复发预测模型,对识别的重要因素进行解释及可视化,为患者的治疗提供决策依据。方法 回顾性收集了山西省某三甲医院2010年1月至2021年1月经治疗达到完全缓解的544例DLBCL患者信息,构建基于两种常用类别不平衡处理方法的OVBLR-SFE的复发预测模型,并与七种传统的分类器进行比较。使用十次十折交叉验证和模型评价指标来评估模型性能,评价指标包括准确度(accuracy)、精确度(precision)、召回率(recall)、F1分数(F1-score)和曲线下面积(area under the curve, AUC)。OVBLR-SFE得出的特征重要性排名可将影响DLBCL患者两年内复发的重要因素进行解释及可视化,并与SHAP(shapely additive explanations)和AcME(accelerated model-agnostic explanations)方法进行比较。结果 SMOTEENN(synthetic minority oversampling technique and edited nearest neighbor)结合OVBLR-SFE模型取得了最优的分类性能(accuracy=0.8195,precision=0.8430,recall=0.8808,F1-Score=0.8615,AUC=0.8907)。OVBLR-SFE在可解释方面的性能与SHAP和AcME相当,三者均得出肿瘤长度、疾病分期、结外受累数量、国际预后指数、CD10和BCL6是影响DLBCL患者两年内复发的重要因素。结论 针对DLBCL实际数据集,本文通过SMOTEENN结合OVBLR-SFE的复发预测模型在性能上达到最优,并成功识别出影响DLBCL患者复发的重要因素,并对重要因素进行解释及可视化,为患者个性化治疗和医生决策提供参考。

关键词

弥漫性大B细胞淋巴瘤 / 复发预测 / 类别不平衡 / 最优变分贝叶斯逻辑回归 / 可解释性机器学习

Key words

引用本文

引用格式 ▾
基于最优变分贝叶斯逻辑回归构建可解释的弥漫性大B细胞淋巴瘤复发预测模型[J]. 中国卫生统计, 2025, 42(6): 871-877 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/