随机生存森林在结直肠癌患者基因数据预后分析中的应用研究

穆华夏, 卜伟晓, 高梦瑶, 苏维强, 韩梅, 徐雅琪, 陶子琨, 杨希, 石福艳, 王清华, 孔雨佳, 王素珍

中国卫生统计 ›› 2024, Vol. 41 ›› Issue (04) : 532 -538.

PDF (6548KB)
中国卫生统计 ›› 2024, Vol. 41 ›› Issue (04) : 532 -538.

随机生存森林在结直肠癌患者基因数据预后分析中的应用研究

作者信息 +

Author information +
文章历史 +
PDF (6704K)

摘要

目的 应用随机生存森林模型探讨基因数据中结直肠癌患者预后影响因素。方法 利用TCGA数据库中结直肠癌基因表达数据,对差异表达基因进行筛选,结合临床与生存信息构建RSF模型,并与传统Lasso-Cox回归模型进行比较。结果 通过RSF模型得到包括HAND1(VIMP=0.090)和PCOLCE2(VIMP=0.075)基因表达在内的13个影响结直肠癌患者预后的重要因素,并分析了病理学N分期、PCOLCE2基因及IGSF9基因变量之间的交互作用。与Lasso-Cox模型比较结果显示,尽管RSF模型预测错误率略高(1-C-index:训练集:0.296 vs. 0.213;测试集:0.369 vs. 0.332),但具有更好的模型校准度(IBS:训练集:0.205 vs. 0.214;测试集:0.210 vs. 0.221)。结论 RSF模型在处理右删失生存数据的分析时具有良好的表现,能发现重要的影响因素以及变量之间的交互作用,为结直肠癌患者预后状况的改善和生命质量的提升提供了科学依据。

关键词

随机生存森林 / Lasso-Cox回归 / 结直肠癌 / 基因数据 / 预后分析

Key words

引用本文

引用格式 ▾
穆华夏, 卜伟晓, 高梦瑶, 苏维强, 韩梅, 徐雅琪, 陶子琨, 杨希, 石福艳, 王清华, 孔雨佳, 王素珍 随机生存森林在结直肠癌患者基因数据预后分析中的应用研究[J]. 中国卫生统计, 2024, 41(04): 532-538 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (6548KB)

8

访问

0

被引

详细

导航
相关文章

AI思维导图

/