基于TCGA数据库肺腺癌的风险预测模型的构建与验证

高梦瑶, 穆华夏, 卜伟晓, 季宏志, 苏维强, 丁淑婷, 张震, 孔雨佳, 王素珍

中国卫生统计 ›› 2025, Vol. 42 ›› Issue (02) : 191 -196.

PDF
中国卫生统计 ›› 2025, Vol. 42 ›› Issue (02) : 191 -196.

基于TCGA数据库肺腺癌的风险预测模型的构建与验证

作者信息 +

Author information +
文章历史 +
PDF

摘要

目的 基于癌症基因组图谱(the cancer genome atlas, TCGA)数据库,筛选与肺腺癌(lung adenocarcinoma, LUAD)患者死亡或预后相关的关键基因及临床特征,构建并验证肺腺癌风险预测模型的效果。方法 从TCGA数据库中提取肺腺癌患者的临床信息及其RNA测序数据,筛选差异表达基因,通过蛋白相互作用(protein protein interaction, PPI)网络选择关键基因。随机选择70%的数据作为训练集,整个数据集作为验证集。在训练集中,运用弹性网回归分析选择预后相关基因和临床特征,进行Cox多因素回归分析构建风险预测模型。通过受试者工作特征(receiver operating characteristic, ROC)曲线下面积AUC、C-index、校准曲线等方法评估模型的预测性能,并在验证集中进行验证。结果 弹性网回归分析鉴定出23个因素与LUAD患者的生存状态相关,预测模型选入变量为SEC61A1(P=0.004)、MAP2K1(P=0.026)、MMP1(P=0.001)、SLC2A1(P=0.010)、B4GALT1(P<0.001)、ERO1A(P=0.024)基因及M分期(P=0.003)、N分期(P<0.001)。训练集和验证集中,AUC分别为0.764和0.710,C-index分别为0.732和0.704。tdROC曲线及校准曲线显示模型预测值与实际观察值之间一致性较高。Kaplan-Meier生存曲线显示低风险患者的生存时间明显长于高风险患者的生存时间(P<0.05)。结论 SEC61A1、MAP2K1基因的低表达,MMP1、SLC2A1、B4GALT1、ERO1A基因的高表达以及原发肿瘤的远处转移、淋巴结转移程度的加深都可能提升肺腺癌患者的死亡风险。通过弹性网构建的预后风险模型具有较好的预测能力,能够为LUAD患者死亡风险的预测提供科学依据。

关键词

肺腺癌 / 差异表达基因 / 弹性网 / Cox回归分析 / 风险预测模型

Key words

引用本文

引用格式 ▾
高梦瑶, 穆华夏, 卜伟晓, 季宏志, 苏维强, 丁淑婷, 张震, 孔雨佳, 王素珍 基于TCGA数据库肺腺癌的风险预测模型的构建与验证[J]. 中国卫生统计, 2025, 42(02): 191-196 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

7

访问

0

被引

详细

导航
相关文章

AI思维导图

/