PDF
摘要
基于癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库构建恶性胸膜间皮瘤患者的基因预后风险模型及其验证分析.通过TCGA数据库获取恶性胸膜间皮瘤的基因表达数据以及临床信息,将数据集分为训练集和测试集,对训练集进行单因素Cox分析、单因素鲁棒性分析以及多因素Cox回归分析,建立风险预后模型,计算每个患者的风险评分,将数据集分成高风险组和低风险组,通过Kaplan-Meier生存曲线和受试者工作特征(Receiver Operating Characteristic, ROC)曲线评估模型的预测效能和准确性,利用TCGA数据库和GTEx数据库中的样本对预后模型中的基因进行表达验证,最后通过UALCAN数据库探索预后模型中基因的表达模式.本研究构建了一个由UHRF1、KIF4A和NEK2这三个基因组成的预后风险评估模型,预后风险模型风险评分=UHRF1表达量×1.452 5-KIF4A表达量×1.327+NEK2表达量×1.416 7.ROC曲线显示,该模型的ROC曲线下面积(Area Under the Curve, AUC)值为0.91,基于ROC曲线对截断值进行优化,最佳截止点为1.149,此时达到最大灵敏度和特异性.在最佳截止点处,患者被进一步分为高风险组和低风险组,Kaplan-Meier生存曲线显示,高风险组和低风险组之间的生存时间存在显著差异,与高风险组患者相比,低风险组患者总生存期显著延长.通过森林图对模型进行可视化,整个模型的Log-Rank p-value<0.000 1,表示其可以作为恶性胸膜间皮瘤的独立预后生物标志物.相比于正常肺组织,预后模型中的三个基因在恶性胸膜间皮瘤组织中均显著高表达,且在恶性胸膜间皮瘤患者的不同分期、肿瘤亚型、年龄和转移状态中表达有明显差异.本研究构建的恶性胸膜间皮瘤基因预后风险模型,能够有效地预测恶性胸膜间皮瘤患者预后,并且可以作为恶性胸膜间皮瘤的独立预后预测因子.预后模型中基因UHRF1、KIF4A和NEK2的表达与恶性胸膜间皮瘤患者的多个临床特征显著相关,提示其在恶性胸膜间皮瘤发生发展过程中的潜在作用.
关键词
恶性胸膜间皮瘤
/
预后风险模型
/
生物信息学
/
TCGA数据库
Key words
基于TCGA数据库构建恶性胸膜间皮瘤基因预后模型及其生物信息学分析[J].
昆明理工大学学报(自然科学版), 2024, 49(01): 127-136 DOI:10.16112/j.cnki.53-1223/n.2024.01.262