PDF
摘要
目的 利用生物信息学和多种机器学习算法,筛选出预测结核潜伏感染(LTBI)活化风险的新型标志物并建立风险模型。方法 从基因表达综合数据库获取GSE112104和GSE193777数据集,通过差异基因分析和加权基因共表达网络分析筛选与LTBI活化相关的铁死亡相关差异基因(FRG-DEGs)。进一步通过LASSO、SVM-RFE和RF 3种机器学习算法筛选铁死亡相关关键基因(FRG-hubs),并通过验证集和逆转录PCR验证其可靠性。最后,利用R语言建立风险模型。结果 在GSE112104数据集中,与LTBI相比,活动性结核病中296个基因显著上调,1 569个基因显著下调,LTBI进展者中506个基因显著上调,1 132个基因显著下调。WGCNA共得到5个基因共表达模块,其中蓝色模块与LTBI活化相关性最强(cor=0.62,P=0.000 04),包含1 340个基因。将三者连同728个铁死亡相关基因(FRG)取交集,共得到8个表达趋势一致的FRG-DEGs。3种机器学习算法共筛选出4个FRG-hubs,包括PLA2G6、GLS2、JUN和AMN。逆转录PCR结果显示,随着休眠结核分枝杆菌的活化,FRG-hubs的表达逐渐降低。最后,基于FRG-hubs构建了LTBI活化风险模型,曲线下面积在0.98~1.00之间。结论 本研究成功筛选出用于预测LTBI活化风险的新型标志物,并构建了具有良好预测效能的LTBI活化风险模型。
关键词
结核病
/
结核潜伏感染
/
铁死亡
/
风险模型
/
机器学习
Key words
铁死亡相关基因作为新型标志物预测结核潜伏感染活化风险及风险模型构建[J].
中国医科大学学报, 2025, 54(04): 333-339 DOI: