PDF
摘要
目的:采用生物信息学方法筛选多原发肺癌(MPLCs)的差异表达基因(DEGs),分析其生物学功能以及对肺腺癌预后的影响。方法:在高通量基因表达综合数据库(GEO)下载GSE200972单细胞转录组测序数据。采用R软件进行数据初步处理后,采用Seurat R包进行数据处理与细胞聚类及注释并得到DEGs。采用clusterProfiler R包进行基因集富集分析(GSEA),采用STRING数据库和Cytoscape软件建立蛋白-蛋白相互作用(PPI)网络并筛选关键基因(Hub基因),采用基因表达水平值的交互式分析(GEPIA)检测基因在肺腺癌数据库中的表达水平,采用实时荧光定量PCR (RT-qPCR)法检测基因在A549细胞原位移植瘤小鼠肿瘤与正常小鼠肺组织中的表达情况,采用Kaplan Meier-Plotter软件进行预后分析。结果:细胞聚类分析共识别出上皮细胞、内皮细胞、成纤维细胞、T细胞和自然杀伤(NK)细胞、B细胞、髓系细胞和肥大细胞共7种细胞类型,以及肿瘤上皮细胞与正常上皮细胞14 605个DEGs。GSEA分析,得到4个在肿瘤样本中发生激活的通路[原癌基因蛋白(MYC)通路、P53通路、氧化磷酸化通路和糖酵解通路]以及1个抑制通路[肿瘤坏死因子α/核因子κB (TNF-α/NF-κB)通路]。筛选PPI网络中的CXC趋化因子8 (CXCL8)、甘油醛-3-磷酸脱氢酶(GAPDH)、趋化因子受体4 (CXCR4)、鼠类肉瘤病毒癌基因(KRAS)、CXC趋化因子1 (CXCL1)、趋化因子配体2 (CCL2)、黏蛋白1 (MUC1)和分泌型磷蛋白1 (SPP1)为Hub基因。GEPIA数据库分析与动物实验,与肺正常组织比较,在非小细胞肺癌组织中SPP1 mRNA表达水平升高(P<0.01)。Kaplan-Meier生存曲线分析,SPP1高表达患者总生存期(OS)短于低表达患者(P<0.01)。结论:MPLCs中不仅有原癌基因相关通路的激活,也有抑癌通路起拮抗肿瘤进展作用,同时非小细胞肺癌中SPP1基因表达水平升高提示有相对较差的预后。
关键词
多原发肺癌
/
单细胞转录组测序
/
生物信息学
/
基因集富集分析
/
生存分析
Key words
基于GEO数据库对多原发肺癌差异表达基因的生物信息学分析[J].
吉林大学学报(医学版), 2025, 51(02): 437-446 DOI:10.13481/j.1671-587X.20250218