PDF
摘要
目的 多组学数据的高噪稀疏性以及存在异常值,易导致多组学数据整合分型稳健性不足,本研究提出将深度学习中的自编码器与最优化稳健伪极大似然估计器(optimally tuned robust improper maximum likelihood estimator, OTRIMLE)结合的方法,并将其应用于低级别胶质瘤(lower-grade gliomas, LGG)患者分型。方法 采用自编码器对LGG的miRNA、mRNA和甲基化数据进行非线性降维,串联后采用OTRIMLE方法进行稳健分型。对最终的分型结果,利用Cox比例风险模型分析不同分型的预后风险,使用差异表达分析筛选出DEmiRNAs(differentially expressed miRNAs),DEmRNAs(differentially expressed mRNAs)和DMGs(differentially methylated genes),对DEmiRNAs的靶基因、DEmRNAs和DMGs三者的重合基因进行GO富集分析,最后对不同分型的患者进行免疫细胞浸润与通路活性分析。结果 将LGG患者分为四型,其中分型4患者的死亡风险是分型3患者的5.903倍。筛选出8个DEmiRNAs, 2890个DEmRNAs和46个DMGs,联合分析得到的658个重合基因富集于423条GO生物项。筛选出13条活性存在差异的通路以及4种存在差异的免疫浸润细胞。结论 基于深度学习的OTRIMLE方法对多组学数据高噪稀疏性和存在异常点时具有稳健性,有效实现了LGG患者的稳健分型,并筛选出了具有统计学差异的免疫细胞与通路等,可为LGG后续针对性治疗提供理论依据。
关键词
稳健分型
/
深度学习
/
多组学数据
/
低级别胶质瘤
Key words
基于深度学习的低级别胶质瘤多组学数据整合稳健分型[J].
中国卫生统计, 2025, 42(02): 185-190 DOI: