SDAEC算法在单细胞测序数据批次校正中的应用

王文杰, 李康, 谢宏宇

中国卫生统计 ›› 2024, Vol. 41 ›› Issue (04) : 501 -506.

PDF (7178KB)
中国卫生统计 ›› 2024, Vol. 41 ›› Issue (04) : 501 -506.

SDAEC算法在单细胞测序数据批次校正中的应用

作者信息 +

Author information +
文章历史 +
PDF (7350K)

摘要

目的 提出深度堆叠降噪自编码嵌套聚类(stacked denoising auto encoder embedded cluster, SDAEC)算法并用于单细胞mRNA测序(single cell mRNA sequence, scRNA-seq)数据的批次效应移除,对其移除批次效应性能进行评估。方法 基于单细胞数据具有高维度、高稀疏性及高度非线性误差特点,通过将单细胞Louvain聚类算法嵌入堆叠降噪自动编码器(stacked denoising auto encoder, SDAE)算法中,形成SDAEC算法,用于单细胞测序数据的批次效应移除。结合实际卵巢癌组织scRNA-seq数据,利用分布邻域嵌入(t-distributed stochastic neighbor embedding, tSNE)、 k最近邻批次效应检测(k-nearest-neighbor batch-effect test, kBET)、调整兰德系数(adjusted rand index, ARI)、标准化互信息(normalized mutual information, NMI)、平均轮廓宽度(average silhouette width, ASW)评价其移除批次效应性能。结果 利用SDAEC方法对scRNA-seq数据批次效应移除性能高于Combat、相互最近邻(mutual nearest neighbors, MNN)、分布匹配残差网络(maximum mean discrepancy distribution-matching residual networks, MMD-ResNet)和基于零膨胀负二项的方差提取法(zero-inflated negative binomial-based wanted variation extraction, ZINB-WaVE)。结论 SDAEC算法能够移除scRNA-seq数据的批次效应,提高scRNA-seq数据下游分析的有效性,具有实际应用价值。

关键词

深度堆叠降噪自编码嵌套聚类 / 单细胞测序 / 批次效应 / 卵巢癌

Key words

引用本文

引用格式 ▾
王文杰, 李康, 谢宏宇 SDAEC算法在单细胞测序数据批次校正中的应用[J]. 中国卫生统计, 2024, 41(04): 501-506 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (7178KB)

10

访问

0

被引

详细

导航
相关文章

AI思维导图

/