单细胞转录组测序数据的细胞类型识别方法比较

朱晓姝, 滕飞, 廖燕莹, 谢妙, 杨朝义

基因组学与应用生物学 ›› 2024, Vol. 43 ›› Issue (02) : 195 -206.

PDF
基因组学与应用生物学 ›› 2024, Vol. 43 ›› Issue (02) : 195 -206. DOI: 10.13417/j.gab.043.000195

单细胞转录组测序数据的细胞类型识别方法比较

    朱晓姝, 滕飞, 廖燕莹, 谢妙, 杨朝义
作者信息 +

Author information +
文章历史 +
PDF

摘要

单细胞转录组测序技术提供单个细胞分辨率的基因表达谱,有助于更准确地揭示细胞异质性。聚类是识别生物组织中细胞类型的主要方法,选择合适的聚类算法可以提升单细胞转录组测序数据分析的性能。本文阐述了k-means、层次聚类(hierarchical clustering, HC)、 Leiden、 SC3、 SCENA、 LAK、 SIMLR和dropClust等8种典型的单细胞聚类算法,在12个带有真实标签的单细胞转录组测序数据集上进行聚类比较分析。采用轮廓系数、 Calinski-Harabasz指数、调整兰德指数、调整互信息、 FMI指数、 V-measure、 Jaccard系数和变异系数等8个评价指标,对8种聚类算法的性能进行分析评价。根据实验结果,发现HC、 SC3、k-means、 SCENA的聚类泛用性与鲁棒性最佳,在大规模数据集上SIMLR算法表现最好;在小规模数据集上Leiden算法表现最好,但是存在依赖邻居节点参数和稳定性低的问题;dropClust算法在泛用性和鲁棒性上最差。此外,8种聚类方法的性能都与数据质量有关,当数据的变异系数较低时,聚类算法的评分指标普遍增高,反之亦然。

关键词

单细胞转录组测序 / 聚类 / 细胞类型识别 / 数据质量 / 性能评价

Key words

引用本文

引用格式 ▾
单细胞转录组测序数据的细胞类型识别方法比较[J]. 基因组学与应用生物学, 2024, 43(02): 195-206 DOI:10.13417/j.gab.043.000195

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

122

访问

0

被引

详细

导航
相关文章

AI思维导图

/