PDF
摘要
单细胞转录组测序(single-cell RNA sequencing, scRNA-seq)在揭示细胞异质性方面具有重要意义,但现有细胞类型注释方法存在着跨物种适应性、泛化性、类别不平衡等问题。本文提出了一种基于图注意力网络(graph attention network, GAT)的细胞类型注释方法ScLabeler。该方法通过结合类别均衡优化策略和图注意力机制,增强了细胞间复杂关系的捕捉,提升了注释的精确度。实验结果表明,ScLabeler在人类(Homo sapiens)、小鼠(Mus musculus)、斑马鱼(Danio rerio)等多物种数据集上的细胞类型注释效果相比Seurat、 ScGCN等方法都更为优异,注释的准确率提高了4.62%~35.76%, F1分数提高了5.21%~39.73%;另外注释的结果证明了ScLabeler在细胞类型低丰度识别方面[斑马鱼组织调整兰德指数(adjusted rand index, ARI)提高了9个百分点]与对其他物种泛化性方面[归一化互信息(normalized mutual information, NMI)提升幅度达到11.76%~123.53%]有显著提升。此外,通过UMAP和Sankey图等可视化工具,直观展示了细胞类型分布及预测一致性,为单细胞组学研究提供了高效的注释工具。ScLabeler源码可在https://github.com/bioinfolabdev/ScLabeler下载。
关键词
图注意力网络(GAT)
/
单细胞转录组测序(scRNA-seq)
/
细胞类型注释
/
类别不平衡
Key words
基于图注意力网络(GAT)的单细胞类型注释方法研究[J].
基因组学与应用生物学, 2025, 44(06): 561-577 DOI:10.13417/j.gab.044.000561