PDF
摘要
蛋白质的三维空间结构决定该蛋白质的生物功能,研究蛋白质结构的相似性在计算分子生物学中具有重要意义。本文将蛋白质Cα原子距离矩阵分解成许多小的子矩阵表示蛋白质的局部结构,通过对这些局部结构的统计分析得到局部特征频率向量计算蛋白质的相似性,在此基础上提出一种新的基于自适应局部特征频率向量的方法(ALFF)计算蛋白质三维结构相似性。ALFF在选取蛋白质局部特征的方式上,使用OTSU算法确定局部特征最合适的大小m,并通过MeanShift聚类计算出具有代表性的局部特征数量k。实验结果表明,ALFF可以更好更快地划分蛋白质的局部子结构,相对于人工选择参数的方法,ALFF在SCOP蛋白质结构分类中有更高的一致性,与TM-score比较有更好的准确性。
关键词
蛋白质结构相似性
/
局部特征
/
距离矩阵
/
聚类
/
频率向量
Key words
基于自适应局部特征的蛋白质三维结构分类[J].
广西师范大学学报(自然科学版), 2020, 38(06): 40-50 DOI:10.16088/j.issn.1001-6600.2020.06.005