基于质谱熵的小分子化合物相似性计算方法研究

吴丽萍, 向诚, 张海强, 李勇

北京化工大学学报(自然科学版) ›› 2024, Vol. 51 ›› Issue (04) : 115 -124.

PDF
北京化工大学学报(自然科学版) ›› 2024, Vol. 51 ›› Issue (04) : 115 -124. DOI: 10.13543/j.bhxbzr.2024.04.013

基于质谱熵的小分子化合物相似性计算方法研究

    吴丽萍, 向诚, 张海强, 李勇
作者信息 +

Author information +
文章历史 +
PDF

摘要

在二级质谱(MS2)数据检索中,通常利用质谱数据之间的相似性进行检索。针对质谱数据相似性计算中数据不整齐导致的检索效率和准确性不高以及商用软件相似性计算方法单一的问题,研究提出了“拼接填充”与“匹配填充”两种MS2数据对齐方法,并基于信息熵采用质谱熵相似性计算方法进行相似性检索。首先对归一化后的原始质谱数据进行特征提取,保留能突出质谱数据特征的数据,再分别采用两种数据对齐方法对质谱数据进行预处理;然后基于信息熵方法,分别计算未知质谱与已知质谱混合后的虚拟质谱与两者质谱的熵差,获得未知质谱与已知质谱的相关系数即相似性;最后选择小分子化合物的质谱数据集进行实例验证。结果表明:两种质谱数据预处理方法能够解决相似性计算中质谱长度不等的问题,基于质谱熵的相似性计算方法稳定且结果可靠,适用于小分子化合物的相似性检索,同时也为商用软件的谱图相似性计算提供了新的方案。

关键词

小分子化合物 / 相似性计算 / 二级质谱数据 / 信息熵 / 质谱熵

Key words

引用本文

引用格式 ▾
基于质谱熵的小分子化合物相似性计算方法研究[J]. 北京化工大学学报(自然科学版), 2024, 51(04): 115-124 DOI:10.13543/j.bhxbzr.2024.04.013

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

128

访问

0

被引

详细

导航
相关文章

AI思维导图

/