基于蛋白质语言模型和深度残差神经网络的蛋白质与多肽结合残基预测

胡俊, 陈开心

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (08) : 1910 -1917.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (08) : 1910 -1917. DOI: 10.20009/j.cnki.21-1106/TP.2024-0291

基于蛋白质语言模型和深度残差神经网络的蛋白质与多肽结合残基预测

    胡俊, 陈开心
作者信息 +

Author information +
文章历史 +
PDF

摘要

识别蛋白质-多肽结合残基对于揭示蛋白质功能机制和探索药物发现至关重要.许多计算方法被提出来用于预测多肽结合残基.然而,由于特征表示质量的限制,预测性能仍有很大的提升空间.本文设计了一种新的深度学习模型PL-Pep,从蛋白质序列中挖掘出更多判别性信息,从而提高多肽结合残基预测性能.具体地,首先使用预训练的蛋白质语言模型(ESM2)来提取蛋白质序列高潜在判别表示.接着,设计了一个基于卷积的残差神经网络来训练蛋白质-多肽结合残基预测模型.此外,改进了对比损失函数以提高模型的性能.两个独立测试集的实验结果表明,与大多数的预测方法相比,PL-Pep获得更高的马修相关系数(MCC)和AUC值.详细的数据分析表明,PL-Pep的主要优势在于利用蛋白质语言模型,仅从蛋白质序列中提取更多判别性信息以及利用改进的对比损失函数进一步优化不平衡数据集下的结合残基的特征表示.

关键词

蛋白质语言模型 / 深度学习 / 特征表示 / 多肽结合残基 / 对比损失

Key words

引用本文

引用格式 ▾
基于蛋白质语言模型和深度残差神经网络的蛋白质与多肽结合残基预测[J]. 小型微型计算机系统, 2025, 46(08): 1910-1917 DOI:10.20009/j.cnki.21-1106/TP.2024-0291

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

72

访问

0

被引

详细

导航
相关文章

AI思维导图

/