基于模糊支持向量机的赖氨酸糖化位点预测

宋一明 ,  鞠哲 ,  张万里

沈阳航空航天大学学报 ›› 2023, Vol. 40 ›› Issue (3) : 63 -70.

PDF (620KB)
沈阳航空航天大学学报 ›› 2023, Vol. 40 ›› Issue (3) : 63 -70. DOI: 10.3969/j.issn.2095-1248.2023.03.008
信息科学与工程

基于模糊支持向量机的赖氨酸糖化位点预测

作者信息 +

Prediction of lysine glycation sites based on fuzzy support vector machine

Author information +
文章历史 +
PDF (634K)

摘要

能否准确识别糖化位点对理解糖化的分子机制有着重要意义。传统的实验方法工作量大、耗时长,因此迫切需要开发计算辅助方法来预测糖化位点。设计了一种新的模糊支持向量机算法,该算法放大了重要特征与弱相关特征间的权重之差,同时考虑了样本内部的分布情况,能够有效地处理糖化修饰位点预测中含有噪声数据的问题。基于所提出的模糊支持向量机算法结合双剖面贝叶斯(Bi-Profile Bayes,BPB)特征提取方法构建了一个新的赖氨酸糖化位点的模型——FSVM_GlySite。十折交叉验证结果表明,FSVM_GlySite的预测效果优于现有的几种糖基化位点预测器。

Abstract

Accurate identification of glycation sites is of great significance to understanding the molecular mechanism of glycation. Because of the heavy workload and time consuming of traditional experimental methods, it is urgent to develop computational auxiliary methods to predict the glycation sites. A new fuzzy support vector machine algorithm was designed, which magnified the weight difference between the important features and the weak correlation features, and also considered the distribution within the sample. The algorithm could effectively deal with the problem of noise data in the prediction of glycation modification sites. Based on the proposed fuzzy support vector machine algorithm and Bi-Profile Bayes(BPB) feature extraction method, a new lysine glycation site model, FSVM_GlySite, was constructed. The results of 10-fold cross-validation showes that the prediction effect of FSVM_GlySite is better than that of several existing glycation site predictors.

关键词

糖化位点预测 / 模糊支持向量机 / 隶属度函数 / 特征加权 / 赖氨酸糖化

Key words

glycation sites prediction / fuzzy support vector machine / membership function / feature weighting / lysine glycation

引用本文

引用格式 ▾
宋一明,鞠哲,张万里. 基于模糊支持向量机的赖氨酸糖化位点预测[J]. 沈阳航空航天大学学报, 2023, 40(3): 63-70 DOI:10.3969/j.issn.2095-1248.2023.03.008

登录浏览全文

4963

注册一个新账户 忘记密码

作为一种常见而重要的蛋白质的翻译后修饰(Post-Transational Modifications,PTMs),赖氨酸糖化可以潜在地影响多种生物过程,如构象、功效和免疫原性等1。糖化是糖分子(如果糖或葡萄糖)与蛋白质或脂质分子共价结合的典型过程。与糖基化需要酶的控制作用相比,糖化是一种非酶修饰的过程。首先,不稳定的席夫碱(Schiffbase)重新排列,形成更稳定的阿马多里产物(n-substituted 1-amino-1-deoxy-ketose),随后,阿马多里产物可进一步反应形成晚期糖化终产物(Advanced Glycation Endproducts,AGEs),该终产物为不可逆交联产物2-3。赖氨酸糖化可以发生在细胞内和细胞外的蛋白质中4-5。一般来说,细胞内的糖化比细胞外的糖化更为复杂,因为细胞质中的多种潜在来源也可以反应形成AGEs。糖化反应的动力学分析指出,稳定状态下的糖化量与葡萄糖浓度、蛋白质半衰期和糖化率成正比6。大量研究表明糖化与多种人类疾病的发生和发展密切相关,如糖尿病及其血管并发症、肾功能衰竭、帕金森病和阿尔茨海默病7-9。因此,破译糖化的分子机制和生物学功能对上述疾病的治疗具有重要意义。
目前,糖化的分子机制在很大程度上仍是未知的。为了更好地理解糖化的分子机制,需要高精度地识别糖化底物及其相应的糖化位点。大规模蛋白质组学方法如质谱分析,已被用于检测糖化位点10-11。然而传统的实验方法不仅花费高,并且耗时耗力,很大程度上延缓了相关研究的进展。因此,有关蛋白质糖化的计算辅助方法受到了越来越多的关注。到目前为止,已有很多学者通过机器学习算法对糖化位点进行了预测。Johansen等12利用人工神经网络算法提出了第一个预测赖氨酸糖化位点的预测器NetGlycate,最终得到的马氏相关系数为0.77,AUC值为0.58,体现了使用机器学习算法进行蛋白质糖化位点预测的可行性。Liu等13提出了一种预测糖化位点的计算方法PreGly,该方法使用氨基酸因子、氨基酸出现频率和k间距氨基酸对组成进行特征提取,使用最大相关和最小冗余(mRMR,max Relevance and Min Redundancy)进行特征选择,在k =4时获得了最优的模型。Xu等14开发了一种名为Gly-PseAAC的预测器,利用位置特异性氨基酸偏好提取蛋白质包含的信息,然后使用支持向量机(Support vector Machine,SVM)算法预测糖化位点,通过PSAAP特征有效地验证了赖氨酸是否发生糖化反应的问题。Ju等15提出了BPB(Bi-Profile Bayes)的特征提取方式,并结合支持向量机进行预测,预测的结果要优于以上算法。
然而,标准的SVM算法会因数据中存在野点或噪声而导致分类精度下降,因此Lin等16提出了模糊支持向量机(Fuzzy Support Vector Machine,FSVM)方法,其思想为给每个样本以不同的隶属度,可以有效地降低野点或噪声对分类精度的影响。在此基础上,学者们提出了更多的隶属度函数设计方法,如文献[17]将样本的不确定性和样本与类中心的距离相结合,提出了一种基于信息熵的改进FSVM算法,在不平衡数据集上具有较高的分类精度。李村合等18通过加入参数来调整分离超平面与样本的距离,当样本分布不均时也能得到较高的分类精度。Wang等19提出了基于中心核对齐的模糊支持向量机。左喻灏等20提出了Relief-F特征加权的FSVM算法,通过赋予样本权重与特征权重来提高分类效率。本文在文献[15]的基础上,提出了一种基于两步特征加权的模糊支持向量机算法。首先,利用信息增益算法获取样本的特征权重;然后,选择信息增益最大的特征,计算其与剩余特征的斯皮尔曼相关系数,将最大的特征权重与其他特征的相关系数相乘并加到其他特征原有的权重上,得到新的特征权重;最后,将得到的特征权重应用到隶属度函数距离的计算与核函数的构建中,同时考虑样本的亲和度,通过样本内部的分布情况对隶属度函数做出进一步修正。本文将上述算法与BPB的特征提取方式结合,提出了一种预测赖氨酸糖化位点的方法FSVM_GlySite,并用十折交叉验证,结果表明,FSVM_GlySite的预测结果要优于现有的几种常用的预测模型。

1 材料与方法

1.1 数据集

本文使用文献[15]中的训练集对模型进行训练和测试。此训练集来自蛋白质赖氨酸修饰数据库CPLM21,包含了223个实验标注的糖化赖氨酸位点和446个非糖化赖氨酸位点。使用滑动窗口表示数据集的赖氨酸残基K,与文献[15]设置相同,窗口大小设置为15,每个训练样本都表示赖氨酸残基K下游和上游各有的7个残基的肽段。为了统一每个肽段的长度,添加虚拟残基“X”来填补没有足够残基的位置。这里将糖化多肽作为正类训练样本,而非糖化多肽作为负类训练样本。

1.2 Bi-Profile Bayes特征提取

给定序列片段 S = s 1 s 2 . . . s n,其中 s j ( j = 1,2 , . . . , n )为单个氨基酸, n为序列片段长度。 S属于类 C 1或类 C 2,其中 C 1 C 2分别表示糖化位点和非糖化位点。根据贝叶斯准则,假设 s j ( j = 1,2 , . . . , n )相互独立,则两类 S的后验概率可表示为

P ( c 1 | S ) = P ( S | c 1 ) P ( c 1 ) / P ( S )   = j = 1 n P ( s j | c 1 ) P ( c 1 ) / P ( S )
P ( c - 1 | S ) = P ( S | c - 1 ) P ( c - 1 ) / P ( S )     = j = 1 n P ( s j | c - 1 ) P ( c - 1 ) / P ( S )

式(1)式(2)可重新表示为

l o g ( P ( c 1 | S ) ) = j = 1 n l o g ( P ( s j | c 1 ) )   - l o g ( P ( S ) ) + l o g ( P ( c 1 ) )
l o g ( P ( c - 1 | S ) ) = j = 1 n l o g ( P ( s j | c - 1 ) )    - l o g ( P ( S ) ) + l o g ( P ( c - 1 ) )

假设类别的先验分布是均匀的,即 P ( c 1 ) = P ( c - 1 ),则决策函数可表示为

f ( S ) = s g n n ( l o g ( P ( c 1 | S ) ) - l o g ( P ( c - 1 | S ) ) )   = s g n n ( j = 1 n l o g ( P ( s j | c 1 ) ) - j = 1 n l o g ( P ( s j | c - 1 ) ) )

根据文献[22],式(5)可以进一步写成

f ( S ) = s g n ( w p )

式中: s g n ( x ) =    1 ,    x 0 - 1 , x < 0 w = ( w 1 , w 2 , . . . , w n , w n + 1 , . . . , w 2 n )是权重向量; p = ( p 1 , p 2 , . . . , p n , p n + 1 , . . . , p 2 n )为后验概率向量; p 1 , p 2 , . . . , p n表示正类训练肽段( C 1类)各位置各氨基酸的后验概率, p n + 1 , p n + 2 , . . . , p 2 n表示负类训练肽段( C 2类)各位置各氨基酸的后验概率。后验概率通过每个氨基酸在训练肽段中每个位置的出现频率来计算。因此,通过BPB编码,每个训练肽都被表示为30维的特征向量。例如,对于一个给定的训练肽段AVTALWGKVNVDEVG,通过BPB方式将其编码为 ( p A + , p V + , . . . , p V + , p G + , p A - , p V - , . . . , p V - , p G - , )。其中 p A + , p V + , . . . , p V + , p G +表示出现A,V,...,V, G在正类训练肽的位置, p A - , p V - , . . . , p V - , p G -表示出现A,V,...,V, G在负类训练肽的位置。

1.3 基于两步特征加权的模糊支持向量机算法

支持向量机是一种流行的机器学习算法,被广泛应用于各种PTMs位点的预测23-25。模糊支持向量机则是给每个样本以不同的隶属度,降低野点和噪声对分类的干扰。一个训练集 S = { ( x i , y i , s i ) } i = 1 N x i R n为训练样本, y i { + 1 , - 1 }为训练样本的标签, + 1代表正类, - 1为负类, s i [ 0,1 ]为模糊隶属度,表示样本 x i属于类 y i的权重。FSVM模型为

m i n ω , b , ξ 1 2 | | ω | | 2 + C i = 1 N s i ξ i
s . t . y i ( ω ϕ ( x i ) + b ) 1 - ξ i , i = 1,2 , . . . , N
ξ i 0 , i = 1,2 , . . . , N

通过求解上述问题得到最终的分类决策函数为

f ( x ) = s i g n ( ω * ϕ ( x ) + b * ) = s i g n ( i = 1 N α i * y i K ( x i , x j ) + b * )

式中: K ( x i , x j )为核函数,目的是将样本通过非线性映射 ϕ ( x ),使其映入高维核空间。

设计出好的隶属度函数是模糊支持向量机的关键。本文使用的算法首先对特征进行两步加权,再将得到的特征权重应用到隶属度函数的设计与核函数的构建中,最后通过样本亲和度对隶属度函数作出修正,从而得到每个样本的隶属度。

1.3.1 进行特征加权

(1)计算出所有特征的信息增益 G a i n ( k ),如式(9)、(10)所示

E n t ( D ) = - i = 1 h | K i , D | | D | l o g 2 | K i , D | | D |
G a i n ( D , A ) = E n t ( D ) - j = 1 v | D j | | D | E n t ( D j )

式中: D为数据集; | D |为数据集中的样本个数; D中有 h个类别标签 K i ( i = 1,2 , . . . , h ) | K i , D | D中标签为 K i的样本个数。若特征 A v个取值 A j ( j = 1,2 , . . . , v ) | D j | D中在特征 A上取值为 A j的集合。式(10)表示特征对样本集合不确定性的减少程度,为信息熵与条件熵之差。

(2)计算出特征之间的斯皮尔曼相关系数矩阵 c o r r ( i , k ),如式(11)所示

ρ = i = 1 N ( R i - R ¯ ) ( S i - S ¯ ) [ i = 1 N ( R i - R ¯ ) 2 i = 1 N ( S i - S ¯ ) 2 ] 2

式中: R i S i表示样本 i取值的等级; R ¯ S ¯表示变量 R S的平均等级; N为样本个数。斯皮尔曼相关系数用来衡量两个变量之间的相关性大小,越趋近于0,两个变量之间的相关性越低,绝对值大于0.4则认定为具有一定相关性。

(3)找到信息增益值最大的特征,位置记为 M,然后根据其与剩余特征的相关系数,找到相关系数大于0.4的特征,以式(12)赋予最终的特征权重 w ( k ),相关系数小于0.4的不作处理。将已得到 w ( k )的特征忽略,对未赋予 w ( k )的特征重复上述过程,直至全部特征都被赋予新的 w ( k )

w ( k ) = G a i n ( k ) + G a i n ( k ) i f   k = M G a i n ( k ) + m a x ( G a i n ) * | c o r r ( M , k ) | i f   k M

(4)对RBF核函数 K ( x i , x j ) = e x p ( - γ | | x i - x j | | 2 )作出修改,根据特征权重 w得到特征矩阵的对角矩阵形式

P = d i a g ( w ) = w ( 1 ) w ( 2 ) w ( k ), 新的特征加权核函数为

K ( x i , x j ) = e x p ( - γ | | x i T P - x j T P | | 2 )     = e x p ( - γ ( ( x i - x j ) T P P T ( x i - x j ) ) )

1.3.2 设计模糊隶属度函数

(1)本文在距离计算上均使用特征加权距离方法,如式(13)所示

d ( x i , x j ) = k = 1 l w ( k ) ( x i k - x j k ) 2

式中: l表示特征的个数。

(2)通过模糊C均值算法得到样本的正负类中心 x c e n + x c e n -,计算 d i c e n + =   d ( x i , x c e n + ) d i c e n - =    d ( x i , x c e n - ),赋予特征加权隶属度 s 1 ( x i ),如式(14)所示

s 1 ( x i ) = s 1 + ( x i ) = 1 - d i c e n + m a x i ( d i c e n + ) + δ i = 1,2 , . . . , p s 1 - ( x i ) = 1 - d i c e n - m a x i ( d i c e n - ) + δ i = p + 1 , p + 2 , . . . , N

模糊C均值算法具体思路为:假定对数据集 S进行分类,样本 x i属于第 j个聚类中心 c j的隶属度为 μ i j,表达式如式(15)、(16)所示

J = i = 1 N j = 1 H | | x i - c j | | 2
s . t . j = 1 H μ i j = 1 , i = 1,2 , . . . , N

式中: m为隶属度因子; N H分别表示样本个数与聚类中心数; | | x i - c j | | 2表示 x i到中心点 c j的距离。要求最小化目标函数 J,给定任意初值后进行迭代,当 m a x i j { | μ i j ( k + 1 ) - μ i j ( k ) | } < ε时停止迭代,表示继续迭代后 μ i j已无明显变化; k为迭代次数; ε为误差阈值。

(3)计算样本的亲和度 A ( x i ),如式(17)~(19)所示

U ( x i , D ) = s t d ( D / { x i } ) s t d ( D ) i = 1,2 , . . . , N
T ( x i , D ) = m e a n ( D / { x i } ) m e a n ( D ) i = 1,2 , . . . , N
A ( x i , D ) = U ( x i , D ) T ( x i , D )

式中: U ( x i , D ) T ( x i , D )分别表示删除每个样本前后样本间距离标准差的变化比率、样本均值的变化比率。当样本分散度低、紧密度高时,样本对数据集的影响就越大,样本的亲和度就越小26

(4)将样本亲和度归一化,以此保证亲和度与 s 1 ( x i )在同等数量级上,得到隶属度 s 2 ( x i ) = - A ( x i ),计算得到最终的隶属度函数 s ( x i ) = s 1 ( x i ) + s 2 ( x i )。再将 s ( x i )归一化,防止隶属度为负的情况的出现。

参数c的区间为 c = { 2 - 5 , 2 - 4 , . . . , 2 15 },参数 γ的区间为 γ = { 2 - 15 , 2 - 14 , . . . , 2 3 }。为了防止数据集正负样本不平衡对分类精度的影响,本文在参数c的设定上使用文献[27]的方式,对不同类样本赋以不同的惩罚项 c + = c - ( N - p ) / p,其中 c + c -分别为少类样本与多类样本的惩罚项; p表示少类样本个数; N - p为多数类样本个数。

1.4 交叉验证和性能评估

本文使用十折交叉验证来评估模型,具体为灵敏度(SN)、特异度(SP)、准确率(ACC)、马氏相关系数(MCC)和ROC曲线下面积(AUC) 5个指标,前4个指标定义为

S N = 1 - N - + / N +
S P = 1 - N + - / N -
A C C = 1 - ( N - + + N + - ) / ( N + + N - )
M C C = ( 1 - ( N - + / N + + N + - / N - ) ) ( 1 + ( N + - - N - + ) / N + ) ( 1 + ( N - + - N + - ) / N - )

式中: N +为糖化位点个数; N - +为错误预测为非糖化位点的糖化位点个数; N -为非糖化位点个数; N + -为被错误预测为糖化位点的非糖化位点个数。

2 结果和讨论

2.1 FSVM_GlySite的表现

通过十折交叉验证得到的AUC值作为模型FSVM_GlySite的评价指标。由于FSVM_GlySite是在文献[15]的训练数据集上进行训练的,本文还将FSVM_GlySite与BPB_GlySite15进行了比较。如表1所示,FSVM_GlySite得到的SNSP、ACC、MCC和AUC(64.62%、73.92%、70.82%、37.27%和76.40%)均高于BPB_GlySite方法(63.68%、72.60%、69.63%、34.99%和76.22%)。这是由于本文进行两步特征加权的方式可以最大程度地放大重要和次重要特征与弱相关和不相关特征在权重上的差值,有效地避免了后者对分类的干扰,加强了相对重要特征对分类的贡献,并且在考虑了样本亲和度后,衡量了每个样本的存在与否对数据集的影响;利用样本内部的分布情况对隶属度函数做出了适当修正,减少了仅使用样本与类中心距离作为隶属度函数时对数据集几何形状的依赖,降低了噪声和野点对分离超平面的干扰。本文使用了聚类的方式获得类中心,相比于求平均值计算出的类中心,其含有数据集中更多的样本信息,有助于获取更准确的样本隶属度值。虽然FSVM_GlySite在SP上低于Gly-PseAAC14的74.30%,但是在SN上有着显著的提升(57.48%),说明FSVM_GlySite可以更精确地识别赖氨酸糖化位点。

2.2 FSVM_GlySite与现有预测方法的比较

为了进一步评估FSVM_GlySite的有效性,将其与其他现有的预测方法进行比较,包括NetGlycate12、PreGly13、Gly-PseAAC14和BPB_GlySite15。由于NetGlycate和PreGly都是在包含89个糖化位点和126个非糖化位点的Johansen基准数据集[12]上训练的。因此,将本文算法与BPB_GlySite和Gly-PseAAC也通过Johansen基准数据集上的十折交叉验证进行重新训练。比较结果见表2,其中FSVM_GlySite的SN、ACC、MCC和AUC值最高,分别为87.64%、87.91%、75%和92%。虽然PreGly获得了最高的SP值(95.85%),但Sn值(71.06%)远低于FSVM_GlySite(87.64%),这表明PreGly倾向于将赖氨酸残基预测为非糖化位点,其识别的糖化位点明显少于FSVM_GlySite,因此在Johansen基准数据集上,FSVM_GlySite同样优于现有的糖化位点预测器。

3 结论

本文提出一种新的基于两步特征加权的模糊支持向量机算法,并结合Bi-Profile Bayes方法构建了一个赖氨酸糖化位点预测模型FSVM_GlySite。实验结果表明,模糊支持向量机算法的分类性能效果好于标准的支持向量机算法,并且所提出的预测模型的预测效果优于现有的糖化位点预测方法。然而,本文所采用的是单一的特征编码方法,后续的工作将会尝试融合更多特征的方法,进一步提升预测模型的性能。

参考文献

[1]

Miller A K Hambly D M Kerwin B A,et al .Characterization of site-specific glycation during process development of a human therapeutic monoclonal antibody[J].Journal of Pharmaceutical Sciences2011100(7):2543-2550.

[2]

Cho S J Roman G Yeboah F,et al. The road to advanced glycation end products: a mechanistic perspective[J]. Current Medicinal Chemistry200714(15):1653-1671.

[3]

Lapolla A Fedele D Martano L,et al.Advanced glycation end products:a highly complex set of biologically relevant compounds detected by mass spectrometry[J].Journal of Mass Spectrometry200136(4):370-378.

[4]

Garlick R L Mazer J S. The principal site of nonenzymatic glycosylation of human serum albumin in vivo[J]. Journal of Biological Chemistry1983258(10):6142-6146.

[5]

Shilton B H Walton D J. Sites of glycation of human and horse liver alcohol dehydrogenase in vivo[J]. Journal of Biological Chemistry1991266(9):5587-5592.

[6]

Schleicher E Wieland O H.Kinetic analysis of glycation as a tool for assessing the half-life of proteins[J].Biochimica et Biophysica Acta (BBA) - General Subjects1986884(1):199-205.

[7]

Ahmed N Babaei-Jadidi R Howell S K,et al. Degradation products of proteins damaged by glycation, oxidation and nitration in clinical type 1 diabetes[J]. Diabetologia200548(8):1590-603.

[8]

Agalou S Ahmed N Babaei-Jadidi R,et al.Profound mishandling of protein glycation degradation products in uremia and dialysis[J].Journal of the American Society of Nephrology200516(5):1471-1485.

[9]

Ling X Sakashita N Takeya M,et al. Immunohistochemical distribution and subcellular localization of three distinct specific molecular structures of advanced glycation end products in human tissues[J]. A journal of technical methods and pathology199878(12):1591-606.

[10]

Zhang Q B Ames J M Smith R D,et al.A perspective on the Maillard reaction and the analysis of protein glycation by mass spectrometry:probing the pathogenesis of chronic disease[J].Journal of Proteome Research20098(2):754-769.

[11]

Thornalley P J Rabbani N.Detection of oxidized and glycated proteins in clinical samples using mass spectrometry-a user’s perspective[J].Biochimica et Biophysica Acta (BBA)-General Subjects20141840(2):818-829.

[12]

Johansen M B Kiemer L Brunak S.Analysis and prediction of mammalian protein glycation[J].Glycobiology200616(9):844-853.

[13]

Liu Y Gu W X Zhang W Y,et al.Predict and analyze protein glycation sites with the mRMR and IFS methods[EB/OL].(2015-04-15)[2022-04-10].

[14]

Xu Y Li L Ding J,et al. Gly-PseAAC: identifying protein lysine glycation through sequences[J]. Gene2017602(4):1-7.

[15]

Ju Z Sun J H Li Y J,et al. Predicting lysine glycation sites using bi-profile bayes feature extraction[J]. Computational Biology and Chemistry201771(2):98-103.

[16]

Lin C F Wang S D. Fuzzy support vector machines[J]. IEEE Transactions on Neural Networks200213(2):464-471.

[17]

魏鑫,张雪英,李凤莲,面向非平衡数据集分类的改进模糊支持向量机[J].计算机工程与设计201940(11):3124-3129,3199.

[18]

李村合,姜宇,李帅. 基于不等距超平面距离的模糊支持向量机[J]. 计算机系统应用202029(10):185-191.

[19]

Wang T H Qiu Y Z Hua J L.Centered kernel alignment inspired fuzzy support vector machine[J].Fuzzy Sets and Systems2020394(9):110-123.

[20]

左喻灏,贾连印,游进国, 基于Relief-F特征加权的模糊支持向量机的分类算法[J]. 化工自动化及仪表201946(10):834-838,864.

[21]

Liu Z X Wang Y B Gao T S,et al.CPLM:a database of protein lysine modifications[J].Nucleic Acids Research201442(1):531-536.

[22]

Shao J L Xu D Tsai S N,et al.Computational identification of protein methylation sites through bi-profile Bayes feature extraction[J].PLoS One20094(3):4920.

[23]

Ju Z Gu H.Predicting pupylation sites in prokaryotic proteins using semi-supervised self-training support vector machine algorithm[J].Analytical Biochemistry2016507(5):1-6.

[24]

刘玉. 基于机器学习的蛋白质翻译后修饰位点预测算法研究[D]. 合肥:中国科学技术大学,2021.

[25]

魏欣,贾建华. 基于集成支持向量机的蛋白质K丙二酰化位点的预测[J]. 景德镇学院学报202136(3):81-84,91.

[26]

李娟,王宇平. 结合紧密度和分散度的近邻亲和相似度函数[J]. 西安电子科技大学学报201441(3):123-130.

[27]

Veropoulos K Campbell C Cristianini N. Controlling the senesitivity of support vector machines[J]. Proceedings of the International Joint Conference on Artificial Intelligence199912(2):55-60.

基金资助

国家重点研发计划子项(2019YFC1903901-01)

AI Summary AI Mindmap
PDF (620KB)

275

访问

0

被引

详细

导航
相关文章

AI思维导图

/