蛋白质在生命活动中发挥重要作用,其功能和生物活性与空间结构有密切的关系
[1]。如果蛋白质不能折叠成各自的空间结构,就不能正常发挥作用。非活性蛋白质可能与错误折叠有关,细胞死亡或组织损伤也可能是由错误折叠的蛋白质而引起的
[2⁃3],所以蛋白质折叠问题受到广泛关注。探索蛋白质折叠机制、找到与蛋白质折叠有关的因素是研究重点和难点。文献报道了蛋白质折叠速率和蛋白质三级结构之间的关系,开启蛋白质折叠速率与相关因素的序幕,接着发现蛋白质二级结构和氨基酸序列也对蛋白质折叠速率有影响
[4⁃7]。
共翻译折叠理论是目前相关研究普遍接受的,认为mRNA在核糖体上翻译时,蛋白质折叠就开始了
[8⁃11]。mRNA的结构和序列都将直接影响核糖体沿mRNA出现的速度,由共翻译折叠理论可知,这种影响必然会传递到对蛋白质折叠速率的作用
[12⁃14]。相关研究揭示了mRNA二级结构中的某些参量对蛋白质折叠速率有重要影响
[15⁃19],鉴于三级结构是二级结构通过氢键及其他相互作用折叠而产生的,包含更多的信息,本文推测mRNA三级结构可能在蛋白质折叠过程中具有重要作用。目前已有mRNA三级结构的相关研究,并得到了3dRNA和X3DNA等相关软件
[20],这些工具为本研究提供了有力支撑。前期研究已经发现mRNA三级结构中的局部碱基对参量(Shear、Stretch、Stagger、Buckle、Propeller、Opening)和局部碱基对梯阶参量(shift、slide、rise、tilt、roll、twist)都是影响蛋白质折叠速率的重要因素,并发现一些定量的结果,考虑到局部碱基对螺旋结构必定影响mRNA延核糖体的延伸速率,结合共翻译折叠理论,进而影响相应蛋白质的折叠速率。本研究提取了描述三级结构中的局部碱基对螺旋结构的参量,分别为三个平移参量
X-disp(d
x),
Y-disp(d
y)和
h-Rise
(h),三个旋转参量Incl(
η),Tip(
θ)和
h-Twist(
Ωh ),这六个参量可以描述沿中心螺旋轴的双链结构中每个碱基对的位置
[21],因此局部碱基对螺旋参量是影响mRNA三级结构形成的基本参量,它们会直接影响核糖体沿着mRNA出现的速度,进而影响蛋白质的折叠速率。因此,本文整理了一个具有折叠速率实验值的蛋白质数据库,利用相关软件预测这100个蛋白质相应的mRNA三级结构参量,筛选出局部碱基对螺旋参量的数据,分析它们与相应蛋白质折叠速率的相关性,研究mRNA三级结构局部碱基对螺旋参量对蛋白质折叠速率的影响。
1 材料与方法
1.1 数据集
从相关文献以及蛋白质折叠数据库去除冗余数据,构建了一个包含100个蛋白质的新数据集
[4,22⁃23],这些数据都是在共识的标准条件下测量,每个蛋白质折叠速率都是唯一的
[24]。按其折叠类型划分为两类,二态蛋白质和多态蛋白质;进一步根据二级结构可分为三类,全α类蛋白质,全β类蛋白质和混合(α-β)类蛋白质(具体数据略)。蛋白质折叠速率的值从几微秒到几个小时,取值范围很大。前期研究蛋白质折叠速率用自然对数In(
kf )表示,为了在图表中进行比较,本研究中仍用自然对数表示蛋白质折叠速率。
1.2 mRNA三级结构局部碱基对螺旋参量
对比RASP和KB等RNA三级结构预测软件,3dRNA软件在识别RNA天然结构以及大量近天然RNA三级结构方面更具优势
[25],3dRNA软件团队在2015年通过整合进化过程中的共突变信息,进一步优化了该软件在三级结构预测中的准确性
[26],而后又在2020年改进了模板库中的模板数量,增加了大约十倍,使该软件的预测精确度显著提高
[27]。因此,利用3dRNA和X3DNA等相关软件预测mRNA的三级结构,先利用RNAfold软件对每个蛋白质的mRNA二级结构进行预测,再将每一个蛋白质的mRNA二级结构和序列信息录入3dRNA软件中,3dRNA使用片段组装方法来构建mRNA的三级结构。根据给定的二级结构,3dRNA首先将RNA分解成不同类型的最小二级元件(SSE),其次对于每个SSE,3dRNA从三级结构模板库中搜索具有最高序列相似性的适当三级结构模板,最后将全部的三级结构模板组装在一起,形成一个完整的三级结构,随后再进行细化程序
[20]。同时系统给出了pdb形式的位置坐标,将它输入X3DNA软件中,即可算出每个蛋白质对应的mRNA三级结构信息,从中提取出局部碱基对螺旋参量,即
X-disp、
Y-disp、Incl(
η)、Tip(
θ)、
h-Twist和
h-Rise。其中
X-disp是碱基对沿
x轴的偏移量,
Y-disp是碱基对沿
y轴的偏移量,Incl(
η)是碱基对围绕
x轴旋转的角度,Tip(
θ)是碱基对围绕
y轴旋转的角度
[28],
h-Twist是twist在垂直于中心螺旋轴平面内投影
[29],
h-Rise是沿着螺旋轴的两个连续碱基对之间的距离
[30]。然后用
公式(1)计算六个参量在各个蛋白质对应mRNA中每类碱基对梯阶下的平均值。
其中:
是某一个蛋白质对应的mRNA三级结构中第
i个局部碱基对梯阶的第
j种螺旋参量的平均值,
i是不同的局部碱基对梯阶类型,取值范围1~246,详细的取值参见
表1(该表中仅列出了计算结果中包含的梯阶种类);
j是6种不同的参量;
NLijk 是某一个蛋白质第
i个局部碱基对梯阶的第
j种螺旋参量的第
k个值;
n则是该蛋白质第
i个局部碱基对梯阶的第
j种螺旋参量值的数量。
1.3 回归分析
将计算所得蛋白质相应的mRNA中不同碱基对梯阶下的X-disp、Y-disp、Incl(η)、Tip(θ)、h-Twist和h-Rise的平均值与对应的蛋白质折叠速率进行线性回归,通过P检验验证回归模型的显著性,以确保所观察到的关系具有可靠的统计基础。
2 研究结果
2.1 mRNA三级结构中局部碱基对螺旋参量与蛋白质折叠速率的相关性
首先对数据集中100个蛋白质相应的mRNA中局部碱基对螺旋参量求平均值,然后进行不同碱基对梯阶下的局部碱基对螺旋参量值与相应蛋白质折叠速率的线性回归分析,结果见
表2。为直观显示这些参量与蛋白质折叠速率之间的相关性,本文用Sangerbox3.0绘制了所有蛋白质折叠速率与局部碱基对螺旋参量值的相关系数的小提琴图(
图1)。
从
表2可知,六个参量都会影响蛋白质的折叠速率,在大部分碱基对梯阶下,参量
X-disp、
h-Rise和Tip(
θ)与蛋白质折叠速率呈正相关,即参量
X-disp、
h-Rise和Tip(
θ)越大,蛋白质的折叠速率越快;而参量
Y-disp和Incl(
η)与蛋白质折叠速率呈负相关性,即参量
Y-disp和Incl(
η)越大,蛋白质的折叠速率越慢。参量
h-Twist在不同梯阶下对蛋白质折叠速率的影响趋势不同,在梯阶AU/AU、CG/CU、GG/AU和GG/CU下两者呈正相关;在梯阶AA/AA、AU/GA和GU/GG下两者呈负相关。由
图1也可以发现,大多数碱基对梯阶下,参量
X-disp和Tip(
θ)都与蛋白质折叠速率呈正相关,参量
Y-disp和Incl(
η)都与蛋白质折叠速率呈负相关。
2.2 局部碱基对螺旋参量与不同折叠类蛋白质折叠速率的相关性
已有相关工作表明,在预测蛋白质折叠速率方面,同一参量对不同折叠类蛋白质折叠速率的影响存在差异。本文将蛋白质分为二态蛋白质和多态蛋白质,然后对不同类型的蛋白质进行了mRNA局部碱基对螺旋参量对蛋白质折叠速率的相关性分析。结果见表3-4。蛋白质折叠速率随相应mRNA局部碱基对螺旋参量的变化关系如
图2和
图3所示。
由
表3可知,在二态蛋白质中,参量
X-disp在所有梯阶下均与蛋白质折叠速率呈正相关,参量
Y-disp在所有梯阶下均与蛋白质折叠速率呈负相关,此外参量Tip(
θ)和
h-Twist在多数梯阶下与蛋白质折叠速率呈正相关。然而参量
h-Rise和Incl(
η)对蛋白质折叠速率的影响在不同梯阶下呈不同趋势,如蛋白质折叠速率与参量
h-Rise在AG/CC、CU/AA和UG/CC梯阶下和参量Incl(
η)在CA/UG、CC/CG和GA/UA梯阶下呈正相关,而与参量
h-Rise在AA/AA和CU/AG梯阶下以及参量Incl(
η)在AA/AG、AU/AA和UU/AC梯阶下则呈负相关。
由
表4可知,在多态蛋白质中,参量
h-Twist在所有梯阶下均与蛋白质折叠速率呈正相关。大部分梯阶下,参量
Y-disp和参量Tip(
θ)与蛋白质折叠速率呈负相关。而参量
X-disp、
h-Rise和Incl(
η)由于受到梯阶不同的影响,与蛋白质折叠速率的相关性存在差异,如蛋白质折叠速率与参量
X-disp在GG/AC梯阶下、参量
h-Rise在UG/CC梯阶下以及参量Incl(
η)在CA/UG和GA/UA梯阶下均呈显著正相关;而与参量
X-disp在CU/AC和GA/UA梯阶下、参量
h-Rise在AA/AA和CU/AG梯阶下以及参量Incl(
η)在AA/AG和AU/AA梯阶下均呈负相关。
2.3 局部碱基对螺旋参量与不同二级结构类蛋白质折叠速率的相关性
在已有研究中发现,预测蛋白质折叠速率的有效参数对不同二级结构的蛋白质是不同的。因此需要分类讨论,根据蛋白质二级结构特征,将其分为全α类,全β类以及混合(α-β)类蛋白质,随后对每一类蛋白质进行mRNA局部碱基对螺旋参量对蛋白质折叠速率的相关性分析,并将结果汇总在表5-7中。
由表5-7可知,在全α类蛋白质中,没有发现参量X-disp、Incl(η)和h-Twist和蛋白质折叠速率之间的相关性;在全β类蛋白质中,参量X-disp在多数梯阶下与蛋白质折叠速率呈正相关;在混合类(α-β)蛋白质中,参量Incl(η)与蛋白质折叠速率呈负相关,同时参量h-Rise和h-Twist在多数梯阶下与蛋白质折叠速率呈正相关。全α类蛋白质折叠速率与参量Y-disp在UU/AG梯阶下、参量h-Rise和Tip(θ)在UU/AA梯阶下均呈显著正相关,而与参量h-Rise在UA/UA梯阶下呈极显著负相关。全β类蛋白质折叠速率与参量h-Rise在UU/AA梯阶下呈显著正相关,而与参量h-Rise在CU/AG梯阶下以及参量Incl(η)在AA/UA梯阶下均呈显著负相关。混合类(α-β)蛋白质折叠速率与参量Y-disp在AA/UU和GG/GC梯阶下呈显著正相关,与参量X-disp在CU/AC梯阶下、参量Y-disp在AU/GA梯阶下均呈显著负相关。
2.4 局部碱基对螺旋参量对蛋白质折叠速率影响的变化关系图
从上面的分析中可以发现,
X-disp、
Y-disp、
h-Rise、Incl(
η)、Tip(
θ)和
h-Twist六个参量与蛋白质折叠速率均有相关性,为更清楚说明这六个螺旋参量对蛋白质折叠速率的影响,以100个蛋白质对应的mRNA三级结构中各局部碱基对螺旋参量的平均值为横坐标,相应的蛋白质折叠速率为纵坐标,做蛋白质折叠速率随六个参量的变化关系图(
图4)。
由
图4可见,所有蛋白质的折叠速率随着参量
X-disp和Tip(
θ)的增大而增大,随着参量
Y-disp、
h-Rise、Incl(
η)和
h-Twist的增大而减小。
3 结论与讨论
本文选取
X-disp、
Y-disp、
h-Rise、Incl(
η)、Tip(
θ)和
h-Twist六个参量,预测mRNA三级结构局部碱基对螺旋参量对蛋白质折叠速率的影响。螺旋参量是决定mRNA三级结构构象的重要因素,也会影响mRNA延核糖体移动的速率,根据共翻译折叠理论,这种影响也会作用于相应蛋白质的折叠速率。其中参量
h-Twist的平均值与蛋白质折叠速率呈显著负相关,相关文献表明参量
h-Twist值的增大可能会抑制蛋白质的折叠,这是由于更大的
h-Twist将导致RNA紧紧缠绕,阻碍螺旋结构的解开,不利于分子轴向的伸展和收缩,分子的伸展和收缩会变得更加坚硬。较大的
h-Twist反映了更刚性的螺旋
[31],即
h-Twist越大,其表现出的柔性越小,而越小的柔性越不利于蛋白质的折叠。但将蛋白质分类后,发现在某些碱基对梯阶下呈正相关,出现这种结果的原因可能是由于不同碱基对梯阶特征的影响,如有一些碱基对梯阶包含N-H…O和N-H…N氢键,其构象稳定性就会更好,在RNA大分子的三维折叠中起更明确的作用,即会影响到mRNA的空间结构,从而促进mRNA沿核糖体的延伸过程,最终会促进蛋白质的折叠
[32]。也有可能是一些碱基对梯阶中包含GC碱基,可以提高mRNA的稳定性,并使其翻译更有效
[14]。另外,研究发现
h-Rise的波动与mRNA拉伸柔韧性直接相关
[29],参量
h-Rise的值越小,mRNA的拉伸柔韧性就越大,mRNA结构的可变性就越大,这种高柔性的mRNA结构接链所需要克服的自由能能垒就越低,最终导致更快的翻译速率,从而有效促进蛋白质的折叠
[16]。由此可见参量
h-Rise也是影响蛋白质折叠速率的一个重要因素。此外,前期研究结果表明,对于不同类的蛋白质,同一参量对蛋白质折叠速率的影响有所不同,本文的结果又一次证实该结论。如参量
X-disp在全β类蛋白质和混合类(α-β)蛋白质中都对蛋白质折叠速率有影响,但是在全α类蛋白质中对蛋白质折叠速率没有影响。
本研究发现对所有蛋白质,参量h-Rise和h-Twist会抑制蛋白质的折叠,同时mRNA三级结构局部碱基对螺旋参量对蛋白质折叠速率的影响也会受到碱基对梯阶、蛋白质类型等因素的影响,因此探究这些影响的复杂性和多样性背后的机制是未来研究的重点内容。
内蒙古自治区自然科学基金资助项目“mRNA对蛋白质折叠速率影响机制的研究”(2023MS03042)