遗传密码具有通用性和简并性的特点
[1]。某种同义密码子的使用频率高于其他同义密码子的现象称为密码子使用偏好性(Codon usage bias,CUB)
[2-3]。密码子偏好性可影响蛋白质的翻译效率、翻译的准确性、共翻译折叠及转录等
[4-5]。此外,密码子偏好性在不同物种间差异较大
[6-7]。因此,研究密码子的偏好性有助于深入了解物种特定或相关基因的表达模式及机制,为基因功能验证、异源表达、宿主或供体基因选择提供理论基础
[5,8]。
芸香科、豆科、伞形科、木犀科等74科植物中均具有香豆素类化合物
[9]。香豆素具有抗病毒、抗炎、诱导癌细胞凋亡等药理作用
[10]。此外,在植物的生长发育、逆境应答、调节根系微生物群落结构等方面均具有重要作用
[11]。秦皮为陕西道地药材之一,具有清热燥湿、收涩止痢、止带、明目的功效
[12]。白蜡树(
Fraxinus chinensis Roxb.)为秦皮的基原植物之一,秦皮的主要成分为秦皮甲素、秦皮乙素等香豆素类物质
[13]。在香豆素生物合成途径中,中间代谢产物阿魏酰CoA,在阿魏酰CoA6'-羟化酶(feruloyl-CoA6'-hydroxylase1,
F6'
H1)的作用下发生邻羟基化生成6-羟基阿魏酰CoA,然后经香豆素合酶作用形成东莨菪内酯
[14]。
F6'
H是东莨菪内酯生物合成的控制酶,在东莨菪内酯8-羟化酶作用下,东莨菪内酯转化成秦皮素
[15]。
F6'
H属于2-氧戊二酸依赖双加氧酶(2-oxoglutarate-dependent dioxygenases,2OGDs)超家族
[16]。王蕾等
[17]对大豆(
Glycine max(L.) Merr.)
GmF6′H1基因进行了克隆与功能验证,采用农杆菌介导法将大豆
GmF6′H1转入拟南芥(
Arabidopsis thaliana)
Atf6′h1突变体,转基因拟南芥中香豆素的含量高于拟南芥
Atf6′h1突变体,与野生型拟南芥中香豆素的含量接近。
目前,对白蜡树中香豆素类物质的生物合成途径尚未有系统研究。前期已对白蜡树叶片和枝皮进行了全长转录组测序
[18],以获得的全长转录本为参考,通过分析得到1个白蜡树
FcF6′H1基因。本研究通过将白蜡树
FcF6′H1基因与芸香科、豆科、伞形科、木犀科以及模式植物烟草(
Nicotiana tabacum)、拟南芥、番茄(
Solanum lycopersicum)中香豆素合成相关的
F6′H1基因进行比较分析,明确
FcF6′H1基因的密码子偏好性与进化关系,通过比较白蜡树
FcF6′H1和模式生物密码子频率,确定合适的异源表达宿主,旨在为后续探究白蜡树
FcF6′H1基因的功能特别是异源表达提供理论依据。
1 材料和方法
1.1 序列数据的获得
白蜡树
FcF6′H1(Isoform0057303)的CDS序列来源于陕西中医药大学前期对白蜡树全长转录组测序结果
[18],芸香科、豆科、伞形科、木犀科以及模式植物拟南芥、烟草和番茄中58条序列来源于GenBank,详细信息如
表1所示。拟南芥、烟草、番茄、大肠杆菌(
Escherichia coli)、酵母菌(
Saccharomyces cerevisiae)基因组密码子偏好性数据来源于密码子使用数据库Codon Usage Database(
http://www.kazusa.or.jp/codon/)
[8]。
1.2 密码子偏好性参数分析
密码子组成分析利用软件codonW和EMBOSS(
https://www.bioinformatics.nl/emboss-explorer/)的cusp
[19]分析,主要包括密码子第3位各个碱基(A3s、C3s、G3s、T3s)的频率、密码子适应指数(Codon adaptation index,CAI)、第1~3位碱基的G+C含量(GC1、GC2和GC3、)、第1和第2位碱基G+C含量(GC12)、同义密码子相对使用度(Relative synonymous codon usage value,RSCU)、有效密码子数(Effective number of codons,ENC)。参数的相关性利用IBM SPSS Statistics 22软件分析,利用联川生物云平台高级热图在线工具(
https://www.omicstudio.cn/tool/4)进行RSCU的热图绘制。
1.3 中性绘图分析、ENC-plot分析和PR2-plot 偏倚分析
以GC12为纵坐标、GC3为横坐标,利用Excel软件进行中性绘图,分析影响密码子偏好性的因素
[20]。若GC12与GC3无显著差异,散点沿对角线分布,表明突变是影响其密码子偏好性的主要因素;若散点偏离对角线,则表明自然选择是主要的影响因素
[20]。
利用ENC-plot分析展示ENC和GC
3的函数关系,标准曲线ENC=2+GC3+29/(2×GC3
2‒2×GC3+1)
[20-21]。其中,若散点位于曲线上,表示密码子偏好性由碱基突变产生;若散点远离标准曲线,则表示自然选择是其主要影响因素
[22]。
以A3/(A3+T3)值为纵坐标、G3/(G3+C3)值为横坐标绘图,图中中心A=T且C=G横纵坐标均为0.5,从该中心出发的矢量表示奇偶性的方向与程度
[20,23]。
1.4 最优密码子分析
将各物种的
F6′H1序列根据ENC值排序,从两端各选10%的基因建立高低偏性库,计算△RSCU值
[20]。最优密码子确定:高表达基因库中RSCU>1,低表达基因库中RSCU<1且△RSCU≥0.2
[24]。
1.5 分子进化树构建
使用MEGAX软件邻接法(Neighbor-joining)构建不同物种
F6′H1基因的CDS系统进化树,参数重复值设置为1 000
[8]。
1.6 FcF6′H1基因受体的选择
选择
FcF6′H1基因的合适表达宿主,计算其与多个模式物种基因组密码子使用频率之间的比值,确定最合适的异源表达受体
[25]。
2 结果与分析
2.1 F6′H1基因密码子偏好性分析
白蜡树
FcF6′H1的 A3s、C3s、G3s、T3s频率分别为0.311 1、0.236 7、0.318 4和0.424 0,GC、GC1、GC2、GC3和GC12含量分别为0.431 2、0.512 5、0.349 0、0.432 1和0.430 8,G+C含量占比较低,A/T含量>G/C含量,表明白蜡树
FcF6′H1基因偏好以A/T结尾。CAI值为0.216,表明
FcF6′H1基因偏好性较弱。由
表1可知,20个物种59条
F6′H1序列的GC含量为0.333 3~0.465 5,平均值0.412 6;GC1含量为0.443 2~0.550 7,平均值0.505 6;GC2含量为0.310 9~0.367 8,平均值0.341 3;GC3含量为0.227 1~0.532 6,平均值0.390 8;GC12含量为0.386 1~0.449 3,平均值0.423 5;ENC含量为42.28~60.34,平均值50.82;CAI值0.166~0.254,平均值0.197,CBI值-0.201~0.075,平均值-0.1,表明密码子的偏好性较弱。在木犀科、豆科、伞形科和芸香科中,伞形科GC含量最高(0.443 9),木犀科和豆科平均GC含量均较低,分别为0.413 5和0.417 4。在4个科中,不同物种
F6′H1的ENC值存在差异,表明密码子偏好性不同,其中伞形科的平均ENC值最高(56.15),表明密码子偏好性较弱;豆科平均ENC值最低(49.37),表明密码子偏好性相对较强。
利用IBM SPSS Statistics 22软件对密码子GC、GC1、GC2、GC3、GC12含量和ENC值进行相关性分析,结果表明(
表2),20个物种
F6′H1基因GC与GC1、GC2、GC3、GC12呈极显著正相关(
P<0.01),表明密码子3个碱基组成较相似;GC、GC1、GC3、GC12与ENC呈极显著正相关(
P<0.01),GC2与ENC呈显著正相关(
P<0.05),表明GC含量越高,ENC值越高,密码子偏好性越弱。
2.2 中性绘图分析、ENC-plot分析和PR2-plot 偏倚分析结果
对不同物种
F6′H1基因进行中性绘图分析,结果显示如
图1所示。
由
图1可知,GC12与GC3的相关系数为0.741,回归系数为0.168 9,表明20个物种
F6′H1基因中3个位置上碱基组成不存在明显差异。
FcF6′H1基因位于对角线上,部分基因分布在对角线较近的位置,表明碱基突变是影响其密码子偏好性的主要因素。而其他物种的
F6′H1基因分布在对角线较远的位置上,表明影响其密码子偏好性的主要因素是自然选择。
ENC-plot分析结果如
图2所示,少部分基因沿标准曲线分布,表明碱基突变对其密码子偏好性影响较大;而
FcF6′H1和其他大部分基因位于标准曲线下方,表明自然选择是影响其密码子偏好性的主要因素。
奇偶偏好性结果显示(
图3),
F6′H1基因在4个平面内分布不均衡,大多数
F6′H1基因的坐标值偏离了0.5,从横坐标来看,大多数基因小于0.5,表明第3位上U的比例大于A,密码子在A和U之间具有一定的偏好性;从纵坐标来看,大多数大于0.5,表明第3位上密码子偏好G高于C。
Fc F6′H1基因位于左上方,A小于T,G大于C。若
F6′H1基因完全受到突变压力的作用,A/T和G/C的使用频率应相等
[24]。奇偶偏好性结果表明,20个物种
F6′H1基因进化过程中除碱基突变外,自然选择亦会影响密码子偏好性。
2.3 F6′H1基因密码子的相对使用度(RSCU)分析
当RSCU=1.0时,表示密码子不具有偏好性;当RSCU>1.0时,表示密码子偏好性较强;当RSCU<1.0时,表示密码子偏好性较弱;RSCU=0时,表示密码子不参与翻译
[26]。白蜡树
FcF6′H1基因密码子RSCU分析结果中有24个密码子的RSCU值>1,其中16个以A/U结尾,8个以G/C结尾,表明
FcF6′H1基因密码子偏好以A/U结尾密码子。密码子UAA、AGG和GGU的RSCU值分别为3.0、2.5和2.0,表明具有优先选择性;AGU、UAG和UGA的RSCU值均为0,表明
FcF6′H1基因缺失这些密码子。
20个物种
F6′H1基因RSCU分析结果如
表3所示,20个物种
F6′H1基因密码子的相对使用度(RSCU)分析结果中,有28个密码子的RSCU值>1,其中22个以A/U结尾,6个以G/C结尾,表明20个物种
F6′H1基因密码子偏好以A/U结尾密码子。RSCU较高的3个密码子是AGA(2.17)、AGG(2.04)和UGA(1.9),表明其密码子偏好性较强。
聚类热图结果显示(
图4),分为8个小支,烟草XM_016619361.1、XM_016610138.1和番茄XM_004228918.2、XM_010328989.3聚为一支;豆科植物牧豆树XM_054926754.1、XM_054942588.1,绿豆XM_014660601.2和豇豆XM_028052360.1聚为一支;番茄XM_004251192.4,伞形科野胡萝卜XM_017367700.1、芸香科血橙XM_006445579.2、XM_006488844.4和烟草XM_016606995.1、XM_016635503.1聚为一支。木犀科植物白蜡树FcF6H1基因,木樨榄XM_023036788.1、XM_023028611.1、XM_023034893.1和豆科植物相思子XM_027486381.1,大豆XM_003530041.3,野大豆XM_028384402.1聚为一支;豆科植物落花生XM_021111754.1、XM_025822317.1、XM_016318780.2、XM_025818674.1、XM_025769767.2和蔓花生XM_016092410.3聚为一支;豆科植物相思子XM_027486998.1、XM_027488094.1,木豆XM_020384523.2,菜豆XM_007146169.1、XM_007146170.1,豇豆XM_028074878.1,大豆NM_001253251.3,野大豆XM_028359722.1,红车轴草XM_045956028.1、XM_045961390.1,蒺藜苜蓿XM_003599672.4、XM_039832318.1聚为一支;烟草XM_016581648.1、XM_016627673.1、XM_016605403.1、XM_016609607.1、XM_016590293.1,番茄XM_004251191.3、XM_004251392.4、XM_004251190.4,狭叶羽扇豆XM_019609848.1,木豆XM_020369703.2,大豆XM_003520322.5,野大豆XM_028369093.1,木樨榄XM_023043182.1,菜豆XM_007134245.1,赤豆XM_017586437.2聚为一支;伞形科野胡萝卜XM_017366063.1、XM_017401370.1、XM_017366059.1和拟南芥NM_104404.4、NM_112207.4聚为一支。
2.4 最优密码子分析
表4结果确定了
F6′H1基因的6个最优密码子,分别是CUC(△RSCU 0.69)、AUC(△RSCU 0.44)、AAG(△RSCU 0.23)、GAG(△RSCU 0.3)、UCG(△RSCU 0.97)、ACA(△RSCU 0.45)。
2.5 不同物种F6′H1基因的系统进化树
对20个物种59条序列构建系统进化树分析,结果显示(
图5),聚为6小枝,白蜡树
FcF6′H1与木樨榄XM_023028611.1、XM_023036788.1、XM_023034893.1,烟草XM_016627673.1、XM_016581648.1、XM_016619361.1、XM_016606995.1聚为一类。伞形科野胡萝卜XM_017366059.1、XM_017366063.1、XM_017367700.1、XM_017401370.1与拟南芥NM_112207.4、NM_104404.4聚为一类。芸香科血橙XM_006445579.2、XM_006488844.4与部分豆科植物聚为一类,分别是牧豆树XM_054926754.1,落花生XM_016318780.2、XM_021111754.1、XM_025769767.2、XM_025818674.1、XM_025822317.1,蔓花生XM_016092410.3,狭叶羽扇豆XM_019609848.1,赤豆XM_017586437.2,绿豆XM_014660601.2,菜豆XM_007134245.1,木豆XM_020369703.2,大豆XM_003520322.5、XM_003530041.3,野大豆XM_028369093.1、XM_028384402.1聚为一类。其他豆科植物聚为一类。
2.6 FcF6′H1基因的异源受体选择
白蜡树遗传转化体系尚未见报道,因此,其基因功能验证需借助模式生物进行异源表达。将
FcF6′H1基因密码子使用频率与模式生物基因组密码子使用频率比较,比值在0.5~2.0范围内表示物种间密码子偏好性较一致。从
表5可以看出,
FcF6′H1基因与拟南芥、番茄、烟草的基因组密码子使用频率差异较大的个数分别是11、8、8个,表明番茄和烟草可作为
FcF6′H1基因的遗传转化受体;与酵母菌、大肠杆菌的基因组密码子使用频率差异较大的个数分别是15、9个,表明大肠杆菌更适合
FcF6′H1基因的异源表达。
3 结论与讨论
本研究表明,白蜡树
FcF6′H1的GC、GC1、GC2、GC3和GC12含量分别为0.431 2、0.512 5、0.349 0、0.432 1和0.430 8,CAI值为0.216,ENC值为57.84,G+C含量占比较低,表明白蜡树
FcF6′H1基因偏好以A/T结尾,密码子偏好性较弱。这与西伯利亚杏
PsSOC1-like基因密码子偏好性
[8]、罗布麻
AvFLS基因密码子偏好性
[25]分析结果类似。白蜡树
FcF6′H1基因密码子中UAA、AGG和GGU具有优先选择性,缺失AGU、UAG和UGA这3个密码子,表明在进化过程中逐渐淘汰了以上3个密码子,而具体的进化机制有待于深入研究。
长期的自然进化使各近缘物种或基因表现出相似的密码子偏好模式,因此,密码子使用法则也常作为物种或基因分类、起源、进化和亲缘关系研究的重要参考依据
[27]。
F6′H1基因的CDS进化树和RSCU值聚类分析结果并不完全一致。例如,CDS进化树分析结果中,白蜡树
FcF6′H1与木樨榄XM_023028611.1、XM_023036788.1、XM_023034893.1,烟草XM_016627673.1、XM_016581648.1、XM_016619361.1、XM_016606995.1聚为一类。而RSCU值聚类分析结果中,木犀科植物白蜡树
FcF6′H1,木樨榄XM_023036788.1、XM_023028611.1、XM_023034893.1和豆科植物相思子XM_027486381.1,大豆XM_003530041.3,野大豆XM_028384402.1聚为一支。CDS进化树和RSCU值聚类分析结果均表明,白蜡树
FcF6′H1与木樨榄XM_023028611.1、XM_023036788.1、XM_023034893.1聚为一类。文献报道,基于RSCU值聚类分析,可将单子叶植物和双子叶植物查尔酮异构酶CHI归为2类,而单双子叶内部亚类群结构中的RSCU分类与CDS聚类结果仍存在较大差异
[27];黄酮醇合成酶
FLS基因的CDS序列进化树和RSCU值聚类分析的比较结果表明,
FLS基因CDS的差异大小更符合亲缘关系的分类规律,而密码子偏好性的聚类分析结果可能很好地反映了
FLS基因的某些特异性进化规律
[25]。因此,为了准确地反映不同物种的进化历史,RSCU值聚类分析结合CDS序列进化分析是最佳选择。
突变压力和自然选择效应是生物体密码子偏好性形成的关键因素,这2种作用力在不同物种中并非均等存在
[27-28]。蒺藜苜蓿基因组密码子偏好性主要受碱基突变影响
[29],而拟南芥密码子偏好性受碱基突变和自然选择的双重影响
[30],中华猕猴桃GRAS家族密码子偏好性主要受自然选择压力的影响
[31]。中性绘图分析结果中,
FcF6′H1基因位于对角线上;ENC-plot分析结果中,
FcF6′H1基因位于标准曲线下方。表明碱基突变和自然选择均会影响
FcF6′H1基因密码子的偏好性。奇偶偏好性结果中,大多数
F6′H1基因的A/T和G/C的使用频率不相等,表明20个物种
F6′H1基因进化过程中除碱基突变外,自然选择亦会影响密码子的偏好性。
香豆素类化合物是白蜡树的主要药效成分,
F6′H1是香豆素类化合物生物合成的关键基因,但是白蜡树的遗传背景和相关基因调控机制尚未阐明,严重制约了香豆素类化合物的理论研究和开发利用。采用模式生物进行基因外源表达是目前基因功能研究的有效手段之一。本研究通过白蜡树
FcF6′H1基因与模式生物基因组密码子偏好性比较,表明番茄、烟草、大肠杆菌可作为
FcF6′H1基因的遗传转化受体。但目标基因能否高效表达,主要受到表达载体、基因表达量、蛋白质合成、转化体系、培养基等因素的共同影响
[8,25]。因此,如何使
FcF6′H1基因高效遗传转化还需更深入研究。
本研究对密码子偏好性参数进行分析,结果表明,FcF6′H1基因密码子偏好以A/U结尾,且密码子偏好性较弱。RSCU值和CDS序列聚类分析结果并不完全一致,但CDS序列进化分析更符合物种亲缘关系的远近程度。中性分析、ENC-plot分析及PR2-plot分析结果表明,FcF6′H1基因偏好性主要受碱基突变的影响,但是自然选择仍具有一定影响。模式生物中番茄和烟草适合作为遗传转化受体,大肠杆菌表达系统适合作为FcF6′H1的异源表达载体。