甲羟戊酸(Mevalonate-independent,MVA)和赤藓糖(Methyl-erythritol 4-phosphate,MEP)途径是植物萜类物质的2条重要合成途径
[1]。通过这2条途径,植物不仅能够合成脱落酸(Abscisic Acid,ABA)
[2]、叶绿素和类胡萝卜素
[1]等物质,从而调控植物的生长发育、响应环境胁迫、抵御有害生物等,也能够合成青蒿素
[3]、丹参酮
[4]与紫杉醇
[5]等药用成分。异戊烯基焦磷酸异构酶(Isopentenyl pyrophosphate isomerase,IPP)位于MVA与MPE途径的交汇处,催化异戊烯焦磷酸(Isopentenyl pyrophosphate)与二甲基丙烯基焦磷酸(Dimethylallyl pyrophosphate,DMAPP)的可逆异构化反应
[1],为下游萜类产物提供合成原料。目前,已从玉蜀黍(
Zea mays)
[6]、番茄(
Solanum lycopersicum)
[7]、丹参(
Salvia miltiorrhiza)
[4]和卷叶贝母(
Fritillaria cirrhosa)
[8]等植物中分离得到
IPP基因或蛋白质,其基因长度为743~1 382 bp,编码酶的氨基酸长度为235~361 aa,均值为298 aa,相对分子质量为27.18~38.54 kDa,均值为33.38 kDa。
IPP基因可能参与多个生物学过程,其表达受到低温与盐胁迫诱导,推测
IPP基因可能参与植物抵抗多种非生物胁迫生理过程。过表达
IPP基因能提高番茄红素、胡萝卜素与类胡萝卜素的产量
[4,7,9-11]。以上研究表明,
IPP基因是调控植物萜类物质合成的重要关键基因,对其开展转基因研究,可能同时提高萜类含量与抗逆性。
鉴于IPP的重要价值,对植物IPP基因开展整体分析有助于系统认识IPP的生理功能,由此,本研究利用生物信息学方法,依托Ensemble Plant等植物基因组网站,从稻(Oryza sativa)、玉蜀黍和拟南芥(Arabidopsis thaliana)等不同单、双子叶植物中鉴定获得IPP基因,确定它们的理化性质、系统进化关系,并探究稻和拟南芥的共线性关系、保守基序和结构域、染色体定位、蛋白互作网络、顺式调控元件与非生物胁迫下的表达模式等,为深入开展IPP功能研究提供理论依据。
1 材料与方法
1.1 试验材料
稻与拟南芥由西南交通大学生命科学与工程学院药用植物资源与分子生物学实验室自行栽培获得。RNA提取采用天根生化科技(北京)有限公司TRNzol Universal总RNA提取试剂盒,cDNA合成采用塞维尔生物科技(武汉)有限公司逆转录试剂盒,荧光定量PCR采用宝日医生物技术(北京)有限公司高特异性qPCR试剂TB Green® Premix Ex Taq™ Ⅱ(Tli RNaseH Plus)。脱落酸购于源叶生物科技(上海)有限公司,聚乙二醇6000(Polyethylene glycol,PEG)购于neoFroxx GmbH(广州)。荧光定量PCR仪(qTOWER3)为德国耶拿(Analytik Jena AG)产品。
1.2 试验方法
1.2.1 IPP基因鉴定
通过Ensemble Plant数据库(
http://plants.ensembl.org/)下载拟南芥与稻等16种植物的全基因组文件、蛋白质文件与基因组注释文件。使用TBtools软件,以暗紫贝母(
Fritillaria unibracteata)
IPP基因
[12]与拟南芥
IPP基因
[13]为搜索序列,阈值设定为1×e
-5,初步筛选
IPP基因。通过InterPro数据库(
https://www.ebi.ac.uk/interpro/)鉴定结构域和重要位点,保留含有NUDIX与IDI结构域的序列。利用Batch CD-search tool网站(
https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)搜索并验证保守结构域,最终获得16个物种的31条非冗余
IPP基因。通过Expasy(
https://web.expasy.org/)计算IPP编码蛋白的氨基酸长度、相对分子质量、理论等电点和疏水性
[6]。
1.2.2 多序列比对和系统发育分析
选择MEGA-X 10.2.6软件的ClustalW方法对
IPP基因序列和蛋白质序列进行多重序列比较
[12]。以邻接法构建无根系统发育进化树,模型选择Maximum Composite Likelihood,空位处理选择Pairwise deletion,并进行1 000次的自举检验。
1.2.3 基因结构和保守基序分析
从基因组注释文件中获取
IPP基因的非编码区、外显子及内含子信息,通过MEME网站(
https://meme-suite.org/meme/tools/meme)识别
IPP基因编码蛋白的保守基序,再利用Batch CD-search tool网站预测
IPP基因编码蛋白的保守结构域
[12]。
1.2.4 共线性分析
以稻和拟南芥
IPP基因为研究对象(
表1),利用TBtools
[14]软件的GFF3/GTF Gene Position Parse功能获取所有基因位置信息,利用MCScanx模块获取基因关联信息,利用Table Row Extract or Filter模块获取目的基因复制位点信息,确定物种内及物种间的共线性关系,最后,利用Advance Circos模块对
IPP基因的共线性关系做可视化分析。
1.2.5 蛋白质互作预测
通过STRING(
https://cn.string-db.org/)分析与稻和拟南芥IPP蛋白存在相互作用的蛋白质,构建IPP蛋白互作网络,并进行功能和通路富集分析。
1.2.6 顺式作用元件预测
1.2.7 干旱与ABA胁迫下拟南芥IPP基因表达量分析
由于稻和拟南芥
IPP基因的上游序列存在可能响应干旱与ABA的顺式作用元件,因此采用Primer premier 5软件设计并合成定量PCR引物(
表2),以拟南芥
18S基因(登录号NC_003074.8)与稻
Actin基因(登录号NM_001418593.1)作为内参基因。
短期胁迫中,以100 μmol·L-1脱落酸和 200 mmol·L-1甘露醇喷施发芽3周的拟南芥基座叶,并将生长2周的稻幼苗分别浸于含有100 μmol·L-1脱落酸和16% PEG 6000的营养液,于1、2、4、8 h分别取样,荧光定量PCR检测IPP基因表达变化。在较长期胁迫试验中,将生长1周的拟南芥幼苗分别转移至含有100 μmol·L-1脱落酸和2% PEG 6000的1/2MS培养基中生长1周,并将生长2周的稻幼苗分别浸于含有100 μmol·L-1脱落酸和16% PEG 6000的营养液中生长1周,提取幼苗总RNA,荧光定量PCR检测IPP基因表达情况。
2 结果与分析
2.1 IPP基因鉴定结果
依据本研究方法,从9科16个物种中鉴定出31条非冗余的
IPP基因。其中,粱(
Setaria italica)等3种植物的
IPP成员最多,有3条,而胡萝卜(
Daucus carota var.
sativa)的
IPP成员最少,仅有1条。不同植物来源的
IPP基因序列一致性较高,达76.71%~97.71%(以
AT3G02780为目标序列)。
AT3G02780与单子叶植物
IPP的一致性为76.71%~87.62%,与双子叶植物
IPP的一致性为80.73%~97.71%,表明亲缘关系较近的植物拥有序列更相似的
IPP基因。如
表3所示,31条IPP蛋白的氨基酸长度为191~309 aa,平均长度为268 aa;相对分子质量为22.3~34.9 kDa,平均为30.5 kDa,与已报道的IPP相对分子质量范围相近
[9]。由于IPP成员的疏水值均为负值(-0.572~-0.136),因此表明它们为亲水蛋白。
2.2 系统发育进化树构建
利用邻近法构建系统进化树,按照进化关系将
IPP分为3簇(
图1)。其中第1簇的
IPP成员最多,共16条,均来自单子叶禾本科(Poaceae)(二穗短柄草(
Brachypodium distachyon)、稻、霍尔稷草(
Panicum hallii var.
hallii)、粱、狗尾草(
Setaria viridis)、高粱(
Sorghum bicolor)和玉蜀黍)。第2簇的
IPP成员来自琴叶拟南芥(
Arabidopsis lyrata)和拟南芥,均属十字花科(Brassicaceae)植物,有5条序列。第3簇包含10条序列,来自木薯(
Manihot esculenta)、菜豆(
Phaseolus vulgaris)、黄瓜(
Cucumis sativus)、葡萄(
Vitis vinifera)、马铃薯(
Solanum tuberosum)、胡萝卜和毛果杨(
Populus trichocarpa)等7个物种,分属大戟科(Euphorbiaceae)、豆科(Fabaceae)、葫芦科(Cucurbitaceae)、葡萄科(Vitaceae)、茄科(Solanaceae)、伞形科(Apiaceae)和杨柳科(Salicaceae)等7个科。由于同一物种的
IPP成员位于同簇(例如稻的2个
IPP成员均位于第1簇,拟南芥的2个
IPP成员均位于第2簇),推测这些成员的产生时间晚于物种分歧的时间。
2.3 基因结构与保守基序分析
保守基序分析(
图1)显示,IPP蛋白中存在10个保守基序,仅A0A438BYS2缺少基序9,其余序列均包含了以上10个基序。其中,基序10位于肽链的C末端,基序2、5、3、8、4、6与10的排列方向均从N末端指向C末端。总体而言,亲缘关系较近的IPP往往具有类似的保守基序,表明它们可能具有相似的进化历程和生物学功能。IPP成员存在2个保守结构域,分别是Isopentenyl-diphosphate Deltaisomerase和Nudix_Hydrolase superfamily(NUDIX),除A0A438BYS2外,其余序列均包含Nudix_Hydrolase superfamily保守结构域,证实IPP成员属于NUDIX家族。
为探讨基因家族进化关系,研究了31个IPP基因的外显子-内含子分布模式。结果表明,外显子-内含子分布也呈现高度的保守性,所有序列均含有6个外显子和5个内含子,且内含子的长度变化显著高于外显子的长度变化。
2.4 染色体定位
染色体定位结果显示(
表4),拟南芥
IPP基因分别定位于3号(
AT3G02780)和5号(
AT5G16440)染色体上,稻的2条
IPP基因分别位于5号(
Os05g0413400)和7号(
Os07g0546000)染色体上,由此表明,
IPP基因没有出现串联重复基因。
2.5 共线性分析结果
拟南芥和稻IPP基因均以单拷贝的形式出现,无近期的基因重复事件发生。共线性结果显示,拟南芥和稻IPP基因之间无直系同源基因,推测2个物种的IPP基因家族可能起源于不同的祖先基因。
2.6 顺式作用元件
除TATA-box和CAAT-box等基本转录元件外,在稻和拟南芥
IPP基因的上游共鉴定到143个顺式作用元件。拟南芥
IPP基因共鉴定到73个调控元件,主要参与环境应答(光应答、低温应答、干旱应答、盐胁迫应答、厌氧诱导、氧化应答等)、激素应答(脱落酸应答、茉莉酸甲酯应答、赤霉素应答、水杨酸应答与乙烯应答等)、防御应答(伤口响应、防御与压力响应及生长与代谢调控等)(
表5)。其中,2条拟南芥
IPP基因的上游均存在ABA应答元件ABRE与干旱应答元件W-box。
稻IPP基因也鉴定到上述3类调控元件,包括光、干旱、低温、厌氧诱导应答元件,脱落酸、茉莉酸甲酯、赤霉素、水杨酸、乙烯应答元件,应激响应、伤口响应元件等70个调控元件。根据以上结果,推测IPP基因可能参与对光、激素、非生物胁迫等的响应过程。
2.7 稻和拟南芥IPP蛋白互作网络构建与分析
稻IPP蛋白在互作网络中被命名为Q6AUB0_ORYSJ,与ISPH、SPS1-2、FPPS1、A0A0P0XDI7、A0A0P0VDY6、Q65XM9_ORYSJ、Q0J9F2_ORYSJ、Q6ET88_ORYSJ、Q7XI92_ORYSJ和Q6ETS8_ORYSJ存在相互作用(
图2),其中,FPPS1是法尼基焦磷酸合酶,为类胡萝卜素、甾醇等异戊二烯的生物合成提供前体
[15]。拟南芥IPP的蛋白互作网络主要由来自MVA途径的MVD1、MVD2、HMGS、FPS2、MK、IPK及来自MEP途径的ISPH构成。另外,LUP2为三萜环化酶
[16],能够将氧化角鲨烯转化为多种三萜的多功能酶。
互作网络功能富集分析显示,稻和拟南芥IPP蛋白可能参与相似的生物学过程。与拟南芥IPP互作的蛋白主要源于胞质液,参与类异戊二烯、磷脂、有机化合物的生物合成过程,以及含磷酸盐化合物、细胞芳香族化合物、小分子代谢等生物过程。稻IPP的互作蛋白主要源于细胞质,主要参与类异戊二烯、磷脂、小分子的合成与代谢等生物过程。二者均具有催化活性,以及离子结合的分子功能,主要富集在萜类骨架、次生代谢产物和代谢途径的通路上,说明IPP主要参与萜类等次生代谢产物的合成。
2.8 拟南芥与稻IPP基因表达模式
不同器官的定量PCR结果显示,拟南芥
IPP基因表达主要集中在根,而稻
IPP基因在叶中有更高的表达量(图
3A、
3F),表明不同物种
IPP基因表达模式存在差异,可能有不同的功能。由于拟南芥和稻的
IPP基因含有ABA应答元件ABRE和干旱应答元件W-box等顺式元件,推测它们的表达可能受到ABA与干旱的调控。
短期干旱后,2条拟南芥
IPP基因表达均呈现短暂下降、增加、最后恢复的变化趋势;稻
Os05g0413400基因表达先下降再缓慢增加,而
Os07g0546000基因表达先增加再减少。ABA短期处理后,2条拟南芥
IPP基因表达短暂上升,随即恢复到正常水平;稻
Os05g0413400基因表达先下降再增加,而
Os07g0546000基因表达持续减少再缓慢增加(
图3)。以上结果表明,拟南芥与稻
IPP基因在不同胁迫下的表达模式存在差异,且对干旱胁迫更为敏感。
干旱胁迫1周后,拟南芥2条
IPP基因表达量均显著高于对照组(
P<0.05),其中
AT5G16440基因表达量增加最多,为对照组的201.27%(
P<0.01); 稻2条
IPP基因表达量也稍高于对照组但无显著性差异。ABA胁迫1周后,
AT5G16440基因表达量为对照组的180.05%(
P<0.05),而
AT3G02780基因表达量仅为对照组的58.61%(
P<0.05);稻2条
IPP基因表达量均显著低于对照组(
P<0.05),其中
Os05g0413400基因表达量下降最多,仅为对照组的28.38%(
P<0.01)(
图3)。
3 讨论
已有研究
[7]表明,IPP可能是植物萜类合成的关键酶之一,对其开展生物信息学研究有助于系统认识该酶及其编码基因的生物学功能。本研究完成了16个物种的
IPP基因全基因组鉴定,利用生物信息学方法确定了基因结构和性质,并通过荧光定量PCR分析了稻与拟南芥
IPP基因表达模式。结合基因结构、保守基序、结构域、外显子-内含子分布模式与系统进化关系可知,位于同簇的IPP成员可能具有相似的进化历程与生物学功能。IPP成员属于NUDIX家族,存在Isopentenyl-diphosphate Deltaisomerase和NUDIX 2个保守结构域,包含特征性的约130个氨基酸及被称为Nudix折叠的
β-grasp结构域,发挥催化活性时通过二价金属与底物的焦磷酸部分结合并从底物或亲核水分子中提取质子
[17]。
从稻与拟南芥IPP基因的启动子中鉴定到44种顺式作用元件,可能与植物生长发育和应激反应等多个生物学过程相关。该结果与IPP蛋白互作网络的结果吻合,后者也发现IPP参与植物萜类及含磷化合物的合成与代谢过程,可能承担多种生物学功能。
拟南芥
IPP基因对干旱较为敏感,在不同时间的干旱胁迫后,表达量均出现明显增加,类似结果也出现在甘草(
Glycyrrhiza uralensis)
IPP中
[18];ABA处理1周后,
AT5G16440出现明显的表达上调,可能与其启动子中含有ABRE元件有关。然而,稻
IPP基因与烟草(
Nicotiana tabacum)
IPP基因
[19]在ABA处理后,表达量下降或未发生明显变化,推测不同物种
IPP基因可能具有多样化的响应模式。ABRE是植物响应ABA的重要元件,在植物应对多种胁迫(如重金属、干旱、热、高盐度、低温和辐射)时,负责整合多种胁迫信号及控制下游胁迫反应。
4 结论
从16个物种中鉴定的31条IPP基因具有较高的保守性,以单拷贝的形式出现。IPP基因与植物生长发育、代谢过程、应激响应等生物过程中可能有密切联系。生物信息学与定量PCR分析,证实IPP基因可能参与稻与拟南芥对干旱和脱落酸的响应。