辣椒(
Capsicum annuum)属于茄科、辣椒属,是一种一年生或有限多年生的草本植物
[1],起源于南美洲的墨西哥和秘鲁等地,通过海路贸易进入中国,已有400多年的栽培历史
[2-3]。
辣椒是典型的喜温蔬菜
[4-5],在营养生长阶段易受干旱胁迫影响,此外栽培地土壤含盐量过高,土质盐碱化也会影响辣椒生长
[7-9]。盐胁迫会改变植株生长环境,使植株体内积累过量Na
+,质膜的完整性和通透性丧失
[10],植物的正常生理活动被抑制,导致植物出现早衰、减产和品质下降等问题
[11-12]。因此,研究植物对逆境的适应及抵御机制,发掘新的抗逆基因,并利用生物技术进行分子育种,培育抗逆新品种是目前作物育种的重要课题
[6-13]。
在植物和部分微生物的细胞壁中,果胶酯酶 (pectin methylesterase,PME)催化果胶主链发生脱甲酯化反应,导致细胞壁分离,从而降低果实硬度
[14]。果胶酯酶不仅能影响细胞壁的组成、降解
[15]和果实成熟度
[16],且在花粉萌发、花粉管生长
[17]和形成层细胞分化
[18-19]等方面发挥重要作用。果胶酯酶编码基因
PME(capsicum pectin methylesterase)是多基因家族,目前在拟南芥(66个)
[20]、水稻(43个)
[21]、桃(69个)
[22]和马铃薯(54个)
[23]等植物中有所研究,但在辣椒研究中还未见报道。
辣椒全基因组测序的完成是探索辣椒
CaPMEs基因家族成员生物信息的重要基础
[24],基因在非生物胁迫和不同组织的差异表达,能够揭示植物对非生物胁迫的抵御机制,且对培育抗逆新品种具有重要的应用价值。
1 材料与方法
1.1 辣椒CaPME基因家族的鉴定
依据拟南芥
AtPME 超家族的基因ID,从拟南芥数据库TAIR11(
https://www.arabidopsis.org/)获取
PME全基因组同源序列 ,从中挑选候选CaPMEs蛋白序列。然后利用隐马尔科夫模型(HMM)搜索程序(HMMER v3.3.2,http:∥hmmer)进行比对搜索,将所得序列上传至Pfam蛋白家族数据库(http:∥pfam.sanger.ac.uk/)和SMART数据库〔SMART:Main page(embl-heidelberg.de)〕,依据保守结构域验证候选基因。最终鉴定得到64个辣椒
CaPMEs基因家族成员,并依据其染色体上位置进行命名。
1.2 辣椒CaPME基因家族蛋白理化性质以及亚细胞定位预测
通过ExPASy (
http://www.expasy.org/tools/)在线分析软件ProtParam,分析64个基因在染色体上的位置分布、CDS长度、蛋白质氨基酸数目、分子量、理论等电点 (PI) 、不稳定指数和亲水性等理化性质。利用Euk-mPLoc2.0
http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)预测辣椒
CaPMEs基因家族成员的亚细胞定位信息
[25]。
1.3 辣椒CaPME基因家族染色体定位和共线性分析
根据辣椒基因组注释文件中基因在染色体上的位置信息,运用MapChart2.32软件绘制具体分布图。从植物基因组复制数据库(
http://chibba.agtec.uga.edu/duplication/)下载辣椒
CaPMEs基因自身基因组内与拟南芥基因组间的共线区域,并用TBtools绘图。
1.4 辣椒CaPME基因家族保守结构域、基序分布、基因结构以及系统进化联合分析
通过MEGA7.0软件对
CaPME基因进化关系进行分析,采用最大似然法(maximum likelihood,ML) 构建辣椒
CaPME基因家族的系统发育树,Bootstrap 设置为1 000
[26],并通过ITOL(
https://itol.embl.de/)进行美化。利用 DOG2.0软件将
CaPMEs保守结构域按进化关系进行可视化绘图。将已鉴定的CaPMEs蛋白在MEME上(
http://meme-suite.org/tools/meme) 检索保守基序 (motif)
[27],基序最大值设置为10。利用Gene Structure DisplaySever 2.0 (GSDs) (
http://gsds.cbi.pku.edu.cn) 分析
CaPMEs内含子和外显子结构
[28]。
1.5 辣椒CaPME基因家族顺式作用元件分析
为鉴定辣椒CaPME基因上游顺式调控元件,利用TBtools工具提取辣椒CaPMEs编码序列 (codingsequence,CDS) 的起始密码子上游2000 bp序列,利用PlantCARE数据库(http:∥bioinformatics.psb.ugent.be/webtools/plantcare/html/)对其进行顺式作用元件的预测、分析和筛选。
1.6 基于转录组数据的表达模式分析
采用的植物材料是辣椒优良育种系6421,该品种在中国湖南省广泛种植,是一种夏季栽培品种,耐炭疽病、细菌性斑点和细菌性枯萎病,并且耐热性、耐旱性良好
[29]。
CaPMEs 基因在非生物胁迫与不同组织的表达量数据下载于 Pepper Hub(
http://pepperhub.hzau.edu.cn/)
[30]。
2 结果与分析
2.1 辣椒CaPME基因家族鉴定分析
经过生物信息学分析,从辣椒基因组中共鉴定到64个CaPMEs基因。根据在其染色体上位置,将其依次命名为CaPME1~CaPME64。CDS长度变化范围为312~2 022 bp;编码蛋白的分子量变化范围在11 525.04~72 283.42 u之间;氨基酸数在103~673 bp之间;等电点在4.99~9.72之间,酸性蛋白有21个,碱性蛋白有43个。不稳定指数最低为CaPME52(15.85),最高为CaPME42(49.64),不稳定蛋白有6个(CaPME5、CaPME26、CaPME29、CaPME39、CaPME42、CaPME45),疏水性蛋白有4个(CaPME2、CaPME23、CaPME40、CaPME43)。亚细胞定位分析可得,64个CaPMEs基因家族成员均定位在细胞壁上,其中8个(CaPME17、CaPME30、CaPME33、CaPME34、CaPME46、CaPME52、CaPME54、CaPME59)成员同时定位在细胞外。
2.2 辣椒CaPME基因家族染色体定位和共线性分析
根据基因在染色体上的位置信息,运用MapChart2.32 制作
CaPMEs的染色体分布图,并分析其分布特征。Chr00染色体上分布了6个基因(
CaPME59~
CaPME64),剩余58个基因随机不均匀的分布在chr01~chr12染色体上(chr11除外)。分布最多的染色体为chr01和chr02,分别包含9个成员,其次为chr12,包含8个成员,最少的是chr07,只含1个成员(
图1)。
共线性分析结果显示,在64个
CaPMEs基因中判定出有3对非串联片段重复,推测片段重复是
CaPMEs进化的主要动力(图
2~
3)。在辣椒
CaPMEs和拟南芥
AtPMEs之间发现32对共线基因,其中辣椒
CaPMEs基因中第一条染色体上与拟南芥有与之对应的7对共线基因,第2、4、10号染色体上的
CaPME11、CaPME26、CaPME50都只有1对共线基因。第3号染色体上的基因对最多,有10对,第8号染色体上有6对,第00号染色体上的
CaPME63有3对共线基因(
表1)。
2.3 辣椒CaPME基因家族系统进化、保守结构域、基序分布和基因结构联合分析
基于所有
CaPMEs基因序列比对构建了系统发育树,经过聚类分析可将其分为4个亚族(
图4-A)。分别命名为Group Ⅰ、Ⅱ、 Ⅲ、Ⅳ。Group Ⅰ 有18个基因,Group Ⅱ有6个,Group Ⅲ 有3个,其余37个基因均在Group Ⅳ。
基于进化关系联合分析保守结构域(
图4-B),
CaPMEs蛋白均包含Pectinesterase结构域,Group Ⅰ 只含Pectinesterase结构域;Group Ⅱ 部分
CaPMEs含有PMEI和Pectinesterase两种结构域;Group Ⅲ 结构域组成成分相对复杂,
CaPME10含有Pectate-lyase-3结构域,
CaPME39结构域最多共有5种,分别是Pectinesterase、PMEI、Atrophin-1、PARM和Retinal。Group Ⅳ大部分蛋白都含有Pectinesterase和PMEI。
外显子/内含子已被用作基因或生物体之间进化关系的支持凭证
[31]。
图4-C分析发现大多数内含子的分布在同源基因中是保守的,但个别存在特异性。绝大多数基因的基因组长度在8 kb以内,其中少数基因组长度不足1 kb;
CaPME2、
CaPME4、
CaPME27只含有一个外显子,没有内含子;
CaPME30的内含子最多,有6个。
CaPME56中在编码区后方含有一个非编码区,
CaPME1的编码区前方含有一个非编码区。
基于MEME软件,在
CaPMEs编码蛋白产物中分析了10个保守基序 ( Motif) 。如
图5所示,该家族蛋白序列非常保守,Motif1-10在基序中普遍存在,且分布排列高度一致。除了
CaPME16、CaPME39和
CaPME62外,大部分基序长度在600个氨基酸范围内。但个别基因之间基序分布和数量存在差异性。例如
CaPME34和
CaPME54都仅有一个保守基序,分别对应的是Motif1和Motif2。
2.4 辣椒CaPME基因家族顺式作用元件分析
分析
图6可得,75%的家族成员含有脱落酸(ABRE)响应元件;含有水杨酸(TCA-element和SARE)响应元件的家族成员占比为40.6%;含有赤霉素(P-box、GARE-motif 和 TATC-box)响应元件和生长素(TGA-element、AuxRE、AuxRR-core 和 TGA-box)响应元件的占比均为60.9%。仅有17.2%的家族成员同时包含上述4种植物激素。
CaPMEs成员的启动子中至多存在3种逆境胁迫响应相关的作用元件。存在低温(LTR)响应元件和厌氧胁迫(ARE、GC-motif)响应元件的成员均是23个。此外,有25个成员含有防御和胁迫(TC-rich repeats)响应元件。9个成员包含以上3种逆境胁迫响应。67.2%的家族成员存在MYB转录因子结合位点,其中包含参与光反应(MRE)、干旱诱导(MBS)和参与黄酮类生物合成基因调控(MBSI)。
2.5 辣椒CaPME基因家族组织特异性表达分析
为探究辣椒
CaPMEs 基因家族是否在组织发育过程中发挥作用,对
CaPMEs在不同组织中表达量进行分析。如
图7所示,大部分基因在所有组织和整个发育阶段表达量都很低甚至不表达,但37.5%的基因在不同组织表达量存在显著性差异。例如,其中6个基因(
CaPME3、CaPME4、CaPME7、CaPME28、CaPME36和
CaPME51)表达水平在花药中最高,其次是子房;6个基因(
CaPME6、CaPME31、CaPME32、CaPME39、 CaPME42和
CaPME52)只在花药上表达。
CaPME14在花瓣、叶片和根上呈现较高的表达水平,在其他组织上几乎不表达。
CaPME19在花药和根中低表达,在其他组织均表达上调。
2.6 辣椒CaPME基因家族在非生物胁迫处理下的基因表达图谱
通过定量分析辣椒
CaPMEs基因家族成员在非生物胁迫处理下的表达情况,基因表达量变化如
图8所示。在受不同程度的非生物胁迫(NaCl胁迫和冷胁迫)下,大部分的辣椒
CaPMEs基因在叶片和根的表达量都较低。
在NaCl胁迫处理下,CaPME14在叶片表达量保持上调且在24 h达到峰值,相比0 h上调24.4%,但在根中处理0 h就出现最大值后显著下调。CaPME64基因表达量在叶片上都是上调,但在根中与0 h相比,处理1 h后基因表达量逐渐下降,而CaPME11则与之相反。CaPME19、CaPME21在叶片和根部的表达均受NaCl胁迫调控后表达水平显著提高;在冷胁迫下,CaPME24、CaPME26在叶片上表达呈持续下调趋势,但在根上与对照相比,1~3 h出现明显上调。CaPME8、CaPME11、CaPME12在叶片上与对照相比表达量在处理1 h下调,但在根中保持上调,而CaPME64和CaPME14在叶片和根部表达趋势则刚好相反。CaPME19基因表达量在整个处理时期的叶片和根部均保持上调。
3 讨论
本研究鉴定出辣椒
CaPME家族共64个家族成员,其基因家族成员数量与甜樱桃(12个)
[32]、雷蒙德氏棉(81个)
[33]、亚麻(105个)
[34] 相差较大,具有明显的种间数量差异。这说明
PME基因家族在整个植物界的进化分布是不均匀的。
利用辣椒
CaPMEs基因家族成员蛋白质序列构建系统发育树并分析结构域,将其分为4个亚族,
CaPMEs基因C末端均含结构域Pectinesterase,这个保守结构域是
CaPMEs基因行使功能的重要保证;而部分基因N末端进化存在差异,含有PMEI保守结构域。该结论与李伟杰
[35]在棉花
PMEs基因家族上的研究成果相近,因此推测这可能就是导致
CaPMEs基因功能变化的原因,增加了基因的多样性,降低了选择压力。基因结构分析显示,大部分
CaPMEs基因的外显子数量为1~4个,少部分有5~6个,这可能是由于
CaPMEs基因在长期进化的过程中功能和结构发生方向性演变的结果。此外,内含子的分布位置和阶段在同源基因中是保守的,但存在特异性。这与Cao
[36]对拟南芥
AtPME研究结论相似。同一亚族中大多数基因具有相似的编码序列和相似的外显子/内含子结构,有力地证实了它们密切的进化关系。目前还需要进一步研究不同的外显子-内含子结构的潜在功能。在64个
CaPMEs基因中判定出有3对片段重复,没有串联重复发生,推测片段重复是
CaPME进化的主要动力。需要进一步核实是否有重复片段出现丢失现象,以此证实片段重复的复制扩增是否为进化的主要方式。辣椒
CaPMEs的64个基因和拟南芥
AtPMEs的66个基因中发现32对共线基因对,由此可得辣椒
CaPMEs和拟南芥
AtPMEs之间的近缘关系较近。
对辣椒
CaPMEs 基因家族64个基因的启动子区域进行顺式元件预测分析,检测出48个作用元件,共分9大类。其中包含激素、胁迫响应以及植物生长代谢相关的作用元件,因此推测其功能可能涉及这3个方面。作用元件类型与蒋宏华等
[29]对辣椒
CAMTA 基因家族的研究结果相似,推测辣椒
CaPMEs基因与响应辣椒的非生物胁迫关系密切。为了进一步证实这一结论,通过定量分析辣椒不同组织
CaPMEs的表达谱,以及在非生物胁迫处理后的表达水平的变化模式。
PME在植物中表达存在时空差异特性,一些
PME基因在植株整个组织器官中能持续表达
[37],但也有部分
PME基因仅在植株特定生长阶段或组织器官中表达。在草莓上的研究发现,
FaPE1仅在果实中表达,
FaPE3、
FaPE4在整个植株中均有表达
[38]。在本研究中,有6个基因只在花药上表达。在拟南芥花粉组织中特异表达的
PME基因
QUARTET1是花粉四分体分离过程的必需基因
[39],在拟南芥中鉴定出的
AtPPME1不仅在花粉上表达,还在花粉管伸长的过程中具有重要作用
[40]。本研究中,在辣椒不同组织和发育阶段的过程中有近
50%的基因出现差异表达,其中21.9%在花药中表达量最高,因此推测这些基因可能在花粉萌发和花粉管生长中发挥了重要作用,后期研究需要通过基因在不同育性材料上的定量表达试验来进一步证实这一推论。在植物生长发育过程中,逆境胁迫调控
PMEs基因的表达,以此影响营养器官生长代谢
[41-42]。本研究表明,NaCl胁迫和冷胁迫处理后大部分辣椒
CaPMEs基因在叶片和根的表达量都较低,但剩余基因受两种胁迫诱导后表达水平均存在差异。例如NaCl胁迫处理后,在叶片中
CaPME14和
CaPME64基因表达量较高,说明基因响应胁迫能力较强,而
CaPME11则相反。因此推测,这些基因在受NaCl胁迫和冷胁迫影响后,通过调控表达水平从而影响营养器官的生长发育和代谢功能。
4 结论
鉴定出辣椒CaPMEs共64个基因家族成员,并分析了其生物信息学特征、启动子顺式作用元件功能及在不同组织和非生物胁迫下基因在植株中的差异表达。该研究结果为培育抗逆新品种具有一定的应用价值。