油莎豆(
Cyperus esculentus.L)隶属于被子植物门、单子叶植物纲、莎草目、莎草科、莎草属,是莎草属中唯一可以食用的植物
[1]。茎豆作为油莎豆的无性繁殖器官和主要经济器官,由地下茎叶芽发育成匍匐茎,而后匍匐茎顶端膨大发育形成。茎豆形成的数量与油莎豆产量密切相关,形成茎豆数量越多,产量越高,亩产油量就越高。在匍匐茎膨大形成茎豆的过程中受多个基因的调控,因此,开展油莎豆茎豆形成过程中关键基因的挖掘及代谢通路的富集分析对于解析茎豆形成的分子机制具有重要意义。
转录组(RNA-Seq)测序技术可以发现低丰度转录本、挖掘新基因、寻找多态性标记、绘制转录图谱、鉴定基因家族等
[2-3],在模式植物拟南芥
[4]、油料作物油菜
[5]、地下根茎类作物甘薯
[6]及马铃薯
[7]等中获得广泛应用。尤其是对于无参考基因组的作物来说,利用转录组测序技术对Unigene(优化的转录本)进行定量分析,并进行下游的差异基因分析和功能注释,从而挖掘相关功能基因无疑是一种快速、高效的手段
[8-9]。目前油莎豆的基因组尚未完成测序,关于油莎豆的转录组测序已有部分进展,但大多以叶片和根的混合样
[10]、全生育期块茎
[11]、非生物胁迫下的根系
[12]等为主要研究对象,而重点关注茎豆形成过程的分子机制研究尚属空白。此外,关于油莎豆的相关基因挖掘主要是围绕抗逆和油脂合成展开,如干旱应答元件结合蛋白基因CeDREB
[13]和蛋白磷酸酶基因CePP2C19
[14]、运输抑制剂响应蛋白基因CeTIR
[15]、硬脂酰-ACP脱氢酶基因CeSAD
[16]、油脂合成基因CePDAT3
[17]、油脂积累相关基因CeWRI1
[18]等,而关于茎豆形成相关的基因研究较少。
因此,本研究以匍匐茎和新茎豆为研究对象,利用转录组(RNA-seq)测序技术挖掘茎豆形成的关键基因,富集KEGG通路,预测相关的转录因子,为阐明茎豆发育的分子机制提供基础数据支撑,同时也为进一步调控茎豆形成提供分子基础。
1 材料与方法
1.1 供试材料
豫油莎1号,由河南省农业科学院经济作物研究所培育并提供。
挑选大小一致的茎豆,用35 ℃的水浸种3 d(期间每天更换1次水)。取口径为35 cm,深度为30 cm的育苗盆,将湿度为65%灭菌后的基质(细沙)装入育苗盆中至2/3处。单盆单粒播种,芽眼朝上,上面覆盖5 cm左右的基质。放置于日光温室中进行培养,培养条件为光照/黑暗,30 °C/20 °C,16 h/8 h,培养至油莎豆分蘖初期分别进行取样。未膨大匍匐茎标记为PFJ1,膨大的匍匐茎标记为PFJ2,新形成的茎豆标记为JD1。取样后,用去离子水清洗并擦干,用锡箔纸包裹并做好标记后,立即放入液氮中冷冻,每个处理取3次重复,保存于-80 ℃冰箱备用。
1.2 石蜡切片制作
油莎豆匍匐茎及茎豆的石蜡切片制作方法参考王茜茹等方法
[19]。
1.3 RNA提取与检测
采用Trizol法提取未膨大匍匐茎(PFJ1)、膨大的匍匐茎(PFJ2)和新形成的茎豆(JD1)的总RNA,并通过 NanoDrop2100 微量分光光度计及琼脂糖凝胶电泳检测 RNA 质量及完整性。
1.4 文库构建及测序
将质检合格后的总RNA使用连接有Oligo(dT)的磁珠富集,经抽提的mRNA被片段化试剂(Fragmentation buffer)随机打断成短片段,以片段化的mRNA为模板,用六碱基随机引物(Random hexamers)合成一链cDNA,随后加入缓冲液、dNTPs、RNaseH和DNA Polymerase I进行二链 cDNA合成。AMPure XP beads纯化双链产物,利用T4 DNA 聚合酶和Klenow DNA聚合酶活性将DNA 的粘性末端修复为平末端,3’末端加碱基A并加接头,AMPureXP beads进行片段选择,之后用USER酶降解含有U的cDNA第二链进行PCR扩增,获得最终测序文库。文库质检合格后委托上海阿趣生物科技有限公司采用Illumina Novaseq™ 6000平台完成测序工作,测序读长为双端2×150 bp(PE150)。
1.5 测序数据组装及注释分析
由于油莎豆目前没有可参考的基因组,因此采用无参转录组测序数据的组装和注释流程。
1.5.1 测序数据质控
测序得到的下机数据需要进行预处理,使用cutadapt去除测序接头后,使用fqtrim过滤
掉不合格的序列后得到有效数据(clean data),后续分析均基于有效数据(clean data)。
1.5.2 转录本组装及注释
使用Trinity软件将所有样本的测序结果进行混合组装,获得转录本(transcript)序列,取每个基因最长的转录本作为该基因的Unigene序列。
1.5.3 差异表达基因的鉴定与筛选分析
显著差异表达基因(Differentially expressed gene,DEG)的筛选条件为错误发现率(FDR)<0.05以及基因表达量变化倍数取以2为底对数值的绝对数∣log2FC∣≥2。
1.5.4 GO功能分析
参照 GO 数据库,将差异表达的基因按照生物学过程(Biological process)、细胞组成(Celler component)以及分子功能(Molecular function)进行分类。
1.5.5 KEGG Pathway 富集分析
参照 KEGG( Kyoto encyclopedia of genes and genomes) 数据库分析差异表达基因参与的代谢途径。
1.6 qRT-PCR试验方法
利用仪器 Thermal Cycler CFX96 Real-Time System (BIO-RAD,USA)进行表达量检测。取上述用于转录组测序所提取的 RNA 2 μg 用于 cDNA第一链合成,按照反转录试剂盒 FastQuant RT kit (with gDNase,TianGen Biotech,Beijing,China)操作说明进行试验,反转录体系为 20 μL。随后,对反转录结果稀释 20×后进行后续试验。qRT-PCR 具体步骤如下:
1) 使用引物设计软件 Primer Premier 5.0 进行引物设计,引物序列由上海生工生物有限公司(中国)进行合成,采用 PAGE 纯化。qRT-PCR 所使用引物序列见
表1。
2) 使用 qRT-PCR 反应试剂盒 GoTaq® qPCR Master Mix (Promega,USA),反应体系总体积为20 μL,其中包括10 μL GoTaq® qPCR Master Mix,0.4 μL上游引物,0.4 μL下游引物,4 μL cDNA,5.2 μL nuclease-free water。
3) qRT-PCR反应程序:94 ℃预变性30 s;94 ℃变性5 s,60 ℃退火15 s,72 ℃延伸 10 s,40 cycles。
1.7 数据分析
数据分析使用Excel和GraphPad软件,作图使用R语言程序。
2 结果与分析
2.1 匍匐茎与茎豆的细胞组织分析
油莎豆茎豆由地下匍匐茎顶端膨大发育而来。根据石蜡切片结果可知,未膨大的匍匐茎顶端组织可以清晰地看到皮层细胞、环髓组织和髓部,细胞体积较小,数目较少,并且前端狭长呈梭形(
图1-A);膨大后形成的新茎豆顶端组织皮层细胞和环髓组织变薄,髓部体积变大,细胞数目明显增多,且前端膨大呈圆形(
图1-B)。匍匐茎在膨大前与膨大后相比有着显著的差异。
2.2 转录组测序数据质控与组装
分别对油莎豆匍匐茎和茎豆的9个样本进行转录组测序,共获得55.24 Gb的双端raw reads。去除测序接头和低质量碱基后共获得124 043 608条、121 683 020条和112 808 514条clean resds,共包含49.9 Gb的clean bases,经测序质量控制分析,9个测序样本的Q20≥97.31%,Q30≥92.39%,GC%≥46.56%(
表2),表明这9个匍匐茎和茎豆的转录组测序质量较高,可用于De novo组装和后续数据分析。
通过Trinity软件对过滤后的Clean reads进行拼接,共获得115 002个转录本(Transcript),总长度为15 197 bp,N50长度为1 608 bp,GC含量为43.41%。通过对所有转录本进行进一步聚类和组装,共获得的48 080条Unigenes,总长度为15 197 bp,N50平均长度1644 bp,GC含量为43.79%(
表3)。
2.3 差异表达基因的筛选
以错误发现率(
FDR)<0.05以及基因表达量变化倍数取以2为底对数值的绝对数∣log2FC∣≥2为条件筛选不同对比组的差异表达基因。首先,PFJ2vsPFJ1共筛选出6 912个差异表达基因,其中3 483个基因上调表达,3 429个基因下调表达;JD1vsPFJ1共筛选出2 498个差异表达基因,其中1 081个基因上调表达,1 417个基因下调表达;JD1vsPFJ2共筛选出8 559个差异表达基因,其中3 731个基因上调表达,4 828个基因下调表达。通过进一步分析,以新茎豆与匍匐茎(JD1vsPFJ1/JD1vsPFJ2)相比,筛选与茎豆形成相关的差异表达基因2 126个,其中上调表达基因283个,下调表达基因1 843个(
图2)。
2.4 差异表达基因的GO功能分析
GO 富集分析用于描述基因产物的功能,主要分为生物过程、细胞组分和分子功能三大类。通过对新茎豆和匍匐茎对比分析的差异表达基因(DEGs)进行GO富集,由
图3显示可知,在生物过程方面DEGs显著富集在胚胎发育结束于种子休眠(43个,占比2.55%)、细胞分裂(37个,占比2.20%)、叶绿体组织(23个,占比1.37%)等GO terms。在细胞组分方面,差异表达的基因主要富集在细胞核(491个,占比29.16%)、叶绿体(212个,占比12.59%)、线粒体(168个,占比9.98%)、叶绿体基质(54个,占比3.21%)、微管(20个,占比1.19%)等GO terms。在分子功能方面,DEGs主要在RNA结合(85个,占比5.05%)、GTP酶活性(31个,占比1.84%)、微管运动活性(16个,占比0.95%)等GO terms中得到显著富集。
2.5 差异表达基因的KEGG通路富集
新茎豆与匍匐茎中差异表达基因富集程度排名前20条的KEGG富集通路(
图4)分析结果显示,植物激素信号转导(ko04075)中富集的DEGs最多,数量为40个,其中包括生长素反应因子ARF11(TRINITY_DN24755_c3_g2)、稻草人2-like蛋白SCR(TRINITY_DN28792_c2_g1)、LRR受体样丝氨酸/苏氨酸蛋白激酶At2g24230(TRINITY_DN22750_c0_g2)等基因;其次是真核生物中的核糖体生物发生(ko03008)中富集的DEGs数量为38个,包括转导蛋白β-like蛋白3 TBL3(TRINITY_DN26565_c1_g3)、核仁蛋白56 nop56(TRINITY_DN22991_c2_g2)、丝氨酸/苏氨酸蛋白激酶riol-like异构体X1 RIOK1(TRINITY_DN21281_c0_g1)等;淀粉和蔗糖代谢(ko00500)中富集的DEGs数量为30个,包括葡聚糖内切-1,3-葡糖苷酶At2g27500(TRINITY_DN24930_c0_g2)、叶绿体异淀粉酶2 ISA2(TRINITY_DN26378_c1_g1)、含五肽重复序列蛋白At1g71460(TRINITY_DN19268_c0_g1)等基因。
2.6 差异表达基因的转录因子预测分析
对转录组所有序列进行转录因子预测分析,共预测到1 384个转录因子。其中WRKY类转录因子最多(155个),占比11.2%;其次是bHLH类和C2H2类转录因子(101个),占比均为7.3%;MYB类转录因子(89个),占比为6.43%;NAC类转录因子(73个),占比均为5.27%;bZIP类转录因子(63个),占比均为4.55%(
图5)。
对编码转录因子的差异表达基因进行排名前10 的统计分析(
表4),其中新茎豆(JD1) 与未膨大的匍匐茎(PFJ1)中编码bHLH转录因子家族的差异基因数量最多,为31个;新茎豆(JD1)与膨大的匍匐茎(PFJ2) 中编码WRKY转录因子家族的差异基因数量最多,为84个;膨大的匍匐茎(PFJ2)与未膨大的匍匐茎(PFJ1)中编码WRKY转录因子家族的差异基因数量最多,为72个。
2.7 qRT-PCR验证
为了验证转录组数据的可靠性,本研究随机挑选在茎豆和匍匐茎中差异表达的17个基因进行qRT-PCR验证。qRT-PCR结果显示(
图6-A),这17个基因的qRT-PCR定量结果与转录组数据的表达趋势一致且相关性较好,相关性系数
R2=0.989 3(
图6-B),表明获得的RNA-seq测序数据可靠性较高。
3 讨论
油莎豆是以无性繁殖为主的油料作物,茎豆中富含大量油脂,因此茎豆既是油莎豆重要的经济器官又是重要的无性繁殖器官。油莎豆的匍匐茎在适宜条件下受到相关基因的调控膨大形成茎豆,但是这一形成过程的分子机理尚不清楚,因此本研究以匍匐茎及茎豆为研究对象,分别利用石蜡切片和转录组测序技术对茎豆的形成过程进行细胞和分子层面的解析。
关于块茎发育过程的研究大部分是与细胞增大和细胞分裂有关
[20]。有学者研究发现马铃薯块茎的形成是由于皮层、环髓组织、髓部组织的细胞大小和数目的增加导致的
[21]。本研究中石蜡切片结果显示匍匐茎在膨大形成茎豆的过程中,皮层细胞和环髓组织变薄,髓部体积变大,细胞数目明显增多,且前端膨大呈圆形,该结果与马铃薯块茎的膨大过程变化相似。
本研究采用Illumina Novaseq™ 6000平台测序技术进行转录组测序,测序结果Q30>90%,GC含量>40%,说明转录组测序结果质量可靠,可用于后续分析。油莎豆的匍匐茎膨大形成茎豆前后共产生差异表达基因2126个,其中上调表达283个,下调表达1 843个。qRT-PCR验证了17个DEGs在匍匐茎与茎豆中的表达量变化趋势与转录组结果一致,进一步验证了转录组数据的可靠性。
GO注释结果表明匍匐茎膨大前后的DEGs主要富集到胚胎发育结束于种子休眠、细胞分裂、细胞核、线粒体、微管、GTP酶活性、微管运动活性等GO terms中。KEGG代谢通路分析发现DEGs富集代谢通路集中在植物激素信号转导(ko04075)、淀粉和蔗糖代谢(ko00500)中。
植物激素在改变块茎细胞的分裂、刺激细胞体积变大、促进淀粉和蛋白质的储存方面发挥着重要的作用
[22]。在根茎类植物中常见的植物激素有生长素、细胞分裂素、脱落酸、赤霉素和乙烯等。生长素影响着植物根的生长
[23]和块茎的形成
[24]。研究学者发现与马铃薯块茎形成前相比,块茎形成初期的生长素含量急剧上升,并维持在较高水平
[25]。生长素通过调节生长素小分子RNA (SAUR)、GH3 (GH3)、吲哚-3-乙酸(Aux/IAA)和生长素反应因子(ARF)等众多基因家族的基因表达发挥作用。生长素反应因子(Auxin response factor,ARF)是植物生长素信号通路的重要组成部分,参与植物的生长发育和胁迫反应
[26-28]。本研究中,富集到植物激素信号转导途径中的DEGs有生长素反应因子ARF11(TRINITY_DN24755_c3_g2)、稻草人2-like蛋白SCR(TRINITY_DN28792_c2_g1)、LRR受体样丝氨酸/苏氨酸蛋白激酶At2g24320(TRINITY_DN22750_c0_g2)等。稻草人蛋白(scarecrow-like protein)编码GRAS家族的转录因子,在拟南芥中的研究发现,SCR基因是根和茎形成地面组织细胞不对称分裂的必需基因
[29]。Feng等
[30]研究发现miR171靶向的稻草人样基因CsSCL2和CsSCL3调控柑橘体细胞胚胎发生。
本研究中与茎豆形成相关基因富集的另一个代谢通路为淀粉和蔗糖代谢((ko00500)。有学者通过研究莲藕
[31]、马铃薯
[32]和萝卜
[33]等地下根茎类的作物发现,块茎的膨大与淀粉和蔗糖代谢途径紧密相关。索宁宁
[34]研究发现山药块茎中的蔗糖是产生能量并合成纤维素、淀粉、蛋白质和抗氧化物所必需的物质。卢晓月等
[35]对不同发育时期的马铃薯进行转录组分析发现,马铃薯匍匐茎与膨大起始期的差异显著基因富集在能量代谢与碳水化合物代谢途径中。赵娜等
[36]研究发现,马铃薯中的葡聚糖内切-1,3-葡糖苷酶在调控块茎淀粉积累方面起着重要的作用。巩慧玲等
[37]研究发现,蔗糖能特异性地调控马铃薯结薯相关基因的表达。油莎豆茎豆中除了富含大量油脂,淀粉及糖类物质在茎豆中的含量高达40%以上
[38]。因此本研究中富集到蔗糖和淀粉代谢途径(ko00500)中的基因有葡聚糖内切-1,3-葡糖苷酶At2g27500(TRINITY_DN24930_c0_g2)、叶绿体异淀粉酶2 ISA2(TRINITY_DN26378_c1_g1)、含五肽重复序列蛋白At1g71460(TRINITY_DN19268_c0_g1)等。初步推测这些基因有可能参与了茎豆的形成。
植物的正常发育需要大量基因的有序表达,而转录因子则是协调基因表达的“开关”。有研究学者证实了WRKY、bHLH 、MYB和其他转录因子家族主要参与植物生长发育过程。WRKYs参与调控激素、MAPK、ABA 等信号通路
[39]。WRKY33可直接调控PIF4的表达,并通过介导H
2O
2稳态调节拟南芥幼苗的生长发育过程
[40]。Singh等
[41]中鉴定了一个在番茄根系中表达的转录因子SlWRKY23,该转基因植株的根系生物量与对照相比有所下降。碱性/螺旋-环-螺旋(bHLH)作为植物中第二大转录因子家族,参与许多生长发育过程,包括种子萌发、花器官发育及侧根的生长等。Gao等
[42]在花生(
Arachis hypogaea) 中鉴定出61个bHLH参与了豆荚的发育及地下部分的特异性生长。Zhu等
[43]发现bHLH转录因子SlPRE2 可通过调节果皮细胞的分裂,使得番茄(
Solanum lycopersicum)果皮增厚,从而可调节果实的大小。Heo 等
[44]研究发现GRAS 转录因子家族可特异性调控拟南芥腋生分生组织的启动,对根系的伸长有重要作用。本研究中的转录因子显著富集到WRKY和bHLH家族中。
4 结论
综上所述,通过对茎豆和匍匐茎的转录组学分析,初步挖掘出与茎豆形成相关的基因及代谢通路,丰富了油莎豆茎豆发育的代谢通路研究,为后期开展茎豆发育的分子机制研究提供一定的理论参考。