系统基因组学是研究生物间系统发育关系及基因组进化机制的一门学科
[1]。在以往研究中,不少学者
[2-4]针对基于单一或少数几个基因构建系统发育树的相关内容展开深入探讨。但仅凭借单一基因建立的系统发育树,在某些情况下不能准确反映被研究物种间的系统发育关系。这可能是受类群间基因进化速率差异、横向基因转移及旁系同源基因等因素的影响
[5-7]。随着模式生物测序的完成,科研人员对算法进行改进,综合运用各类技术相继提出了数种以全基因组序列为基础构建系统发育树的方法,形成了系统进化基因组学
[8],能够有效分析重复基因引发的基因组进化事件,并对基因功能进行预测
[9]。近年来,随着基因测序技术的快速发展,系统发育基因组学被广泛运用。Zuntini等
[10]通过353个核基因数据构建被子植物生命树,覆盖近8 000属,结合200个化石校准时间,解析被子植物多样化动态,提供了首个大规模核基因组被子植物生命树。Wang等
[11]以转录组和基因组数据重建了天门冬目(Asparagales)系统演化树,回溯了天门冬目物种起源地。Zhou等
[12]收集并整合来自不同文献和公共数据库的719个不同植物基因组,并对其开展大规模比较基因组学分析,开发植物系统发育和比较基因组学数据库(PGCP),提供了丰富的可视化功能和多种分析模块,有助于精准解析物种演化轨迹。
叶绿体具有母系遗传、基因沉默、基因结构保守和独立的基因组等诸多优势,是研究植物系统发育的理想对象,为植物物种鉴定、进化史探索、起源追踪和遗传多样性分析奠定了重要基础
[13-14]。Li等
[15]基于对2 881种叶绿体基因组蛋白编码序列的分析,构建出当下最完整的被子植物系统发育树,确定了部分被子植物系统框架,解决了部分物种归属问题,并从4 792种开花植物中提取出80个叶绿体的直系同源基因,建立了目前最完整的开花植物系统发育树,为部分争议类群分类提供了参考
[16]。Ma等
[17]对9个凤仙花属(
Impatiens)植物叶绿体基因组进行分析,提高了凤仙花属分类学的准确性和系统发育分辨率。王飞等
[18]通过测序获得了无刺龙舌兰(
Yucca treculeana)叶绿体基因组,揭示了6种丝兰属(
Yucca)植物叶绿体基因组特征和序列变异情况,明确了各物种间的亲缘关系。张妍彤等
[19]通过比较壳斗科(Fagaceae)6个属14个物种叶绿体基因组间的差异,并以近缘物种榛(
Corylus heterophylla)为外类群构建系统进化树,揭示壳斗科叶绿体基因组的结构特征及变异规律。苏丹丹等
[20]利用高通量测序技术对苦马豆(
Sophora alopecuroides)叶绿体基因组测序、组装,系统发育分析显示,苦马豆和骆驼刺(
Alhagi camelorum)为姐妹群,亲缘关系最近。最近的研究
[21]表明,叶绿体基因组变异为解开多级分类系统发育关系提供了重要线索,特别是在具有高度分类复杂性的生物群体中。
柽柳科(Tamaricaceae)共4属约120种,包括水柏枝属(
Myricaria)、秀柏枝属(
Myrtama)、红砂属(
Reaumuria)和柽柳属(
Tamarix),为半灌木、灌木或乔木,主要分布于新疆、青海、四川等地
[22]。柽柳科的大部分植物在荒漠中的分布较为广泛,其通过独特的生理调控机制形成显著的抗旱能力,因而在生态功能维护和资源开发利用方面具有重要价值
[23-24]。王雲霞等
[25]对红砂(
R. songarica)模拟干旱胁迫研究表明,红砂幼苗能够通过调节不同生长时期淀粉和可溶糖含量来抵御干旱。Sun等
[26]通过生理、转录组和代谢分析,揭示了沙生柽柳(
T. taklamakanensis)通过调节角质、木脂和蜡的生物合成、类黄酮途径和
α-亚麻酸代谢响应干旱条件,通过调节类黄酮途径和
α-亚麻酸代谢来响应复水条件,说明沙生柽柳具有很强的抗旱性,对荒漠恢复具有重要意义。王红宝等
[27]对多种柽柳科植物的耐盐性研究表明,甘蒙柽柳(
T. austromongolica)和多枝柽柳(
T. ramosissima)耐盐性较强,可作为盐碱地植树造林的先锋物种。
自柽柳科建立以来,部分种的归属和秀柏枝属的建立问题仍存在争议。张元明等
[28]根据对花粉形态的电镜观察,认为秀柏枝(
Myrtama elegans)花粉外壁具明显粗网状纹饰,不同于水柏枝属和柽柳属,其大型披针叶、雄蕊花丝分离、雌蕊短柱头、种子芒柱全被毛等形态特征明显有别于本科其他属,因而众多研究人员
[28-30]支持将该物种另立新属。由于柽柳属植物外部性状相似,所以出现了塔克拉玛干沙漠中有柽柳(
T. chinensis)种名或产区误定等情况
[31-32]。当前,研究人员针对柽柳科植物的研究主要聚焦在幼苗发育
[33]、形态结构
[34]、药理学
[35]、耐旱机制和转录组学
[26,36-37]、基因组学和抗逆基因家族筛选
[38]上,而基于叶绿体基因组的系统基因组学和柽柳科系统进化分类的研究有待进一步深入、扩展。本研究以柽柳科植物叶绿体基因组为研究对象,进行叶绿体基因组拼接、组装、注释及比较分析,构建柽柳科植物系统发育关系,为分析柽柳科不同物种系统发育关系和鉴定提供参考。
1 材料与方法
1.1 柽柳科植物叶绿体基因组特征测定
1.1.1 材料与数据获取
选取7个柽柳科植物的野生型样本,分别为甘蒙柽柳、多枝柽柳、密花柽柳(
T. arceuthoides)、匍匐水柏枝(
M. prostrata)、宽苞水柏枝(
M. bracteata)、红砂和五柱红砂(
R. kaschgarica)。野外采集新鲜幼叶用硅胶干燥后,置于冰箱中-20 ℃保存,凭证标本存放于中国科学院西北高原生物研究所青藏高原生物标本馆(HNWP)。短穗柽柳(
T. laxa;GenBank序列号:NC_066442.1)、盐地柽柳(
T. karelinii;GenBank序列号:NC_066443.1)、沙生柽柳(
T. taklamakanensis;GenBank序列号:NC_054218.1)叶绿体基因组序列于NCBI中下载。具体采集信息见
表1。
1.1.2 DNA提取与测序
采用优化CTAB法
[39]从样本量约10 mg的柽柳科植物脱水组织中提取叶绿体DNA,通过琼脂糖凝胶电泳验证其完整性后送至北京诺禾致源科技股份有限公司构建全基因组小片段文库。使用Illumina高通量测序平台NovaSeq 6000进行长度为150 bp的双端测序,原始测序数据经Trimmomatic 0.33进行接头修剪与质量过滤,结合FastQC 11.8软件实施序列质量评估,最终获得高质量clean reads用于后续生物信息学分析。
1.1.3 柽柳科叶绿体基因组组装和注释
利用GetOrganelle 1.7.5软件组装数据,得到fasta格式的叶绿体基因组序列文件。将组装成功的fasta文件于在线工具CPGAWAS2(
http://47.96. 249.172:16019/analyzer/annotate)中进行注释,输出gb格式的叶绿体基因组序列文件。利用Sequin 15.50软件中的检测功能自动识别出存在错误的片段,BLAST比对后手动调整错误片段,一般为增删起始密码子和终止密码子位置,输出修改后的gb文件和fasta文件。利用OGDRAW在线软件(
https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)对得到的gb文件绘制叶绿体基因组环状结构图。
1.1.4 长重复序列和SSR筛选
将fasta文件于REPuter在线工具(
https://bibiserv.cebitec.uni-bielefeld.de/reputer)中进行叶绿体基因组长重复序列统计分析(参数设为Match Direction:-f,-r,-c,-p;Maximum Computed Repeats:50;Minimal Repeat Size:8),将所得数据可视化,得到柽柳科植物叶绿体基因组长重复序列图。将fasta文件于MISA在线软件(
https://webblast.ipk-gatersleben.de/misa/index.php?action=1)中分析叶绿体基因组微卫星序列(SSR),统计分析SSR的类型、数量等参数。
1.1.5 核苷酸多态性分析
在Linux系统中运行MAFFT 7.409软件,比对注释后的叶绿体基因组fasta序列,根据得到的总fasta文件分析基因组结构特征,统计柽柳科10个物种的基因和内含子信息。将总fasta文件导入DnaSP 6.12.03软件中,对核苷酸多态性数据进行统计分析与绘图。
1.1.6 柽柳科植物叶绿体基因组比较分析
利用mVISTA软件(
https://genome.lbl.gov/vista/mvista/about.shtml)中的LAGAN模式,以沙生柽柳为参考物种,对柽柳科10个物种质体基因组相似度进行可视化比对分析。利用R 4.2.2软件将IRscope 0.1.R本地化,在R 4.2.2中使用install指令安装所需要的R包,同时用library检测安装情况。初始化完成后运行IRscope 0.1.R软件,输入gb文件,绘制各物种反向重复/单拷贝区域连接处基因分布对比图。
1.1.7 密码子偏好性分析
采用密码子序列对比分析方法,基于MAFFT 7.409软件完成全数据核苷酸序列比对,通过CodonW 1.4.2软件(
https://codonw.sourceforge.net/)对筛选出的目标物种密码子进行系统化分析。使用EMBOSS在线软件(
http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)统计GC含量。对有效密码子数目(ENc)、相对同义密码子使用度(RSCU)、密码子适应指数(GAI)和同义密码子第3位GC含量(GC3s)等参数进行统计分析与绘图。统计相对同义密码子使用度,在R 4.2.2中使用pheatmap 1.0.12包绘制热图,实现密码子使用偏好性的可视化分析。
1.2 系统发育与进化分析
1.2.1 数据获取
短穗柽柳(GenBank序列号:NC_066442.1)、盐地柽柳(GenBank序列号:NC_066443.1)、沙生柽柳(GenBank序列号:NC_054218.1)、柽柳(GenBank序列号:MN229512.1)、秀柏枝(GenBank序列号:NC_063470)、具鳞水柏枝(M. squamosa;GenBank序列号:NC_060684)、疏花水柏枝(M.laxiflora;GenBank序列号:NC_072270)、海滨瓣鳞花(Frankenia laevis;GenBank序列号:MK397868.1)、瓣鳞花(F. pulverulenta;GenBank序列号:MK397869.1)叶绿体基因组序列于NCBI中下载。结合本研究所测的7个物种样本叶绿体基因组测序数据,共采用14种柽柳科植物和2种外类群植物叶绿体基因组数据构建系统发育树。
1.2.2 系统发育树构建
为了探讨柽柳科属间系统发育关系,以近缘种海滨瓣鳞花和瓣鳞花为外类群,利用叶绿体蛋白编码区序列(CDS)构建系统发育树。使用PhyloSuite 1.2.3对叶绿体蛋白编码区序列集进行比对、文库构建、模型选择后,构建最大似然树和贝叶斯树;得到并利用树文件在ITOL在线软件(
https://itol.embl.de/)中进行系统发育树的编辑和可视化。
2 结果与分析
2.1 柽柳科植物叶绿体基因组特征
2.1.1 柽柳科植物叶绿体基因组测序、组装和注释
所选柽柳科植物叶绿体基因组序列长度为154 684~156 178 bp,叶绿体基因组均由2个反向重复区、1个大单拷贝区和1个小单拷贝区组成,均为四分体结构,基因组图谱如
图1所示。其中,长单拷贝区(LSC)长度为84 374~85 859 bp,短单拷贝区(SSC)长度为17 540~18 308 bp,反向重复区(IR)长度为26 004~26 575 bp(
表2)。注释后的结果显示,10种柽柳科植物叶绿体基因组组成基本一致,约130个基因。非重复基因约111个,其中,蛋白编码基因约78种,rRNA基因4种,tRNA基因约29种(
表3)。
2.1.2 长重复序列分析与SSR筛选结果
REPuter分析结果显示,密花柽柳、盐地柽柳、短穗柽柳仅存在3种重复(回文重复、正向重复、反向重复),其余7种柽柳科植物存在4种重复(回文重复、正向重复、反向重复、互补重复)。10种柽柳科植物均有50条重复序列,且回文重复和正向重复为主要重复类型。重复序列长度大部分分布在10~50 bp(
图2)。利用MISA分析柽柳科植物SSR,结果表明,SSR位点范围为27~54个,均只有二核苷酸和单核苷酸重复,A/T含量最多,C/G含量最少,仅存在于甘蒙柽柳中。所选物种叶绿体基因组中的SSRs主要由polyA或polyT组成(
表4)。
2.1.3 叶绿体基因组序列变异分析
以沙生柽柳叶绿体基因组为参考,利用mVISTA(参数:LAGAN)软件的全局模式,对另外9种柽柳科植物叶绿体基因组进行全局比对。结果表明:10种柽柳科物种叶绿体基因组顺序总体一致,编码区域序列高度保守,非编码区差异较大,整体序列较为保守并存在序列共用现象(
图3)。利用DnaSP 6.12.03软件分析核苷酸多态性(参数:window length600;step size:200)。结果表明,与单拷贝区比较,2个反向重复区序列更为保守,最高峰存在于短单拷贝区序列中(
图4)。
2.1.4 IR/SC边界分析
比较IR/SC边界分布情况,分析其进化过程边界收缩扩张现象(
图5)。结果显示,所选10种柽柳科植物叶绿体基因组在结构、GC含量、基因组成、序列长度这4方面相对保守,而在LSC、SSC、IRa、IRb这4个交界区域存在许多变化。除沙生柽柳外,其余9种柽柳科植物的JLB边界均处于
rps19基因之中。密花柽柳、甘蒙柽柳、宽苞水柏枝、匍匐水柏枝的
rps19基因均向IRb方向收缩。短穗柽柳、多枝柽柳、红砂、五柱红砂的
rps19基因向LSC区域扩张。10种柽柳科植物的JSB边界均处于
ycf1基因内,短穗柽柳、沙生柽柳、密花柽柳、多枝柽柳的JSB边界均未发生收缩和扩张现象;JSA边界扩张范围显示,盐地柽柳、短穗柽柳、沙生柽柳、密花柽柳、多枝柽柳的JSA边界距离SSC区域的
ndhF基因3 bp;甘蒙柽柳、宽苞水柏枝、匍匐水柏枝的JSA边界距离
ndhF基因2 bp。JLA的扩张和收缩情况较为复杂,其中,盐地柽柳、短穗柽柳、密花柽柳、多枝柽柳、红砂、五柱红砂的JLA边界左右两端的基因为
rps19和
trnH基因;沙生柽柳JLA边界距LSC区域内的
trnH基因19 bp;甘蒙柽柳、宽苞水柏枝、匍匐水柏枝JLA边界距IRa区域的
rps19基因1 bp。
2.1.5 密码子偏好性分析
对10种柽柳科植物叶绿体基因组密码子偏好性进行统计,结果表明,10种柽柳科植物有效密码子数目为54.841~55.644,密码子适应指数为0.156~0.162,密码子偏好指数为0.193~0.223,最优密码子使用频率为0.354~0.359(
表5)。ENc均较高,柽柳科植物叶绿体基因组密码子使用偏好性较弱;CAI均较低,柽柳科植物叶绿体基因组密码子适应性较弱;FOP大于0,说明有最优密码子被使用。对10种柽柳科植物叶绿体基因组GC含量进行统计,结果显示,物种间总的GC含量、第一密码子GC含量和第二密码子GC含量相差不大,差值未超过0.5%。第三密码子GC含量相对而言差别较大,五柱红砂含量最高(29.11%),甘蒙柽柳和匍匐水柏枝含量最低(28.22%)。所有物种第三密码子GC含量不超过30%,说明该位点A/T碱基使用较多(
表6)。对编码基因61个密码子进行分析,发现编码精氨酸的AGA的RSCU最高,其次是编码甘氨酸的GGA,编码精氨酸的CGC的RSCU最低。RSCU聚类结果显示,盐地柽柳和甘蒙柽柳聚为一支,其余8种柽柳科植物聚为一支(
图6)。总体而言,所选10个物种的密码子使用情况无较大差异。
2.2 柽柳科系统发育分析
以海滨瓣鳞花和瓣鳞花为外类群,采用贝叶斯法(Bayesian inference,BI)和最大似然法(maximum likelihood,ML)对14种柽柳科植物构建叶绿体蛋白编码区序列(CDS),构建系统发育树(
图7)。系统发育拓扑结构整体呈现高度一致性,多数分支节点在2种方法中均获得最高支持率,柽柳科内主要类群的进化关系具有强统计支持。在2种方法构建的系统发育树中,红砂属为单系群,红砂和五柱红砂均表现为姐妹群关系。秀柏枝和甘蒙柽柳同样以强支持率与具鳞水柏枝、疏花水柏枝、宽苞水柏枝、匍匐水柏枝聚为一支。柽柳属呈现多系群,除了甘蒙柽柳,其余6种柽柳属植物(短穗柽柳、多枝柽柳、密花柽柳、盐地柽柳、沙生柽柳、柽柳)聚为一支。
3 讨论
真核细胞叶绿体被认为是由内共生细菌进化而来的,拥有独立的基因组
[40]。与核基因组相比,叶绿体基因组具有结构保守、没有基因沉默现象、进化速度慢等优势
[41]。但早期叶绿体基因组是由细胞器富集后,进行扩增、测序得到的序列结果
[12,42-43]。这种方法操作复杂且易受杂质干扰,不易得出准确结果,无法发挥叶绿体基因组特征优势。随着大规模高通量测序技术的不断发展,叶绿体基因组的测序效率与准确性大大提高,使叶绿体成为广泛应用于系统发育学和进化生物学等研究领域的理想分子材料。近年来,对西瓜(
Citrullus lanatus)
[44]、兜兰属(
Paphiopedilum)
[45]和谷精草科(Eriocaulaceae)
[46]等植物叶绿体基因组的研究证明,植物类群间的进化关系和方向可以由植物叶绿体基因结构、密码子偏好性、核苷酸多态性等特征反映,并且叶绿体基因组也可用于确定近缘物种系统发育关系
[47]。
本研究对10种柽柳科植物叶绿体基因组进行分析,结果表明:柽柳科植物叶绿体基因组均为典型的四分体结构,基因组大小在154 684~156 178 bp,其中红砂叶绿体基因组最短;约含有130个基因,其中,非重复基因约为111个,蛋白编码基因约78个,rRNA基因4个,tRNA基因约29个。甘蒙柽柳缺失
trnH-
GUG基因、
trnS-
CGA基因,与宽苞水柏枝和匍匐水柏枝缺失的基因一致,在一定程度上暗示了系统发育树中甘蒙柽柳和水柏枝属植物聚类的可能。
rps16基因编码核糖体小亚基蛋白s16,该基因在非编码区之中,表现出高进化速率,对植物进化研究有重要作用
[48]。沙生柽柳非编码区的
rps16基因内含子消失,可能代表沙生柽柳发生了一定程度的变异。总体来说,柽柳科植物叶绿体基因组相差较小,保守性较高。
在群体遗传学、生物地理学和系统进化研究中,叶绿体SSR是高效的分子标记,已被广泛应用
[49]。本研究对柽柳科植物叶绿体基因组SSR进行预测,发现绝大多数为单碱基重复,这与竹叶花椒(
Zanthoxylum armatum)
[50]、胡桃(
Juglans regia)
[51]等植物的研究结果相一致。柽柳科植物长重复序列的回文重复最多,互补重复最少。密花柽柳、盐地柽柳、短穗柽柳仅存在3种重复(回文重复、正向重复、反向重复),其余7种柽柳科植物存在4种重复。不同植物间重复序列的分布差异可反映植物进化时的遗传基因突变速率的差异
[52]。本研究结果表明,柽柳科植物在突变频率和进化速率上的差异可能与重复序列有关,因此,可根据重复序列差异大小推测物种之间亲缘关系远近。大小为10~29 bp的长重复序列占所有长重复序列数量的80%以上。重复序列分析为将来柽柳科植物及其他植物物种鉴定和个体水平的遗传差异分析提供丰富的遗传信息支持。柽柳科植物叶绿体基因组整体相似性和核苷酸多态性比对结果显示,10种柽柳科植物编码区序列比非编码区序列更为保守,反向重复区比单拷贝区更为保守,这种情况普遍存在于被子植物中
[53]。变异率高的区域是系统发育分析潜在的分子标记材料。mVISTA分析表明,柽柳科植物中
atpF、
ycf3、
ycf1、
ndhA、
ndhF、
rpoC2基因是构建柽柳科植物系统发育关系的理想分子标记材料。叶绿体基因中最保守的区域为IR区,其结构、长度和SC区的边界均表现出较强的保守性,是引起叶绿体基因组长度与结构差异的关键因素
[54-55]。本研究通过IR/SC边界分析发现,柽柳科植物叶绿体基因组在序列长度上无显著差异,但边界基因的位置和类型存在较大差异。除沙生柽柳外,其余9种柽柳科植物JLB边界均处于
rps19基因之中,说明柽柳科植物叶绿体基因组的边界变化具有一定的特异性。
rps19基因通过调控叶绿体核糖体组装,影响光合作用相关蛋白的合成效率
[56]。短穗柽柳、多枝柽柳、红砂和五柱红砂的
rps19基因向LSC区延伸,可能通过增加IR区的覆盖范围,保留
rps19的双拷贝功能,增强高盐、干旱下翻译稳定性。
ycf1基因是叶绿体发育必需基因,其边界变异可能与光系统修复能力或抗逆性相关
[57]。红砂和五柱红砂
ycf1基因向SSC扩张58 bp,可能通过延长SSC区增强
ycf1基因单拷贝功能,从而增强胁迫响应。
ndhF基因编码NADH脱氢酶亚基,参与光系统I的环式电子传递,其位置变化可能影响光能利用效率
[58]。盐地柽柳、短穗柽柳等5种的JSA边界向SSC区域的
ndhF基因扩张了3 bp,甘蒙柽柳等3种缩短至2 bp,五柱红砂、红砂的
ndhF基因向IRa收缩7~13 bp,导致JSA边界直接位于
ndhF基因内部。五柱红砂、红砂
ndhF基因的收缩可能与其在干旱生境中光保护机制的强化有关。总体而言,柽柳科植物叶绿体基因组在进化中存在一定的保守性,部分物种存在边界差异,可为研究柽柳科不同物种生理功能、系统发育和鉴定提供依据。
在蛋白质翻译过程中,能编码同种氨基酸残基的不同密码子被定义为同义密码子,其在使用频率上有所差异的现象被称为密码子偏好性
[59]。密码子偏好性作为重要的叶绿体基因组进化特征,在不同物种间存在较多差异
[60]。在本研究中,10个物种间基因的GC含量相差不大,且不同密码子位置的GC含量具有相同趋势(GC1>GC2>GC>GC3),与此前的叶绿体基因组研究结果
[61]类似。柽柳科植物叶绿体基因组的ENc平均值为55.28,表明密码子使用偏好性很弱;CAI的平均值为0.159,表明编码蛋白的同义密码子与最佳密码子使用频率的符合程度低。RSCU分析能够通过相对密码子使用偏好性来表征基因表达水平,是密码子研究的一种核心工具
[62]。本研究中,柽柳科植物叶绿体基因组的RSCU对比分析结果显示,有41个同义密码子的RSCU大于1,表明这些密码子相较其余密码子在柽柳科植物中的使用频率更高。编码精氨酸AGA的RSCU最高(1.93~2.01),其次是编码甘氨酸的GGA(1.41~1.54)。RSCU聚类结果显示,盐地柽柳和甘蒙柽柳聚在一起,其余8种柽柳科植物聚为一支,这与传统分类学不同。有研究
[61]表明,密码子偏好性的聚类结果和物种的亲缘关系可能会存在较大差异,这与本研究所得结果相似。
柽柳科植物系统发育结果显示,在建立的2种系统发育树中红砂和五柱红砂都以100%的强支持率聚为一支,这表明红砂属为单系类群。水柏枝属的分类单元长期以来就存在各种争议,这主要源于秀柏枝的分类位置。学者
[63]认为其性状处于柽柳属和水柏枝属之间,有很多过渡性状,可以成立一个新属或者归类为水柏枝属。水柏枝属植物典型特征为叶呈线形至鳞片状,肉质化;花序为密集总状花序,苞片早落,花柱3深裂;果实为圆锥形蒴果,沿背缝线开裂。秀柏枝则呈现显著差异:叶为卵形至披针形,非肉质化;花序疏松,苞片宿存至果期,花柱仅顶端3浅裂;果实为卵球形蒴果,3瓣裂
[21]。尽管二者在繁殖器官与营养器官的形态特征上存在显著差异,但本研究的系统发育树聚类结果仍支持将秀柏枝归类在水柏枝属之下(支持率ML/BI=100/1),而不应该成立一个新属,这一结论与席以珍
[64]的研究结果一致,提示其形态变异可能反映生态适应下的性状演化,而非属级分化事件。甘蒙柽柳聚类在水柏枝属之下,与此前系统发育研究
[65]中部分柽柳属物种归入水柏枝属的结果类似。基于当前取样范围和分析数据(叶绿体基因组CDS序列),在现有分类框架下柽柳属表现出多系性特征,这与此前基于ITS序列建立的系统发育树结果认为柽柳属是单系类群相冲突
[66]。在近缘物种或属级分类中,CDS序列相比ITS序列更加保守,更能反映出真实的系统发育关系
[41]。本研究基于叶绿体基因组CDS序列构建的系统发育树整体支持率高且拓扑结构稳定。目前,对甘蒙柽柳的系统发育研究绝大部分是基于ITS序列,现有研究
[67-68]表明,用ITS序列和用CDS序列对相同柽柳科物种进行系统发育研究会产生拓扑结构冲突的结果。这种冲突可能源于多种进化机制的共同作用,例如杂交渐渗、不完全谱系分选及叶绿体与核基因组间不同的选择压力差异,强烈提示甘蒙柽柳可能存在复杂的网状进化事件。鉴于本研究在柽柳属内部的取样覆盖度有限,柽柳属作为一个整体,究竟是单系群还是多系群,以及其确切的系统发育关系尚未明确,后续研究需进一步扩大柽柳科物种取样覆盖度,并整合核基因组与形态学等多维度数据,以全面解析柽柳科的进化动态。
4 结论
本研究表明,所选取10种柽柳科植物的叶绿体基因组结构高度保守,均为环状四分体结构。其叶绿体基因组全长为154 684~156 178 bp,编码约130个基因。柽柳科植物叶绿体基因组的编码区比非编码区序列更为保守,反向重复区比单拷贝区遗传多态性更低,atpF、ycf3、ycf1、ndhA、ndhF、rpoC2基因可能是重建柽柳科系统发育关系的理想分子标记。柽柳科植物叶绿体基因组的密码子使用偏好性很弱。沙生柽柳rps16基因内含子缺失,表明其序列发生了一定程度的变异,可能是沙生柽柳的一个进化特征。系统发育分析表明,红砂属为单系类群,在现有分类框架及取样范围内,柽柳属呈现多系性。基于甘蒙柽柳和秀柏枝与水柏枝属的聚类关系,建议将其划归水柏枝属。然而,鉴于本研究对柽柳属内部多样性的取样覆盖度尚显不足,柽柳属整体的单系性或多系性结论仍需未来更全面的系统发育研究予以确认。