疏花地榆(
Sanguisorba diandra (Hook. f.) Nordborg)属蔷薇科(Rosaceae Juss.)蔷薇亚科( Rosoideae (Juss.) Arn.)龙牙草族(
Agrimonieae Lam. et DC.)地榆属(
Sanguisorba L.)
[1]。目前已报道6个地榆属物种的叶绿体基因组
[2⁃5],但疏花地榆的叶绿体基因组还未见报道。疏花地榆为多年生草本植物,主要分布于我国西藏自治区亚东县、聂拉木县、吉隆县,不丹、尼泊尔等国家也有分布。疏花地榆生于山坡草地、林缘及灌丛中
[6⁃7]。本文研究疏花地榆的叶绿体基因组,并探讨疏花地榆与地榆属相关物种之间的系统发育关系,以期为后续物种鉴定和开发利用提供理论基础。
疏花地榆实验材料采自西藏自治区亚东县,在野外除采集腊叶标本外,采集新鲜幼嫩叶片放入硅胶中进行干燥保存备用,凭证标本(Li QQ 20230720007)存放于内蒙古师范大学植物标本室(NMTC)。
使用CTAB法
[8]提取疏花地榆样品的总DNA,采用诺禾致源(Novogene) Illumina NovoSeq双末端测序平台进行建库及高通量测序,最终获得150 bp的成对末端短读序列。
将获得的短读序列使用软件Trimmomatic
[9]去除其接头序列,获得原始读序。使用NOVOplasty
[10]对样本的原始读序进行组装并获得疏花地榆的叶绿体基因组。组装时采用有参组装,将已组装好的矮地榆(
Sanguisorba filiformis (Hook.f.) Hand.⁃Mazz.,凭证标本Li QQ 20220715025)的叶绿体基因组序列
[11]作为参考序列,以矮地榆的
rbcL基因作为种子序列。
以完整注释的矮地榆(凭证标本Li QQ 20220715025)的 叶绿体基因组
[11]作为参照,使用软件Geneious Prime
[12]对疏花地榆的叶绿体全基因组序列进行转移注释,对起始密码子、终止密码子的位置和内含子与外显子的边界进行检查,必要时进行手动调整。完整注释的疏花地榆叶绿体基因组序列GenBank登录号为PP916014。利用在线工具Organellar Genome DRAW(
https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)
[13]绘制疏花地榆叶绿体基因组环状图谱(
图1)。
为探讨疏花地榆在地榆属中的系统发育位置,参照Zhang等
[5]的研究,使用17条叶绿体基因组序列进行系统发育树构建,其中13条序列是地榆属物种的叶绿体基因组序列,4条作为外类群
Acaena pinnatifida(KY419984)、
Margyricarpus pinnatus(KY419972)、
Polylepis reticulata(KY419921)和
Cliffortiarepens(KY419983)的叶绿体基因组序列。首先使用MAFFT
[14]对所有叶绿体基因组序列进行序列比对,其结果以Fasta格式导出;然后使用TrimAL
[15]对比对序列进行适当修剪;分别使用最大似然法(maxinum likelihood,ML)和贝叶斯法(Bayesian inference,BI)进行系统发育分析。使用RAxML
[16]构建最大似然树,建树方法参照Zhang等
[17]的研究。贝叶斯法是先使用PartitionFinder2
[18]选择修正赤池信息量准则(corrected akaike information criterion)
[19]下的最佳模型GTR+I+G,然后使用MrBayes
[20]进行BI分析,建树方法参照Guo等
[21]的研究。最终使用FigTree v1.4.4
[22]查看构建所得的系统发育树。
疏花地榆的叶绿体基因组为一个环状结构,呈典型的四分体结构,包括一个大单拷贝区(LSC),长度为85 013 bp,GC含量为35.3%;一个小单拷贝区(SSC),长度为18 703 bp,GC含量31.4%;两个反向重复区(IRs),长度为25 558 bp,GC含量为42.8%(
图1)。
疏花地榆的叶绿体基因组共编码129个基因,其中包括84个蛋白质编码基因(protein coding genes,PCGs)、37个转运核糖核酸基因(transfer RNA genes, tRNAs)和8个核糖体核糖核酸基因(ribosomal RNA genes, rRNAs)。其中有17个基因在IR区有2个拷贝,分别为6个PCGs(
ndhB、rps7
、rps12
、rpl2
、rpl23
、ycf2),4个rRNAs(
rrn4.5
、rrn5
、rrn16
、rrn23),7个tRNAs(
trnA⁃
UGC、trnI⁃
CAU、trnI⁃
GAU 、trnL⁃
CAA 、trnN⁃
GUU、trnR⁃
ACG、trnV⁃
GAC)。在112个独特基因中,共有17个基因具有内含子,其中14个基因含有1个内含子(
trnA⁃UGC、trnG⁃UCC、trnI⁃GAU、trnK⁃UUU、trnL⁃UAA、trnV⁃UAC、rps16
、rpl2
、rpl16
、rpoC1
、petB、petD、ndhA、ndhB),3个基因含有2个内含子(
rps12
、ycf3
、clpP),
rps12基因存在反式剪接现象(
表1)。
最大似然法和贝叶斯法构建的最大似然树(ML)和贝叶斯树(BI)如
图2所示,其拓扑结构完全一致。系统发育分析表明:地榆属为单系类群,地榆属物种和外类群明显分离;地榆属物种内部分为两个分支,地榆(
S. officinalis L.)、宽蕊地榆(
S. applanata T. T. Yü & C. L. Li)、细叶地榆(
S.tenuifolia Fisch. ex Link)、小白花地榆(
S. tenuifolia var.
alba Trautv. & C. A. Mey.)、
S. hakusanensis Makino、大白花地榆(
S.stipulata Raf.)和高山地榆(
S.alpina Bunge)聚为一支;矮地榆和疏花地榆聚为一支为姐妹类群。
本文报道了第一个完整的疏花地榆叶绿体全基因组,与已知的其他地榆属物种的叶绿体基因组相比
[2⁃5],疏花地榆的叶绿体基因组也具有典型的四分体结构,基因组大小相似、基因含量和基因顺序一致。系统发育分析表明在当前取样背景下,疏花地榆与矮地榆的亲缘关系更为密切,证实了基于形态的两者之间的相近关系
[6,23]。疏花地榆的近缘种矮地榆的根可入药治痛经等症
[4,23],本研究从系统亲缘学的角度为疏花地榆作为潜在药用植物提供了理论依据。此外,本研究为进一步研究地榆属物种鉴定和系统发育提供了分子数据。