小果黄芪(
Astragalus zacharensis Bunge.)隶属于豆科(Fabaceae Lindi.)蝶形花亚科(Papilionoideae DC.)黄芪属(
Astragalus L.)
[1⁃2]。该种为中旱生草本植物,产于我国辽宁省西部、河北省北部、山西省北部、内蒙古自治区、陕西省、宁夏回族自治区、甘肃省、青海省、四川省、新疆维吾尔自治区,在蒙古国也有分布
[3⁃4]。小果黄芪为中等饲用植物,适宜放牧利用,马、牛、山羊、绵羊、驴、兔等均采食,也是蜜源植物
[5]。有关小果黄芪的叶绿体全基因组至今未见报道,本文报道了小果黄芪的叶绿体全基因组,为后续研究该物种的分类、系统发育、资源开发利用等提供分子依据和理论支撑。
使用改良CTAB法
[6],从硅胶干燥的植物叶片中提取植物总DNA。获取的DNA使用1%琼脂糖凝胶电泳进行检测,在诺禾致源(Novogene)Illumina平台利用双末端测序策略进行文库构建及高通量测序。
测序获得150 bp双末端短读序列(paired-end reads)后,用Trimmomatic软件
[7]去除接头序列(adapters),获得原始数据(raw reads)。小果黄芪的叶绿体全基因组序列组装在软件NOVOPlasty
[8]中进行。以草木樨状黄芪(
Astragalus melilotoides,NCBI登录号NC_072247)的叶绿体全基因组为参考序列(reference sequence),其核酮糖-1,5-二磷酸羧化酶/加氧酶(
rbcL)基因作为 种子序列(seed sequence)。参照Li等
[9]的方法,组装完成的叶绿体全基因组序列先在GeSeq
[10]在线平台(
https://chlorobox.mpimp-golm.mpg.de/geseq.html)注释,然后在CPGAVAS2(
www.herbalgenomics.org/cpgavas2)
[11]中再交叉检验注释,注释时参照草木樨状黄芪(NC_072247)、糙叶黄芪(
Astragalus scaberrimus,MW654102)、
Astragalus iranicus(LC764834)的叶绿体基因组,然后将两个平台注释结果导入Geneious Prime
[12]软件中,检验编码基因的起始密码子和终止密码子、内含子和外显子的边界,必要时进行手动调整。小果黄芪完整组装注释后的叶绿体基因组序列已上传GenBank,登录号为OR911499。最终在OGDRAW(
https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)
[13]在线平台生成小果黄芪的叶绿体 基因组图谱。
为探讨小果黄芪在黄芪属内的系统发育位置,参考Zhao等
[2]的研究,从GenBank下载了41条豆科物种的叶绿体基因组序列,与小果黄芪的叶绿体基因组序列共同构建系统发育树。选取太白岩黄芪(
Hedysarum taipeicum (Hand.Mazz.) K. T. Fu)、红花山竹子(
Corethrodendron multijugum (Maxim.) B. H. Choi et H. Ohashi)、骆驼刺(
Alhagi sparsifolia Shap. ex Keller et Shap.)、无茎雀儿豆(
Chesneya acaulis(Baker)Popov)、中甸高山豆(
Tibetia forrestii(Ali)P.C.Li)和边塞锦鸡儿(
Caragana bongardiana(Fisch. et Mey.)Pojark.)作为外类群。数据矩阵的构建按苏春
[14]的方法,在Geneious Prime中提取所有序列中的蛋白编码基因,通过MAFFT比对,去除缺失和长度差异大的基因
atpE、
clpP、
psbL、
ycf2、
ycf1和
accD,将余下的70个基因串联后比对,导出Fasta格式。比对导出的序列使用TrimAL
[15]软件进行修剪,基于最大似然法(Maximum likelihood, ML)和贝叶斯法(Bayesian inference, BI)进行系统发育分析。参照Zhang等
[16]的建树方法,使用RAxML
[17]构建最大似然树。贝叶斯树的构建使用PartitionFinder2
[18]选择GTR+Ι+G作为最优模型并在MrBayes
[19]中进行BI分析。生成的树在FigTree
[20]中查看。
完整的小果黄芪叶绿体基因组为环状,缺失一个反向重复区,长度为123 015 bp (
图1),总GC含量为34.1%,AT含量为65.9%。小果黄芪叶绿体基因组包含110个基因,含蛋白质编码基因(protein-coding genes,PCGs)76个,核糖体RNA基因(ribosomal RNA genes,rRNAs)4个,转运RNA基因(transfer RNA genes,tRNAs)30个(
表1)。其中16个基因含有1个内含子(
atpF、
clpP、
ndhA、
ndhB、
petB、
petD、
rpl2、
rpl16、
rpoC1、
rps12、
trnA-
UGC、
trnG-
UCC、
trnI-
GAU、
trnK-
UUU、
trnL-
UAG、
trnV-
UAC),
ycf3含有2个内含子。同多数豆科植物一样,小果黄芪的叶绿体基因组中
rps16
和rpl22基因丢失
[21]。基因
rps12与
clpP中出现内含子缺失现象,这与前人在豆科IRLC(inverted repeat⁃lacking clade)类群中发现的现象一致
[22]。
系统发育分析结果(
图2)证实了黄芪属的单系性。苦马豆属(
Sphaerophysa DC.)、膨果豆属(
Phyllolobium Fisch.),扁枝豆属(
Carmichaelia R.Br.)和
Lessertia DC.聚为一支(Coluteoid分支),该分支与棘豆属(
Oxytropis DC.)聚为一大支并与黄芪属构成姐妹关系,与苏春
[15]的研究结果一致。在本研究取样条件下,小果黄芪与笔直黄芪(
A. strictus R. Grah. ex Benth.)聚在一起,具有密切的系统发生关系。
通过高通量测序及生物信息学手段获得了小果黄芪的叶绿体全基因组,分析了其叶绿体基因组大小、结构、基因内容等特征。基于叶绿体基因组序列构建的系统发育树表明小果黄芪与笔直黄芪有密切的系统发生关系。本研究丰富了黄芪属物种的叶绿体基因组资料,对小果黄芪的分子鉴定和资源利用具有参考价值。