0 引 言
紫茎泽兰〔
Ageratina adenophora (Sprengel) R. M. King & H. Rob.〕和藿香蓟(
Ageratum conyzoides L.)同属于菊科(Asteraceae Bercht. & J.Presl)
[1],均为中国1级外来入侵物种(
https://www.iplant.cn/ias/),在生态入侵性与药用价值方面具有重要研究意义。紫茎泽兰为多年生草本植物,原产于中美洲,分布于墨西哥至哥斯达黎加一带,后作为观赏植物引入欧洲,并迅速入侵亚洲、澳洲等地,目前在中国药山国家级自然保护区等地已形成优势群落,严重威胁本土生物多样性与生态稳定
[2]。与此同时,紫茎泽兰亦显示出良好的药用开发潜力,例如,其叶片在印度的民间医学中常用作收敛剂、生热剂、兴奋剂和抗菌剂,花序与根部的精油具有抗菌、植物毒性和抗氧化活性
[3]。研究发现,紫茎泽兰叶片汁液中的活性成分euptox A表现出抗癌活性并在胃肠道条件下呈现稳定状态
[4]。
藿香蓟为一年生草本植物,原产于中美洲,于19世纪传入中国华南地区,其适应性强且易于繁殖,目前在多个省份均有分布,常见于荒地、田边与河岸等生境
[5]。尽管藿香蓟对植物多样性保护具有负面影响,但它在传统医药中应用广泛,如常用于治疗咽喉炎症、湿疹、外伤及多种感染性疾病,因此其价值仍不可忽视。现代药理学研究证实,藿香蓟叶片提取物不仅可通过调控Wnt/
β-catenin通路缓解骨关节炎软骨损伤
[6],其与水线草(
Oldenlandia corymbosa)提取物结合制成的纳米乳凝胶更能显著降低关节炎模型大鼠炎症标志物(MMP-13、ADAMTS-5)水平,且安全性良好
[7]。最新研究还揭示其乙醇提取物具有显著抑菌与抗氧化活性
[8],充分证实了藿香蓟作为多功效药用资源的开发潜力。
紫茎泽兰和藿香蓟作为入侵物种,在环境适应能力和种子繁殖能力方面均表现强势,这与二者含有化感物质有关
[9-11]。此外,两者均已被证明含有多种化学成分,如生物碱类、萜类、黄酮类、甾体类和苯丙素类等
[12-13]。然而,目前关于其化感作用的分子基础及化学成分的合成途径仍不清楚。要系统揭示物种的入侵机制,并解析其次生代谢产物的生物合成通路,必须从其遗传背景入手。但目前,相关分子遗传机制研究仍较为薄弱,尤其缺乏高质量的转录组基础数据与功能基因注释信息,这严重限制了对该资源进一步深入研究与开发利用。
因此,本研究基于Illumina HiSeqTM平台对紫茎泽兰和藿香蓟叶片进行转录组测序,通过比较分析二者的功能注释、代谢通路及表达序列标签(expressed sequence tag,EST)-简单重复序列(simple sequence repeats,SSR)。旨在为解析其入侵机制和推进药用资源开发提供关键遗传信息,为种群遗传学研究开发多态性EST-SSR分子标记。
1 材料与方法
1.1 材料采集
紫茎泽兰、藿香蓟分别来源于云南省昆明市盘龙区盘龙江边(25º07'47''N,102º45'51''E)和河南省信阳市震雷山(32º04'00''N,114º06'52''E)。采集同一植株的新鲜、健康的幼叶放入冷冻管中,并用液氮处理约15 s,最后将其存放在80 ℃的冰箱中。凭证标本(紫茎泽兰:LiYan22-001,藿香蓟:Xia2023022)保存在山东第二医科大学中医学院植物标本室。
1.2 RNA提取和高通量测序
首先,利用Total RNA Extractor(Trizol)试剂盒从植物的幼嫩叶片材料中提取总核糖核酸(ribonucleic acid,RNA),通过琼脂糖凝胶电泳检测RNA的完整性以及污染度;然后,采用Nanodrop分光光度计对RNA纯度进行初筛;最后,通过Qubit荧光定量仪和Agilent 2100生物分析仪精确测定RNA浓度及其完整性。严格质控后,选取合格样本构建cDNA文库,利用Illumina Hiseq 2500测序平台,采用PE150策略测序,获得原始测序序列(Raw reads)。
1.3 数据质量处理和拼接组装
使用Trimmomatic
[14]对原始数据进行质控处理,具体步骤包括:去除带N碱基的序列;去除reads中的接头序列;从reads两端起过滤
Q值<20的低质量碱基,获得高质量Clean Reads。使用Trinity 2.4.0软件
[15]对Clean reads进行
de novo组装(参数设置:min_kmer_cov 2,其余参数保持默认)。对组装获得的转录本序列进一步去冗余,筛选每条基因中最长的转录本作为单基因,用于后续分析。
1.4 功能注释
使用NCBI Blast+软件(
https: //blast.ncbi.nlm.nih.gov /Blast.cgi),将所得单基因序列与保守结构域数据库(Conserved Domain Database,CDD;
https://www.ncbi.nlm.nih.gov/cdd/)、真核生物蛋白质直系同源簇(Clusters of orthologous groups for eukaryotic complete genomes,KOG;
https://www.ncbi.nlm.nih.gov/COG/)、非冗余蛋白库(Non-Redundant Protein Sequence Database,NR;
http://ncbi.nlm.nih.gov/)、核酸序列数据库(Nucleotide Sequence Database,NT;
http://ncbi.nlm.nih.gov/)、基因本体数据库(Gene Ontology,GO;
http://www.geneontology.org)、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG;
http://www.kegg.jp)及蛋白质序列数据库(Protein family,PFAM;
http://pfam.xfam.org/)等多个数据库进行比对,以获取功能注释信息。利用KAAS(KEGG automatic annotation server)
[16]将单基因序列与KEGG数据库进行比对,获得KEGG通路注释信息。
1.5 SSR检测
采用MicroSatellite(MISA,
https://webblast.ipk-gatersleben.de/misa/)对基因转录本进行SSR位点检测。设置的各类型重复基元最低重复次数为:二核苷酸为6次,三核苷酸、四核苷酸、五核苷酸及六核苷酸均为5次。基于以上统计结果,进一步对SSR的发生频率、基元类型、基元长度及重复次数进行分析。经统计后,利用Primer3
[17]进行SSR引物设计,所选择的引物长度为18~23 bp,理论退火温度为57 ℃~62 ℃,GC含量为30%~70%,其余参数默认。
2 结果与分析
2.1 转录组数据组装及单基因获取
本研究对紫茎泽兰和藿香蓟的叶片mRNA进行了测序,分别获得40 284 252和46 478 924条Raw reads,序列总长度分别为6 042 637 800 bp和6 971 838 600 bp。经过滤,两个物种分别获得相应的Clean reads,其中紫茎泽兰的Clean reads数量为39 146 932条,占Raw reads总量的97.18%,序列总长度为5 649 990 652 bp,平均读长为144.33 bp。藿香蓟的Clean reads数量为44 933 390条,占原始测序数据的96.67%,总长度为6 468 483 453 bp,平均读长为143.96 bp。
在测序过程中,常用碱基测序质量值作为测序准确性的量化指标,该值以整数形式反映每个碱基识别错误的概率
[18]。对紫茎泽兰和藿香蓟的Clean reads进行质量分析,其碱基Q20分别为98.48%和98.32%,碱基Q30分别为94.72%和94.40%,GC含量分别为48.10%和43.46%。
研究用Trinity软件将Clean reads
de novo组装成转录本,获得了相应的转录本和单基因。紫茎泽兰共获得79 531条转录本,总长度为65 567 638 bp;去冗余后得到44 559条单基因,其总长度为33 362 505 bp。藿香蓟共获得163 104条转录本,总长度为137 785 270 bp;71 305条单基因,总长度为50 759 462 bp。两者的转录本长度主要集中于500~1 000 bp,单基因的长度则集中于200~300 bp,如
图1所示。
2.2 转录组基因功能注释
将紫茎泽兰和藿香蓟的单基因分别与CDD、KOG、NR、NT、PFAM、GO及KEGG数据库进行比对和基因功能注释,分别获得44 559和71 305个功能基因,如
表1所示。分析发现,两个物种均为注释到NR数据库的基因数目最多,占比分别为74.03%和62.29%;注释到KEGG数据库的基因数目最少,占比分别为17.60%和16.87%。
2.3 NR功能注释
通过将组装获得的单基因序列与NR数据库进行比对分析,发现其同源序列物种中,紫茎泽兰与假泽兰属的微甘菊(
Mikania micrantha)序列相似度最高(47.64%),其次为向日葵(
Helianthus annuus,32.30%);而藿香蓟与包果菊属的菊薯(
Smallanthus sonchifolius)序列相似度最高(26.59%),微甘菊(25.89%)次之,见
图2。
2.4 GO功能注释分类
研究对紫茎泽兰和藿香蓟的单基因进行GO注释,统计它们在生物学过程(biological process, BP)、细胞组成(cellular component, CC)和分子功能(molecular function, MF)3大类别中的功能分布信息,如
表2所示。其中,紫茎泽兰中共有15 781个单基因获得984 483条注释信息:BP覆盖25个亚类,604 626个基因获得注释;CC覆盖21个亚类,252 069个基因获得注释;MF覆盖18个亚类,127 788个基因获得注释。在64个亚类分析中,CC大类下的细胞和细胞部分注释基因数量并列最高(均为13 572,9.39%)。BP大类下的细胞过程(11 605,8.04%)次之。此外,CC中的细胞器(10 449,7.24%)、BP中的代谢过程(9 975,6.91%)和MF中的催化活性(catalytic activity)(7 076,4.90%)也是注释较多的亚类。
藿香蓟共有21 234个单基因获得1 048 575条注释信息,表明平均每条单基因注释信息量非常高。其中,BP覆盖25个亚类,646 016个基因获得注释;CC覆盖20个亚类,265 337个基因获得注释;MF覆盖19个亚类,137 222个基因获得注释。在64个亚类分析中,CC大类下的细胞(18 399)和细胞部分(18 398)注释基因数量最多且占比相同(均为9.13%)。BP大类下的细胞过程(16 121,8.00%)次之。其他富集较多的亚类包括CC中的细胞器(14 471,7.18%)、BP中的代谢过程(14 073,6.98%)和MF中的催化活性(9 825,4.87%)。
紫茎泽兰和藿香蓟的GO注释分析结果揭示了一个核心的共同模式。即基础细胞结构(细胞、细胞部分、细胞器)和基本生命活动(细胞过程、代谢过程)相关的基因在两个物种中均占据主导地位,反映了植物基因功能的保守性。然而,物种间也存在明显差异,如紫茎泽兰拥有注释数量较多的单基因,但藿香蓟的注释深度最高。这些共性和差异为理解这两个近缘物种的生物学特性和潜在的功能分化提供了重要线索。
2.5 代谢通路分析
在代谢通路的注释研究中,发现紫茎泽兰和藿香蓟展现出显著的种内特性与种间分化。其中,紫茎泽兰共获得14 272条注释信息,相关的代谢通路可系统归纳为细胞进程、环境信息处理、遗传信息处理、新陈代谢和有机系统5大类中的33个亚类。其中,新陈代谢和有机系统所含亚类较多,分别为11个和10个;细胞进程和遗传信息处理次之,均包含4个亚类;环境信息处理所含亚类最少,为3个,如
图3所示。此外,与新陈代谢有关的途径共注释了4 944个基因,占比最高,为总数的34.64%;其次为有机系统,共注释了3 296个基因,占比为23.09%;遗传信息处理则位居第三,共有2 701个基因,占比为18.93%。在所有代谢途径中,信号传导所获得的注释信息最多,共注释了1 790个基因,占比12.54%;翻译次之,共注释了1 082个基因,占比7.58%;信号分子和互作作用所获得的注释信息最少,仅有6条。
在所有的KEGG代谢通路中,共有69个单基因注释于萜类骨架生物合成通路(KEGG数据库通路ID: ko00900),与单萜类生物合成通路(KEGG数据库通路ID: ko00902)、二萜类生物合成通路(KEGG数据库通路ID: ko00904)、倍半萜和三萜生物合成通路(KEGG数据库通路ID: ko00909)相关的单基因分别有7个、25个和20个,这些均与萜类物质合成相关。此外,还有45个和29个单基因分别注释到了类黄酮生物合成通路(KEGG数据库通路ID: ko00941)和异喹啉生物碱的生物合成通路(KEGG数据库通路ID: ko00950)。注释到苯丙氨酸代谢(KEGG数据库通路ID: ko00360)的单基因较多,有78个。
将藿香蓟的单基因与KEGG数据库进行比对,共获得22 986条注释,如
图3所示。在5个分类系统中,新陈代谢和有机系所包含的亚类数量较多,分别为12个和10个。其次是细胞进程和遗传信息处理,二者均包含4个亚类;而环境信息处理包含3个亚类。其中,与新陈代谢相关的途径共注释了8 249个基因,占比最高,为35.89%;之后是与有机系统相关的代谢途径,共有5 150个基因被注释,占比22.40%;再者是与环境信息处理相关的代谢途径,共有2 808个基因,占比12.22%。在所有代谢途径中,信号转导获得的注释信息最多,有2 694条,占总数的11.72%;其次是翻译获得的注释信息,共计2 121条,占比9.23%;其中获得注释信息最少的是信号分子和互作作用,仅有10条,占比0.36%。
在所有的KEGG代谢通路中,藿香蓟共有94个单基因注释于萜类骨架生物合成通路(KEGG数据库通路ID: ko00900),与单萜类生物合成通路(KEGG数据库通路ID: ko00902)、二萜类生物合成通路(KEGG数据库通路ID: ko00904)、倍半萜和三萜生物合成通路(KEGG数据库通路ID: ko00909)相关的单基因分别有16个、37个和38个。此外,分别有58个和48个单基因分布于类黄酮生物合成通路(KEGG数据库通路ID: ko00941)和异喹啉生物碱的生物合成通路(KEGG数据库通路ID: ko00950)。注释到吲哚生物碱合成(KEGG数据库通路ID: ko00901)、黄酮和黄酮醇的生物合成通路(KEGG数据库通路ID: ko00944)的单基因较少,分别有2个和1个。
对紫茎泽兰和藿香蓟KEGG代谢通路结果进行对比发现,在基因注释规模方面,前者的单基因数量远超藿香蓟,但其注释密度较低。其次,代谢通路的分类框架在种间高度保守,均被归纳为5大类和33个亚类。其中新陈代谢和有机系统始终占据最丰富的亚类资源,而环境信息处理仅含3亚类,反映核心代谢层级的结构稳定性。关键代谢途径的分布进一步揭示功能偏好的异同,如翻译途径在两个物种中均高度活跃,印证了遗传信息基础加工的保守性;信号转导途径同样表现突出,为注释量最高的单一路径,暗示环境响应机制的重要性。此外,两者均高度富集萜类、黄酮类和异喹啉生物碱化合物合成通路,但在基因资源丰富度上存在差异。
2.6 KOG注释分类
将紫茎泽兰的单基因与KOG数据库进行比对,共获得15 456条注释信息,根据其功能共分为25个类别(
图4)。其中,数量最多的是信号传递机制(2 226,14.40%),其次为只有一般功能预测基因(1 804,11.67%),翻译后修饰、蛋白质更新、蛋白质伴侣(1 646,10.65%),翻译、核糖体结构和生物发生(872,5.64%),转录)(868,5.62%),未知功能基因(827,5.35%),而碳水化合物转运和代谢,细胞间运输、分泌物和囊泡运动,RNA加工和修饰,能源生产与转化,次生代谢物合成、转运和代谢,脂类转运和代谢等19类注释结果的基因所占比例均低于5%,其中注释到细胞活性的基因最少,仅占0.03%。
通过将藿香蓟的单基因与KOG数据库进行比对,共获得了21 902条注释信息,同样分为25个类别,如
图4所示。研究表明,该物种基因数量差异显著,其中信号传递机制基因数量最多(2 933, 13.4%)。其次为翻译后修饰、蛋白质更新、蛋白质伴侣(2 468,11.27%),只有一般功能预测基因(2 297,10.49%),翻译、核糖体结构和生物发生(1 959,8.94%),能源生产与转化(1 111,5.07%),而注释到细胞外结构、核结构、辅酶运输和代谢、无机离子运输和代谢、核苷酸运输和代谢等20个类别的基因数量占比均低于5%,其中类别最少的同样为细胞活性,仅占0.05%。
对两个物种的比较分析表明,其单基因功能分类框架高度保守(均分为25类),但功能类别的基因丰度分布存在显著物种特异性差异:(1)核心功能模块具有保守性。信号传递机制,翻译后修饰、蛋白质更新、蛋白质伴侣,和只有一般功能预测基因在两个物种中均位列前3位,凸显了细胞信号传导、蛋白质稳态维持及功能未知基因库在植物中的基础重要性。(2)物种间存在特异性功能偏好。其中,紫茎泽兰中信号传递机制占据绝对主导地位,其转录相关基因丰度相对较高。藿香蓟中虽以信号传递机制为最丰富类别,但在能源生产与转化方面拥有相对更高的基因资源。
此外,与次生代谢物合成、转运和代谢相关的基因在两个物种中占比均较低,这与KEGG分析中观察到的核心次生代谢通路(如萜类、黄酮类)基因富集形成对比,表明KOG系统对次生代谢通路的注释粒度可能较粗或存在分类差异。细胞活性在两个物种中均为最稀有的功能类别,符合植物细胞的生物学特性。
2.7 SSR检测分析
紫茎泽兰中共检测到3 367个SSR(3 038个完全型SSR和329个复合型SSR),发生频率为6.88%,平均分布距离为1/9.91 kb。重复基元类型的统计结果显示,三核苷酸重复数量最多,占SSR总数的56.49%;二核苷酸次之,占25.75%;四至六核苷酸占比分别为3.18%、1.22%、3.59%;复合核苷酸占比9.77%,如
表3所示。
藿香蓟中共检测到4 757个SSR(4 350个完全型SSR和407个复合型SSR),发生频率为5.93%,平均分布距离为1/10.67 kb。重复基元类型中,三核苷酸重复数量最多,占SSR总数的61.76%;二核苷酸次之,占27.90%;四至六核苷酸占比分别为0.99%、0.27%、0.53%;复合核苷酸为8.56%,如
表3所示。
研究发现,SSR序列长度与其多态性呈正比,当基序长大于或等于20 bp时,其多态性水平较高,位于12~20 bp时多态性中等,低于20 bp时多态性则较低
[19]。本研究对紫茎泽兰和藿香蓟的EST-SSR进行了检测,重点关注长度≥20 bp的重复基元。统计结果如
图5所示,紫茎泽兰中共检测到1 171条长度≥20 bp的SSR。三核苷酸占据主导地位(445条,38.00%),复合核苷酸(290条,24.77%)和二核苷酸(198条,16.91%)次之。四核苷酸(96条,8.20%)、五核苷酸(34条,2.90%)和六核苷酸(108条,9.22%)的比例均较低。
藿香蓟中发现963条目标SSR。三核苷酸重复占绝对优势(404条,41.95%),复合核苷酸次之(368条,38.21%)。二核苷酸(114条,11.84%)、四核苷酸(45条,4.67%)、五核苷酸(11条,1.14%)和六核苷酸(21条,2.18%)的比例均较低。本研究基于有效SSR位点,筛选去除其靠前或靠后的序列,分别对紫茎泽兰和藿香蓟设计了10对引物,其中SSR长度为20~51 bp,预期产物大小为152~279 bp,如
表4所示。该引物集为物种后续的多态性验证与遗传分析提供了重要的候选标记资源。
以上SSR分子标记的特征表明,紫茎泽兰和藿香蓟表现出相似的微卫星分布模式,但在丰度和密度上存在种间差异。核心保守性体现在重复基元类型的高度一致性,即三核苷酸重复在两个物种中均占据主导地位,其次是二核苷酸重复,而四、五、六核苷酸占比总和均低于10%。对于两个物种中EST-SSR长度≥20 bp的分布,发现三核苷酸重复类型均占据主导地位,表明其在EST-SSR中普遍具有优势,是开发多态性标记的重要来源。
3 讨 论
RNA-Seq技术作为研究非模式植物的有力手段,能够高效揭示基因表达的时空动态特征,并为新基因挖掘提供了便捷的研究途径。本研究通过对紫茎泽兰和藿香蓟两种菊科植物进行转录组测序分析,揭示了其在基因功能注释、代谢通路特征及EST-SSR分布规律等方面的共性与特异性。两者的比较分析不仅为其入侵机制研究提供了新视角,也为其药用资源的深度开发奠定了分子基础。
功能注释结果显示,紫茎泽兰在NR数据库中的注释占比高于藿香蓟,表明两者在基因组结构或序列保守性上可能存在差异,但两者的同源序列均集中分布于菊科近缘物种(紫茎泽兰-微甘菊、藿香蓟-菊薯),这一结果与物种间的系统发育关系相符
[20]。此外,在两个物种中,细胞结构与基础代谢均占据主导地位。其中,GO注释中细胞、细胞部分和细胞过程在两个物种中占比均较高,这与药用植物多裂骆驼蓬(
Peganum multisectum)和下田菊(
Adenostemma lavenia)的研究结果相一致
[21-22],反映了植物基础生命活动的保守性。两个物种间除了表现出基因功能保守性,同样存在物种特异性。在紫茎泽兰中,其单基因数量虽少,但信号转导通路的注释却最为丰富,这一遗传特征不仅与其强大的入侵性和环境适应性相符
[10],还与另一种全球性入侵性植物-微甘菊的报道高度一致;后者同样依赖高效的信号感知与转导来协调快速生长与抗逆响应
[23]。这一共性表明,增强的环境信息处理能力可能是菊科入侵植物成功定殖与扩张的关键分子策略之一。这种遗传特征赋予了植物灵敏的环境感知能力,使其能够快速识别并响应光照、水分及土壤养分变化,从而通过分子信号反馈调节,实现比本土植物更高效的资源利用和抗逆响应
[23]。而紫茎泽兰在信号传递机制上的基因占比相对更高,或是其能够跨越广泛地理区域传播的主要原因之一。与之相比,藿香蓟注释深度较高,且在MF中表现出显著的催化活性基因富集。这一遗传特征预示着藿香蓟拥有驱动复杂生化反应的强大潜能,为其合成种类丰富的次生代谢产物奠定了基础
[24]。因此,藿香蓟中显著富集的催化活性,可能是其能够积累多种药用活性成分(如黄酮类、萜类化合物)的关键分子驱动力。
研究表明,紫茎泽兰和藿香蓟的叶片富含多种次生代谢产物,目前已成功分离鉴定出百余种单体化合物,主要涵盖萜类、黄酮类、植物甾醇、苯丙素类及挥发性物质
[25-26]。萜类与黄酮类作为其中最具代表性的两类成分,是许多药用植物的特征活性物质
[27]。尤为重要的是,萜类化合物的种类最为丰富,其核心活性成分-倍半萜与三萜,在植物的防御机制及药用功能方面发挥着关键作用
[28-29]。本研究KEGG代谢通路富集结果分析显示,紫茎泽兰和藿香蓟中与倍半萜和三萜合成相关的单基因数量较多。黄酮类化合物具有抗炎、抗氧化和抗癌多种生物活性,同时也是植物重要的保护剂,能够抵御生物胁迫(如食草动物啃食和病原体侵害)和非生物胁迫(如霜冻,干旱和紫外线伤害)
[30]。在类黄酮代谢方面,本研究发现藿香蓟在类黄酮合成通路(ko00941)中注释到的基因数量(58个)多于紫茎泽兰(45个)。这一遗传特征与其催化活性基因丰度相契合,为藿香蓟高效转化类黄酮等次生代谢中间产物提供了有力的遗传支撑。类黄酮作为发挥抗炎作用的核心活性物质,其基因表达优势从分子层面支撑了藿香蓟在传统医药中治疗咽喉炎症、缓解骨关节炎等临床表型,体现了从基因到表型的一致性。在萜类代谢与入侵机制方面,两物种在倍半萜和三萜合成通路中均表现出较高的丰富度。而这两类物质均是关键的化感物质,该分子基础暗示两物种可能通过相似的代谢路径合成化感化学成分,通过抑制周围植物生长实现其在入侵地的定殖优势
[28-29]。特别是紫茎泽兰中特定倍半萜相关基因的富集,为其核心活性成分及特有毒性成分的生物合成解析提供了关键的遗传线索。
EST-SSR分布结果统计显示,紫茎泽兰平均分布距离(1/9.91 kb)高于藿香蓟(1/10.67 kb),而这两者均显著高于菊科植物冷蒿(
Artemisia frigida)(1/18.46 kb)
[31],但低于黄缨菊(
Xanthopappus subacaulis)(1/7.35 kb)
[32],这种差异可能与多种因素相关,包括物种选择的不同、转录组数据的采集时期和组织来源的差异、序列长度的变化及SSR搜索参数的不一致性。此外,两者均以三核苷酸重复为主导,这与下田菊、冷蒿和黄缨菊的研究结果相一致
[22,31-32]。在多态性方面,相较于藿香蓟而言,紫茎泽兰表现出较高的水平,这可能与其强大的生境适应能力及遗传多样性储备有关,对其入侵机制的溯源研究具有重要意义。此外,本研究为紫茎泽兰和藿香蓟开发的EST-SSR标记不仅是评估不同地理种群遗传结构和探讨其入侵扩散路径的重要工具,更是解析其在不同生态型演化过程中适应性进化动态的关键分子标记。同时,该引物集也为两种植物药用种质的分子鉴定与辅助选育奠定了技术基础。
4 结 论
1)功能注释揭示了基因型与表型的逻辑关联:两物种在细胞结构与代谢上高度保守,但紫茎泽兰在信号转导方面更为突出,可能与其强入侵性相关;藿香蓟则在催化活性和次生代谢注释深度上更具优势,从分子水平印证了其在抗炎药效上的临床表型优势。
2)次生代谢通路解析了入侵与药用的遗传基础:KEGG分析证实两物种均拥有丰富的萜类(倍半萜、三萜)和黄酮类生物合成相关基因。这不仅揭示了两物种具有入侵特性的分子背景,也为其核心活性成分及药用价值的深度挖掘提供了关键的数据基础。
3)EST-SSR分布具有物种特异性:紫茎泽兰的SSR分布频率和多态性潜力均高于藿香蓟,这与其强大的生境适应能力密切相关。开发的EST-SSR分子标记为后续开展种群遗传结构分析与入侵溯源提供了重要的分子标记资源。
本研究通过分析转录组测序数据,解析了两物种的生物学功能内涵,揭示了菊科两种植物在代谢通路的保守性与SSR标记的特异性。这不仅为其入侵机制研究提供了新视角,也为后续其药用功能基因的挖掘提供了重要的数据支撑。未来可结合代谢组学验证关键化合物合成通路,并利用SSR标记开展群体遗传学研究,推动入侵物种生态适应策略分析及其药用资源价值的挖掘。