0 引 言
黄精,百合科(Liliaceae)黄精属(
Polygonatum),作为中国传统药食同源珍稀植物资源,其药理价值与开发利用日益受到学界关注
[1]。传统中医药学理论认为该属植物具有补气养阴、健脾润肺、益肾填精之功效;而现代药理学研究进一步揭示了其具有多靶点生物活性。以多花黄精(
P. cyrtonema)为例,其具有显著降血糖、免疫调节、抗疲劳、抗肿瘤及广谱抗菌抗病毒等功效
[2]。近年来,随着公众健康意识的显著增强及大健康产业快速发展,黄精市场需求呈现指数级增长。然而,野生资源因过度采挖已濒临枯竭,人工栽培已逐步成为市场供给主体(栽培区域已覆盖中国21个省份,种植面积较十年前增长380%),但其规范化生产体系仍存在关键科学问题亟待解决:①药用活性成分(如多糖、皂苷、黄酮等次生代谢产物)的时空积累规律尚未明确;②最佳药用采收期缺乏客观量化标准;③食用安全性与加工适性评价体系尚未建立。上述问题严重制约了黄精产业的可持续发展,亟待从次生代谢产物积累规律、采收期科学判定及多组学调控机制等方面开展系统研究
[3]。
表观遗传学作为重要的基因表达调控机制,通过非DNA序列改变介导可遗传的表型变化。其核心在于动态甲基化等化学修饰介导的基因表达模式跨代遗传性改变,这一调控机制能在维持基因组稳定性的前提下实现生物性状的适应性调整
[4]。组蛋白共价修饰是染色质结构调控层面的关键调控方式,通过甲基化/去甲基化平衡、乙酰化及磷酸化等修饰方式动态调控染色质结构,进而精确调控基因转录活性。真核生物中已鉴定的组蛋白修饰类型超过20种,除甲基化与乙酰化等经典修饰外,还包括泛素化修饰及近年发现的ADP-核糖基化等新型修饰,这些修饰通过协同作用形成动态调控网络
[5]。组蛋白修饰方式多样化在多细胞真核生物基因表达的表观遗传调控中起着重要作用
[6]。组蛋白甲基化受组蛋白甲基转移酶和去甲基化酶的动态调控,其修饰位点主要集中于组蛋白的精氨酸(R)和赖氨酸(K)残基
[7]。近年来对组蛋白修饰的研究已逐渐成为表观遗传学关注的重点。组蛋白甲基化修饰通过动态调控核小体间相互作用介导染色质结构重塑,该修饰通过改变核小体三维拓扑结构,精确协调DNA复制、修复及转录激活等分子事件
[8⁃10]。组蛋白甲基化修饰分子效应延伸至表观遗传调控网络,通过定向修饰特定组蛋白残基(如H3K4me3/H3K27me3)建立基因表达模式,从而调控细胞增殖分化进程并整合胞内信号转导网络
[11]。在植物表观遗传调控中,组蛋白H3和H4的赖氨酸(K)及精氨酸(R)残基的甲基化修饰呈现高度特异性和多样性。H3亚基的K4、K9、K27、K36、K79位点以及H4K20位点构成赖氨酸甲基化的主要靶标,而H3R2、R8、R17、R26和H4R3则是精氨酸甲基化的主要作用位点
[12]。甲基化程度呈现显著差异:赖氨酸残基可实现单甲基化(me1)、双甲基化(me2)和三甲基化(me3),而精氨酸残基仅能形成单甲基化或双甲基化修饰。值得注意的是,精氨酸甲基化表现为动态可逆的修饰过程,其甲基转移酶(PRMTs)与去甲基化酶(如JMJD6)共同维持修饰平衡;相比之下,赖氨酸去甲基化酶(如JmjC家族)效率低,且部分高阶修饰(如H3K4me3)需依赖组蛋白替换而非直接去甲基化,导致修饰更持久
[13]。组蛋白甲基化转移酶属于具有特定结构域的蛋白家族,具有多种不同的识别位点
[14]。例如,动物和植物中的组蛋白赖氨酸甲基化转移酶通常都含有SET结构域(Su(var)3-9,E(z),Trithorax),但动物中还会含有Dot1结构域,组蛋白赖氨酸甲基化转移酶能够催化赖氨酸H3和H4甲基化为单甲基化、二甲基化和三甲基化
[15]。
在组蛋白甲基转移酶(HMTs)的功能研究中,Su(var)3–9 homologs(SUVH)家族作为含有SET结构域蛋白的重要分支,现有研究已逐步揭示其在表观遗传调控中的关键作用。SUVH家族广泛存在于真核生物中,植物特有的SUVH亚家族通过其SRA(SET and RING-associated)结构域识别甲基化修饰的DNA实现SUVH亚家族蛋白的招募,被招募的SUVH蛋白利用其SET结构域催化组蛋白H3K9位点的甲基化,形成H3K9me2修饰,从而介导基因沉默和异染色质稳定性维持
[16⁃17]。研究人员发现,拟南芥SUVH家族成员(如SUVH4/5/6)在DNA甲基化与组蛋白修饰的互作中发挥桥梁作用:SUVH4偏好结合CAG/CTG甲基化位点,而SUVH5倾向CCG甲基化,这种序列特异性介导的组蛋白修饰可能通过调控靶基因所在区域的染色质影响靶基因的表达从而影响次生代谢通路。此外,SUVH6还具有自抑制调控机制,在SUVH6的结构生物学研究中发现,其肽底物结合通道受到自身的自抑制调控,为理解HMTs的精细调控提供了结构生物学证据
[18]。另有研究表明,组蛋白甲基化也能够通过调控基因表达水平调节器官的发育、种子的萌发以及植物对逆境的耐受性等多个生物学过程
[19]。作为表观遗传调控的重要表征,组蛋白修饰对功能的影响呈现明显的位点特异性:H3K9乙酰化与H3K4甲基化(H3K4me)作为转录激活标记,而H3K9/H3K27位点的多甲基化修饰则与基因沉默相关。其中H3K9me3通过稳定异染色质结构抑制转录,H3K9me2则介导常染色质区的可逆性沉默
[20]。在作物抗逆机制研究中,通过基因组学筛选鉴定到
TaHMT21、
TaHMT24和
TaHMT42等甲基转移酶基因的表达在干旱胁迫下被显著诱导,揭示了其在杂交小麦抗旱分子育种中的价值
[21]。此外,H3K27me3在植物发育时序调控中发挥关键作用,特别是通过光周期、春化等途径调控
FLC的表达,进而影响
FLY和
AP1等成花基因的转录
[22]。SDG26是拟南芥中的组蛋白甲基转移酶,SDG26功能缺失可提升拟南芥抗旱性
[23],而茶树中过表达CsSDG36/43通过激活氮吸收相关NRT2家族基因,从而间接提升低氮胁迫下的氮同化效率
[24]。
截至目前,对黄精的研究还不够深入,对于黄精组蛋白甲基化相关基因家族鲜有研究报道。尽管目前黄精属植物中SUVH家族的直接研究尚未见报道,但基于模式植物的功能推测,SUVH可能参与黄精次生代谢产物合成的调控。例如,在药用植物中,H3K9me2修饰常与次生代谢基因簇的沉默相关,而SUVH介导的甲基化可能通过抑制转座子活性以维持基因组的稳定性
[25]。本研究利用生物信息学方法以湖北黄精(
Polygonatum zanlanscianense Pamp
.)二代转录组和全长三代转录组为数据支撑,对湖北黄精组蛋白甲基化酶基因家族进行鉴定和分析。期望通过对湖北黄精组蛋白甲基化酶的深入挖掘进一步加深对黄精耐逆性形成及具有药用价值次生代谢产物合成机制的理解,对品种选育和抗逆性形成的机理研究都具有重要意义,也期望能够借此研究为其他中草药的研究积累经验和方法。
1 材料与方法
1.1 数据来源及软件工具
本课题以湖北黄精二代转录组和全长三代转录组数据(实验室未发表数据)为支撑;拟南芥基因组数据下载自植物基因组数据库Phytozome V13.0(
https://phytozome-next.jgj.doe.gov)、在线motif鉴定工具(
https://meme-suite.org/meme/),MEGA(v7.0.26)
[26]用于绘制基因进化树,TBtools(v1.098685)
[27]用于数据提取及格式转换,TMHMM软件用于蛋白质跨膜结构的分析预测(
https://services.healthtech.dtu.dk/services/TMHMM-2.0/),在线工具PSORT用于亚细胞定位分析(
http://psort1.hgc.jp/form.html)。
1.2 实验方法
1.2.1 湖北黄精组蛋白甲基化转移酶基因家族鉴定
本研究以湖北黄精三代全长转录组数据为基础,从Pfam库中下载序号为PF00856组蛋白甲基化酶的隐马尔科夫模型,然后再从Phytozome V13.0库中下载拟南芥组蛋白甲基化转移酶基因家族的蛋白序列文件。使用组蛋白甲基化酶的隐马尔可夫模型PF00856为模板构建库,利用HMMER(v3.3.1)程序将湖北黄精蛋白质序列信息与Pfam模板进行对比,筛选出湖北黄精转录组中含有组蛋白甲基化转移酶结构的候选组蛋白甲基化转移酶基因家族成员基因ID及序列。
将HMMER生成的基于隐马尔科夫模型鉴定结果与BLAST比对结果进行交叉验证,确保组蛋白甲基化转移酶基因识别的准确性。首先,使用HMMER软件中的hmmsearch工具以PF00856为模板对三代转录组注释的蛋白序列进行鉴定得到基于隐马尔科夫模型的候选基因;使用BLAST工具以拟南芥组蛋白甲基化转移酶基因家族蛋白序列为目标对湖北黄精的三代转录组注释蛋白序列文件进行搜索得到基于BLAST的候选基因。随后,将BLAST结果与hmmsearch的结果进行交叉验证,取两种工具共同鉴定到的蛋白序列作为最终确定湖北黄精的组蛋白甲基化转移酶基因家族蛋白。这种方法有效结合了两种不同的鉴定工具,能够提高基因家族鉴定的准确性和全面性,确保所识别的基因ID更具代表性。
1.2.2 湖北黄精组蛋白甲基化基因家族蛋白序列提取
使用TBtools的Fasta Extract功能,从湖北黄精的转录组序列中提取到组蛋白甲基化转移酶基因家族的蛋白序列。具体步骤如下:将湖北黄精的蛋白质文件导入比对文件中,并以湖北黄精组蛋白甲基转移酶的基因ID作为比对目标。利用Fasta Header Pattern Match功能进行搜索,提取出湖北黄精组蛋白甲基化转移酶家族的蛋白序列。以相同的方法,从拟南芥的蛋白质序列文件中提取出对应的蛋白序列。
1.2.3 组蛋白甲基化基因家族成员进化分析
将提取出来的湖北黄精组蛋白甲基化蛋白文件与拟南芥组蛋白甲基化转移酶蛋白文件进行合并,使用MEGA (v7.0.26)软件中的Clustal W对蛋白文件中的序列进行多序列比对,根据多序列比对结果,使用Trimal对结果进行剪枝去除保守性极低的比对序列,将比对的结果使用MEGA进行进化分析并生成进化树,调整参数,利用枚举法进行检测,节点鲁棒性设置为1 000个重复,将遗传距离选择为poisson correction。
1.2.4 湖北黄精SUVH家族蛋白跨膜结构及亚细胞定位分析
使用TMHMM在线工具对湖北黄精SUVH基因家族的氨基序列进行分析,找到含有跨膜结构的基因ID并进行分析。使用PSORT prediction在线工具对湖北黄精SUVH基因家族蛋白进行亚细胞定位预测。
1.2.5 湖北黄精SUVH基因家族蛋白motif分析
使用TBtools提取湖北黄精SUVH基因家族蛋白序列,使用MEME在线工具对SUVH基因家族蛋白序列进行motif鉴定,设置motif值为40,得到湖北黄精SUVH基因家族蛋白motif分布模式。
2 结果与分析
2.1 家族成员鉴定
本研究通过HMMER和BLAST两种工具同时对湖北黄精组蛋白甲基化酶进行鉴定,并对HMMER生成的基于隐马尔科夫模型PF00856鉴定结果与BLAST比对结果进行交叉验证,在Pfam库中进行验证后得到湖北黄精的组蛋白甲基化转移酶家族基因。根据文献已报道的47个拟南芥组蛋白甲基化转移酶,本研究中共鉴定出95个湖北黄精组蛋白甲基化转移酶蛋白,综合催化结构域的系统发育分析、功能结构域的特征、底物特异性及进化保守性等多维度原则,95个湖北黄精组蛋白甲基化基因被分为5大类,包括I(SUVH家族)、Ⅱ(Trx家族)、Ⅲ(SMYD家族)、Ⅳ(Ez)以及V(SETD家族)。本研究对湖北黄精组蛋白甲基化基因家族的SUVH亚家族成员进行进一步的生物信息学分析,其基因信息见
表1。其蛋白序列长度多样性丰富,最长的transcript/857.p1转录本能够编码1 268个氨基酸,最短的transcript/35100.p1转录本只能编码161个氨基酸。分子量最大的有142.958 kDa,分子量最小的只有18 kDa,等电点最高的为9.10,最低的为4.77。
2.2 基因进化分析
本研究对湖北黄精和拟南芥两种植物的组蛋白甲基化基因家族的蛋白进行进化分析,并构建完整的进化树(
图1)。该环形进化树清晰呈现了湖北黄精(transcript前缀序列,如transcript/626.p1、transcript7071.p1等)与拟南芥(AT前缀序列,如AT3G04380.1、AT5G43990.2等)组蛋白甲基化基因家族的蛋白进化关系,在拓扑结构与节点支持率方面,进化树以中心放射状向外延伸,分支连接点标注的100/97/90等数值代表基于1000次重复枚举法检测的节点支持率(即Bootstrap值)。高支持率分支(如100、97)集中于主干区域,反映核心进化路径具有高度可靠性;部分次级分支支持率较低(如90),表明其拓扑结构可能存在一定变异。在基因序列分布与亲缘关系方面,湖北黄精序列(如transcript/13382.p1、transcript/12601.p1)多分布于独立分支,与拟南芥序列(如AT2G24740.1、AT1G17770.1)形成显著分化,表明两者在进化历程中经历了显著的功能或结构歧化。部分拟南芥序列聚集成簇(如AT3G04380.1与AT5G43990.2位于相邻分支),提示其蛋白功能保守性较高;而湖北黄精序列分散性较强,可能反映物种特异性。
根据湖北黄精与拟南芥SUV类蛋白的进化关系,参考已有研究
[28]将蛋白划分为5个组别,GroupI包含:AT1G73100.1(AtSUVH3)、AT5G04940.1(AtSUVH1)、AT1G17770.1(AtSUVH7)等5个拟南芥SUVH蛋白,以及transcript/591.p1、transcript/3782.p1、transcript/14413.p1等14个湖北黄精SUVH转录本;GroupⅡ包含2个拟南芥SUVH蛋白:AT2G33290.1(AtSUVH2)、AT4G13460.1(AtSUVH9)以及transcript/15741.p1、transcript/15844.p1、transcript/19303.p1等8个湖北黄精SUVH转录本。两组蛋白均参与异染色质沉默,其中GroupI占据主导作用,GroupⅡ行使次要功能。Group Ⅲ由拟南芥SUVH蛋白AT5G13960.1(AtSUVH4)与湖北黄精SUVH转录本transcript/14888.p1组成;Group Ⅳ包含2个拟南芥SUVH蛋白:AT2G22740.2(AtSUVH6)、AT2G35160.1(AtSUVH5)以及transcript/2854.p1、transcript/6639.p1、transcript/2706.p1等6个湖北黄精SUVH转录本。GroupⅢ和Group Ⅳ两组蛋白主要行使二甲基转移酶功能。GroupV包含3个拟南芥SUVH蛋白:AT3G04380.1(AtSUVH4)、AT5G43990.2(AtSUVH2)、AT1G04050.1(AtSUVH1)以及transcript/2854.p1、transcript/6639.p1、transcript/2706.p1等6个湖北黄精SUVH转录本,但这组蛋白功能暂不明确。
2.3 跨膜结构分析
TMHMM在线工具对湖北黄精39个SUVH基因家族蛋白序列的分析结果显示,仅有一个转录本(transcript/6593.p1)所编码的蛋白包含跨膜结构域。该转录本共编码了837个氨基酸,其中第1至812位氨基酸位于膜外,第813至835位的肽段形成跨膜螺旋,而第836至837位氨基酸则位于膜内,见
图2。
2.4 亚细胞定位分析
通过PSORT prediction在线工具对湖北黄精SUVH基因家族蛋白进行亚细胞定位预测,该家族蛋白主要分布于细胞核、细胞质和线粒体3类细胞器中,其中细胞核定位优势显著(
表2)。在34个蛋白中,26个蛋白(占比76.47%)在细胞核的预测分值超过0.50,表明其具有明确的核定位倾向。transcript/857.pl和transcript/626.pl表现出完全的核定位特征(分值均为1.00),表明这些基因可能参与核内特异性调控过程。另有transcript/15844.pl等基因呈现多细胞器泛定位特征,其核定位分值为0.26、细胞质0.44、线粒体0.30,显示出潜在的功能多样性。细胞质定位的典型代表为transcript/15741.pl(0.74)和transcript/14956.pl(0.74),而具有显著的线粒体定位特征的是transcript/21193.pl(0.52)和transcript/1834.pl(0.57)。部分基因在不同细胞器间的分值分布呈现平衡特征,如transcript/18245.p3在细胞核、细胞质、线粒体的分值分别为0.35、0.35、0.26,未显示出明显的细胞器定位趋势。该分析为确定湖北黄精
SUVH基因家族存在的亚细胞位置提供了参考依据。
2.5 motif鉴定与分析
本研究通过MEME在线工具对湖北黄精
SUVH基因家族进行motif鉴定,得到SUVH基因家族编码氨基酸序列所具有的motif。结果显示,该基因家族编码的氨基酸序列中,保守结构域的空间分布与其系统发育关系存在显著相关性。亲缘关系邻近的转录本(如transcript2238.p1与transcript1950.p1)显示出高度一致的保守结构域组成(通过相同颜色标记的Motif分布模式体现),其motif类型、数量及相对排列顺序均保持稳定(横轴位置0~1 400范围内的彩色矩形块连续分布)。具有相同保守结构域组合的转录本可能编码同一蛋白质亚基,这种现象反映在纵轴相邻转录本间motif图谱的重复性(如Motif 32和Motif 35的多转录本重复出现模式)。多数转录本(如transcript2238.p1、transcript1950.p1等)在3'端(横轴右侧约1 200~1 400)均以Motif 1和Motif 18作为保守终止元件,形成特征性双motif结尾结构,见
图3。
综上所述,亲缘关系越近的基因其序列越保守,所含有的结构域几乎没有差异,他们可能编码同一个蛋白质亚基,也暗示了其功能可能存在冗余。另外不同蛋白中的motif的顺序不完全一致,但大多数以motif 1和motif 18作为3'端的结尾。
3 讨 论
3.1 SUVH家族的功能进化与表观遗传调控作用
SUVH家族作为组蛋白甲基转移酶的重要分支,其成员通过SET结构域催化组蛋白H3K9位点的甲基化(H3K9me2),进而介导基因沉默和染色质稳定性的维持
[25]。本研究中系统发育分析显示,湖北黄精
SUVH基因与拟南芥同源基因分化显著(
图1),提示其在进化中可能经历了功能特异性适应。例如,湖北黄精transcript/13382.p1等基因分布于独立进化分支,可能与次生代谢产物调控相关,而拟南芥SUVH4/5/6则偏好结合特定甲基化位点以维持基因组稳定性
[29]。值得注意的是,湖北黄精SUVH基因的分散性进化模式可能反映了物种对复杂生境的适应性策略,这一现象与ASH1L等大分子量甲基转移酶在哺乳动物中的功能歧化相似
[30]。
3.2 SUVH家族在植物逆境响应中的潜在作用
跨膜结构分析显示,仅transcript/6593.p1具有跨膜螺旋(
图2),提示其可能参与膜结合信号转导。这与拟南芥SUVH6的自抑制调控机制形成对比,后者通过构象变化调节酶活性
[31]。此外,亚细胞定位预测表明76.47%的SUVH基因定位于细胞核(
表2),与组蛋白修饰的核心功能一致。其中,transcript/857.p1和626.p1的完全核定位特征(分值1.00)暗示其在染色质重塑中的关键作用,类似于拟南芥SDG26通过H3K27me3调控发育时序的机制
[32]。在逆境响应方面,本研究检测到transcript/21193.p1(线粒体定位)和transcript/18245.p3(多细胞器动态分布)可能参与能量代谢与胁迫信号整合,这一发现与茶树CsSDG36/43通过氮同化增强抗逆性的机制存在功能相似性
[33]。
3.3 次生代谢调控与药用价值关联
Motif分析揭示了
SUVH基因的保守结构域组合特征(
图3),尤其是3'端Motif1和Motif18的终止元件模式,可能与底物识别特异性相关。例如,transcript/2238.p1与1950.p1具有相同的motif分布模式,表明二者可能参与协同调控特定次生代谢基因簇。已有研究表明,H3K9me2修饰常与药用植物(如多花黄精)次生代谢基因沉默相关
[34],而SUVH介导的甲基化可能通过抑制转座子活性维持基因组稳定性
[35]。本研究中鉴定到多个具有细胞质定位的SUVH基因(如transcript/15741.p1),其功能可能涉及非组蛋白底物的甲基化修饰,这一现象在ASH1L的C端结构域功能研究中也有类似报道
[30]。
4 结 论
本研究共鉴定到95个湖北黄精组蛋白甲基化转移酶SET结构域基因,进化分析显示其可分为SUVH、Trx、SMYD、Ez和SETD 5个大类。湖北黄精SUVH基因亚家族中共鉴定出39个基因,这些基因编码的氨基酸残基的数量在161 aa~1 268 aa,等电点在4.77 PI~9.10 PI,分子量大小在18 kDa~142 kDa,其中编码酸性蛋白质的基因有20个,编码碱性蛋白质的基因有19个。在跨膜蛋白预测的结果中,该基因家族中只有transcript/6593.p1所编码的蛋白具有一个跨膜结构域,该基因共编码837位氨基酸,其中第1至812位氨基酸位于膜外,第813至835位氨基酸位于跨膜螺旋。
基因进化树的结果显示,湖北黄精SUVH基因家族与拟南芥SUVH基因家族具有较高的同源性,两者皆为双子叶植物,在进化上亲缘关系较近,但在湖北黄精的SUVH家族中的基因数目比拟南芥多,这可能与湖北黄精生长的过程中,除了合成自身需要的物质之外,还需要合成一些特有的次生代谢产物,因此组蛋白甲基化调控的过程可能较拟南芥更为复杂。