1 真核细胞内的液-液相分离
真核细胞的内容物主要以液态形式存在,但内部具有调节功能的生物大分子并不是均匀分布的,它们会在发挥作用的区域聚集,从而高效调节特异的生物学过程。亚细胞区室的形成有多种方式,包括经典的由生物脂膜包围封闭形成的有膜细胞器,例如内质网、高尔基体、线粒体和叶绿体等。此外,细胞内还存在着一类无膜细胞器(membrane-less organelle),如细胞质中的P-body、应激颗粒,细胞核中的核仁、PML body,以及核孔复合体、植物细胞特有的光小体(photobody)
[1-2]。这些大小不同的分隔结构能够维持细胞内各种生化反应在特定的时间和空间内发生,并精密地调控细胞的各种活性。
在细胞中,无膜细胞器是由蛋白质和核酸等生物分子组成的微米级凝聚体,也被称为“生物分子凝聚体”。由于这些生物大分子均处于可溶性液态,因此无膜区室的形成是一种液-液相分离(liquid-liquid phase separation,LLPS)现象。与传统脂膜包被的细胞器相比,无膜细胞器的动态特性使细胞具有更好的物质交换和响应外界刺激的能力。在细胞内,相分离形成的凝聚体包括以下基本功能:快速感知环境变化,储存大分子,提高局部浓度以加速催化反应,制造隔离屏障,影响生物大分子亚细胞定位,建立和稳定胞内形态结构,以及形成分子通道装置等
[3]。
近年来,对通过相分离机制形成生物分子凝聚物的组成和生物学功能的探索已成为一个新兴的研究领域,尤其是在哺乳动物细胞和酵母中,这一机制被用于阐释多种细胞功能调节的过程。然而,由于植物较长的生长周期和一些技术限制,关于相分离生物分子凝聚物的研究仍然处于初期,因此,还有很多需要探索和挖掘的内容。本文介绍了液-液相分离的形成机制、预测方法和研究手段,综述了现有的通过相分离机制调控植物细胞基因表达的报道。
1.1 液-液相分离形成机制
以往研究
[1]表明,多价相互作用在生物大分子之间形成相分离凝聚体中发挥着关键的驱动作用。其中,多价蛋白质在相分离中的作用最为关键,也是众多研究的主要目标。参与相分离的多价蛋白质主要包含多个串联结构域、低复杂性结构域(LCD)、内在无序区(IDR)、朊病毒样结构域(PrLD)或RNA结合结构域。重复出现的这类结构域决定了一种蛋白质发生相分离的可能性。这些区域的氨基酸残基通过分子内和分子间的静电吸引、阳离子-π、偶极-偶极、π-π堆积、氢键及其他多价的弱相互作用,形成凝聚体的核心并促进凝聚体增长。除此之外,蛋白质氨基酸的性质及相关的翻译后修饰都会决定或影响相分离凝聚体的形成。
在形成相分离凝聚体的特征序列中,IDR的一级序列复杂性低,富含甘氨酸、谷氨酰胺、脯氨酸、丝氨酸、酪氨酸等极性或带电氨基酸,易于提供分子间或分子内多价的弱相互作用,不易折叠成一个固定的三维结构,具有驱动蛋白质相分离的能力。因此,IDR的存在与否可以用来预测蛋白质相分离能力。在研究一种蛋白质相分离时,往往以寻找IDR作为开始。例如,融合蛋白(FUS)的朊病毒样结构域存在富含SYGQ的区域,能够促进FUS以相分离形式与RNA聚合酶II的C-末端结合,促进转录发生,而这一区域的突变与肌萎缩性侧索硬化症相关。在拟南芥(Arabidopsis thaliana)的蛋白质组中,大约30%蛋白质中预测的IDR区域占蛋白总长的50%以上,而且,这些富含IDR的蛋白质与植物的环境应激反应有高度相关性,预示着蛋白质相分离凝聚体的形成可能影响了植物逆境反应的调节作用。
1.2 蛋白质液-液相分离的预测方法
目前,研究目标蛋白质是否通过相分离机制来发挥功能,首先要对该蛋白质相分离能力进行预测。这需要根据该蛋白质以往的功能研究报道,分析蛋白质分子的整体及每个结构域或功能域的特征,包括IDR、PrLD、RNA和DNA结合能力,氨基酸类型,电荷分布,疏水性及可能的翻译后修饰。已有多个对蛋白质相分离潜能进行预测的网页服务器
[3],它们或对蛋白质整体性质进行综合分析,或整合已被鉴定的发生相分离蛋白质的综合性质加以比较,或依据蛋白质的氨基酸电荷分布及亲水和疏水性残基分布情况来预测,或根据蛋白质序列的无序性进行分析。2022年,Chu等
[4]创立了利用机器学习模型预测蛋白质发生相分离能力的方法,准确率达到94.7%,远高于以往的预测手段。各种预测服务器所依据的算法存在一定差异,因此需要对预测的某一特定蛋白质形成相分离能力的结果进行综合分析和比较,才能够得出更接近实际情况的结论,以便提升后续试验验证的成功率。
此外,蛋白质形成相分离的能力不完全依赖或取决于其序列中的IDR,实际情况非常复杂,例如,可能受到蛋白质所处微环境及所结合其他生物大分子的调控。在Wang等
[5]的研究中,决定转录因子YY1相分离的关键区域存在于其N-端IDR区域内11个连续的组氨酸;然而,同为转录因子MAZ的IDR区域并不影响蛋白质相分离的形成,反而是负责DNA结合的锌指结构决定了MAZ相分离能力
[6]。Shan等
[7]的研究也发现,转录因子SP1相分离也是由第3个锌指结构决定的。因此,根据蛋白质序列或结构预测相分离能力需要通过试验加以验证。
1.3 液-液相分离的研究方法
生物大分子的相分离形成受到多种因素影响和调节,包括分子浓度、环境温度、离子浓度、pH及环境压力等。因此,生物大分子的体外相分离研究需要尽可能模拟细胞内或体内的生理环境和条件。同时,体外生物大分子的相分离研究经常使用聚乙二醇、葡聚糖和Ficoll等作为分子“拥挤剂”,以模拟具有高密度生物大分子的细胞内环境。以下是一些用于鉴定蛋白质相分离的基本方法。
1.3.1 体外液滴形成测定法
将待检测蛋白质与荧光蛋白(例如绿色荧光蛋白EGFP或红色荧光蛋白mCherry)构建成融合蛋白表达载体,并在原核表达系统中纯化出重组蛋白。处于临界浓度以上且具有相分离能力的重组融合蛋白,在拥挤剂和适当的离子、pH及温度条件下,能够形成体外液滴(droplet),并随着以上环境因素的改变而呈现不同的液滴形成能力。这些相分离的液滴可以在明场光学显微镜(未与荧光蛋白融合的情况下)或者在荧光显微镜下被观察到,也可以通过分光光度计鉴定样品浑浊度的变化。在经过一些破坏分子间相互作用力试剂(例如1,6-己二醇)处理后,体外凝聚的液滴会被破坏。
1.3.2 细胞内蛋白凝聚体形成(punctum formation)试验
对于能够形成相分离的蛋白质,其内源蛋白质或外源表达的蛋白质一般会在细胞内形成凝聚体。通过免疫染色或与荧光标签融合,在荧光显微镜下可以观察到蛋白质斑点(puncta)的形成及亚细胞定位情况。并且,在经过1,6-己二醇处理后,蛋白质斑点会消失或出现弥散。
1.3.3 光漂白荧光恢复(fluorescence recovery after photobleaching,FRAP)试验
细胞内的相分离凝聚体能够高效调节某一生物学过程,因此,其内部的分子往往具有高度的动态性,以促进相关反应。FRAP试验原理是在显微镜视野下选择某一区域,采用高强度脉冲激光将该区域漂白,随着时间推移,观察凝聚体内由于分子移动使得该漂白区域逐渐恢复荧光的动力学过程。
利用高强度脉冲激光对体外相分离荧光液滴或细胞内荧光斑点的某一区域进行光漂白,并在不同时间点对荧光情况进行跟踪拍照,从而鉴定凝聚体内分子的流动性或扩散速率。在激光漂白后,体外相分离荧光液滴或细胞内荧光斑点的亮度会变得逐渐均匀或恢复。
2 液-液相分离对基因转录的调控机制
转录是基因表达中的关键环节,在生物的生长、发育及应对环境变化中发挥重要作用。在mRNA和长链非编码RNA表达过程中,转录因子招募转录辅助因子和RNA聚合酶II以形成转录起始复合体,起始RNA的合成。真核细胞中转录形式可以大致分为2种:(1)仅由转录因子结合启动子介导的基础转录;(2)由转录因子拉近增强子和启动子形成的增强子介导的转录(
图1)。这2种转录形式对靶基因启动效率及维持表达时间存在区别。
2017年,Hnisz等
[8]提出在转录因子促进增强子与启动子接近时受到相分离机制的调节。在这一调节形式中,由于很多关键的转录因子及辅助因子包含IDR,它们的多个分子可以与靶基因的启动子及远端增强子区域共同形成相分离凝聚体,在避免外界干扰的情况下,促进靶基因的持续高表达。调控基因表达的1个或少数增强子被称为基础增强子(basic enhancer)或增强子束,而共同调控1个或几个基因表达的多个连续的增强子则称为超级增强子(super-enhancer)(
图1B)。
1985年,Simpson等
[9]报道了豌豆(
Pisum sativum)中叶绿素a/b结合蛋白质
AB80基因受到类似于增强子功能序列的调节。在此之后,在拟南芥、玉米(
Zea mays)、豌豆等多种植物细胞基因组中,多个增强子调控序列被发现和鉴定
[10],但这些增强子的形成是否受到相关转录因子相分离的调控一直未被鉴定。
在哺乳动物细胞基因组中,增强子的出现经常与染色质上H3组蛋白的K27乙酰化(H3K27ac)区域相重叠,这也是判定增强子区域常用的标准
[11]。然而,Yan等
[12]研究拟南芥基因组时发现,H3K27ac修饰并不是这类植物中增强子的主要特征,而利用DNase Ⅰ的敏感区域预测增强子更为可靠。所预测的增强子区域在花发育的不同阶段具有特异性,与决定花表型的单核苷酸多态性具有显著相关性,并在十字花科(Brassicaceae)植物中具有保守性。调节开花及花发育过程的转录因子能够有针对性地富集在对应各个阶段的增强子区域内,这些增强子也与转录因子对相应区域基因表达的调控作用密切相关。Jores等
[13]观察到,植物细胞基因组中,多个增强子能够通过协同和叠加的形式促进基因表达。
对现有研究文献的检索发现,植物细胞中相分离凝聚体介导增强子形成的研究实例还未被报道。因此,植物细胞中相分离调控基因表达的主要形式可能不同于动物细胞。已有研究
[14-15]提出植物细胞内相分离调控基因表达机制:在不同发育过程中或在外界环境及压力改变的条件下,转录因子形成了相分离凝聚体或发生了凝聚体解离,从而改变了该因子与其他调节因子或靶基因染色质区域的结合,使得被调控基因的表达水平发生变化,进而影响植物发育进程或对环境的适应能力。
3 相分离机制介导的基因表达调节植物生长发育和对环境的适应
如上所述,目前已有多项研究探索了植物细胞核内增强子对基因表达的调控。尽管相关研究的数量远远不及动物细胞,但足以表明植物基因转录调控同样具有一定复杂性。同时,关于植物基因组内通过超级增强子进行基因表达调控的机制还未见报道。近年来,多项研究揭示了相分离在植物细胞基因转录调控中所发挥的作用。Zhang等
[16]通过体外试验发现了众多植物蛋白质具有相分离的潜能,其中包括参与转录调控的RNA聚合酶亚基、多个转录因子及多种参与转录调控的蛋白质。这些相分离参与的调节过程在植物个体生长、发育及适应环境变化过程中发挥了重要作用。
3.1 相分离介导的基因表达调节植物生长发育
在不同时间和季节,植物中许多重要蛋白质的表达能够受到相分离机制调节,从而使植物能够顺应环境节律改变,控制个体发育和配子形成等生理过程。例如,很多RNA结合蛋白和PrLD蛋白都具有调节植物生长发育的功能
[14-15]。
在植物生长发育过程中,多个生长素响应因子ARF转入细胞核以调控下游基因表达,细胞质和细胞核中ARF的分布情况影响不同组织对生长素的响应。在拟南芥中,转录因子ARF7和ARF19以形成细胞质内相分离凝聚体的形式削弱细胞对植物生长素的响应;而通过点突变破坏相分离能力的ARF突变体,能够快速转入细胞核,使细胞的转录产生混乱,影响植株正常的生长发育
[17]。
在拟南芥中,重要的开花抑制基因
FLOWERING LOCUS C(
FLC)可以编码MADS-box转录因子,抑制开花。而
FLC的表达受到2个PrLD蛋白SSF和DCP5的调节,SSF能够与转录激活因子结合,促进
FLC基因表达,从而延迟开花。然而,SSF可以通过形成相分离凝聚体的形式招募DCP5到
FLC启动子区域,并抑制该基因的表达,进而促进开花。在这一调节过程中,SSF和DCP5的PrLD区域及它们的相分离能力都对
FLC基因表达发挥了重要的调控作用
[18]。
为避免拟南芥在低温条件下开花,另一个MADS-box转录因子FLOWERING LOCUS M(FLM)也发挥了重要的开花抑制作用。而
FLM基因的表达受到RNA结合蛋白UBA2c的调节。UBA2c能够在体外发生相分离,在细胞内形成核凝聚体,这些性质决定了UBA2c与
FLM基因位点结合,并通过抑制该区域的H3K27三甲基化(H3K27me3)激活
FLM基因的表达
[19]。此外,转录因子FRI对
FLC基因表达的调控作用,也决定了拟南芥的春季开花情况。在相对低温的秋季,FRI形成了核内凝聚体,然后与
FLC基因的启动子脱离,以避免激活该基因
[20]。在拟南芥细胞中,调节拟南芥开花的关键RNA结合蛋白FCA受到FLL2蛋白的调节,而FCA的相分离能够与调节RNA 3´-端腺苷化的蛋白质形成共凝聚体,使得拟南芥基因组的转录产物产生多个近端位点的聚腺苷化,从而抑制其基因表达
[21]。
与动物类似,绿藻和非种子植物(如苔类、藓类和蕨类植物)的精子都具有高度动态性。为了适应这一特性,这类生物的精子核内基因组DNA由鱼精蛋白替代85%以上的组蛋白,以形成压缩的细胞核,容纳在高度动态的精子头内。这种组蛋白的替代抑制了精子核内大部分基因的转录
[22]。然而,开花植物的精子不表达鱼精蛋白,其基因组也是高度凝聚的,但整体的基因转录却很活跃。Buttress等
[23]研究发现,拟南芥精子细胞核中发生了异染色质轻度去凝聚而常染色质聚集的重构现象,H2B的变体H2B.8调节了这一过程。H2B.8仅在精子和成熟胚胎中表达,其蛋白N-末端的约90个氨基酸在经典H2B蛋白中不存在。通过相分离的方式,H2B.8能够将临近或远端的常染色质区域拉近,但并不结合在活跃转录的基因位点上,也不干扰这些基因的转录
[23]。
水稻(
Oryza sativa)转录抑制因子TRBF2能够结合数千个基因的转录起始位点,其突变可以造成很多基因的表达紊乱和水稻的多种发育缺陷。TRBF2的H1/H5功能域决定了该转录因子的相分离特性,同时也负责其结合染色质和抑制基因表达的能力。而且,TRBF2可能通过相分离机制招募多梳抑制复合物2(PRC2)以介导H3K27me3,实现对靶基因表达的抑制作用
[24]。
3.2 相分离介导的基因表达调节植物适应外界环境变化
植物是固着生长的,因此需要适应周围各种环境影响而存活,这种适应性也体现在转录水平的调控,这种调控也包括了相分离机制的参与。番茄(
Solanum lycopersicum)转录因子TMF通过依赖过氧化氢的方式发生相分离,使得顶端分生组织的细胞能够感应发育过程中局部过氧化物累积,过氧化物刺激的TMF相分离增强了其与下游基因的结合能力,在结合到
F-
box基因AN启动子区域时,抑制该基因表达,避免花的早熟
[25]。与此相似的是,多个ALOG家族的转录因子也通过形成转录凝聚体调控花的特征基因
ANANTHA表达,控制番茄的开花过渡期
[26]。
在缺乏氮源的条件下生长的拟南芥细胞中,转录辅助因子MED19a能够通过形成相分离凝聚体的形式招募ORE1,以促进衰老响应基因的表达
[27]。植物的鸟苷酸结合蛋白类似物GBPLs能够通过形成防御激活的生物分子凝聚体(GDAC)参与植物的免疫调节。核内的GDAC可以招募特异的转录激活因子和RNA聚合酶Ⅱ,促进防御基因转录,抵御病毒侵染
[28]。此外,在环境温度升高时,GDAC的形成数量会减少,下游基因表达受到抑制。因此,在高温环境下,植物的免疫防御系统会遭受破坏
[29]。在拟南芥中,高渗胁迫条件下产生的胞内分子拥挤增加使得转录辅助抑制因子SEUSS发生相分离,进而调控渗透应激相关基因的表达和植株的抗逆生长能力
[30]。Jung等
[31]发现,转录抑制因子ELF3通过其相分离控制拟南芥对温度变化的敏感性。ELF3是调节植物昼夜节律的晚转录抑制复合体(evening complex)的1个组分,在温度升至27 ℃时,ELF3序列中的PrLD区域促进发生相分离,在拟南芥细胞内形成凝聚体,失去对下游基因的抑制作用;在温度降至22 ℃时,ELF3不发生相分离,晚转录抑制复合体恢复功能。这种调节机制帮助拟南芥感应环境温度变化,调节开花时间。
4 植物细胞中相分离机制研究展望
相比于哺乳动物细胞中相分离机制的研究进展,对植物细胞中蛋白质等大分子相分离机制的研究仍然较少。目前,人们对植物细胞通过相分离来调控基因表达的认识还停留在初级阶段,同时,关于植物细胞核内是否形成刺激基因表达的超级增强子也存在争议。目前,生物大分子相分离调节植物细胞基因表达机制研究主要包括以下方向。
4.1 鉴定通过相分离调控基因表达的关键转录因子并解析其调控机制
植物细胞内转录调节机制与哺乳动物细胞有很多相似性,因此,一些在动物细胞中相分离调节机制的新发现,也为植物细胞基因表达的研究提供借鉴。然而,植物细胞中基因表达和功能具有许多独有特征。例如,植物的不可动性决定了它们不能通过移动以回避外界刺激,只能通过基因表达的改变来调节细胞状态以适应环境。拟南芥和玉米细胞各自包含了2 296和2 408个转录因子,其中很多成员具有功能和序列上的同源性,但大部分转录因子都含有IDR序列,预示着具有发生相分离的潜能
[32-33]。因此,筛选重要的转录调控因子,并解析它们在植物的不同发育阶段及环境胁迫下通过相分离调控下游基因表达的分子机制,依然有很多值得挖掘的研究内容。
4.2 认识不同植物中相分离调节的差异性并探究相关机制在农业生产中的应用
目前的研究大多还局限于对拟南芥、玉米 等模式植物的研究,鉴于植物的多样性,以及不同类型植物基因组和性状的差异性,对于已发现的调节机制在不同植物细胞中的普适性有待确 认。因此,探究在模式植物中鉴定的一些重要相分离调节机制是否适用于非模式植物基因组的 同时,还应该将这类研究扩展到农业作物品种上,以便在基因表达水平探究作物抗逆生长的原理,通过调节相关蛋白质的相分离来促进经济作物生长。