0 引 言
基因组维持其功能的调控是生物体最基本的过程之一。基因组功能的调控并非简单地由其序列决定。基因组的三维空间组织对基因表达调控的机制是大家关注的热点话题之一。染色质构象捕获 (chromosome conformation capture)等技术提供了新的深入研究基因组三维空间组织的思路。此外,显微镜观察是提供细胞形态、分子结构和定位等信息的经典方法。如荧光原位杂交(fluorescence
in situ hybridization,FISH)技术可对固定的细胞中的DNA和RNA进行序列特异性的可视化,已广泛应用于染色质结构的研究,但其局限于固定标本的研究。因此很多基于活细胞的成像方法应运而生。其中,基于簇状规则间隔的短回文重复(clustered regularly interspaced short palindromic repeats,CRISPR)成像系统是一种新开发的系统,能够对单个基因组位点进行活细胞成像。因其具备操作简便、特异性高等的优势,基于CRISPR的成像技术已成功应用于基因重组、转录、DNA修复等过程的监视
[1]、着丝粒和端粒的实时追踪
[2]、内源基因在核中的定位
[3]、染色质空间组织
[4]等方面。本文依据已有的相关报道,比较几种典型的成像技术的特点,总结CRISPR成像的原理、发展以及成像效率的影响因素。
1 CRISPR成像
1.1 CRISPR成像基本原理
Ⅱ型CRISPR系统使用Cas9蛋白识别DNA序列,目标序列的特异性由sgRNA和原型间隔区相邻基序(protospacer adjacent motif, PAM)决定
[5,6]。与目标DNA结合后,Cas9⁃sgRNA复合物会产生DNA双链断裂。CRISPR可广泛用于生物体的基因组编辑
[7]。Cas9的催化结构域包括RuvC1(D10A)和HNH (H840A),通过突变这两个活性中心,可以形成核酸酶失活的Cas9(dead Cas9,dCas9),但其仍保留与sgRNA相互作用并靶向目标DNA的能力
[8,9]。dCas9的结合能力的保留可用于成像活细胞中特定的内源性DNA序列(如
图1)。通过将荧光标记的dCas9和与靶序列互补配对的sgRNA递送至细胞内,即可实现对靶序列的定位和动态研究。
1.2 CRISPR成像优势
相比于FISH、锌指蛋白(zinc finger proteins,ZFP)、转录激活因子效应物(transcription activator⁃like effectors,TALEs)等的成像方式(原理如
图2),CRISPR系统具有明显的优势。
FISH作用范围十分广泛,但是也存在一定的局限性。首先,固定的细胞使得该技术难以用于染色质动力学的研究
[10];其次,由于为了使探针能够有效作用于目标位点,须通过甲酰胺或者高温加热的方式对DNA双链进行变性处理,在此过程中染色质的结构是否改变也不得而知
[11]。因此,FISH很难成为活细胞成像的通用技术。多个锌指结构(zinc finger,ZF)组成的ZFP可以高特异性地识别DNA序列,与荧光蛋白融合的ZFP可用于活细胞内追踪特定的DNA序列
[12]。尽管如此,这项技术仍存在诸多挑战,包括组装和筛选ZFP价格昂贵、费时费力且只能用于重复序列的标记。融合了荧光蛋白的TALEs同样可以实现活细胞和生物体内源重复序列的可视化
[13,14]。利用TALEs可成功标记人的端粒和中心粒重复序列
[15]。TALEs具有设计简单的优势,但需人工合成,费时费力,且目前仍局限于重复序列的标记
[16,17]。Lac操纵子/Lac抑制子(LacO/LacI)系统可以将多达256个LacO重复序列插入到基因组中,荧光标记的LacO结合蛋白LacI通过高亲和力和高特异性地与这些重复序列结合,以对活细胞和生物体中染色质动力学进行成像
[18]。Tet操纵子/Tet抑制子(TetO/TetR)系统采用了类似的策略。这些阵列可以插入任何感兴趣的DNA区域,是染色体动态成像的有力方法。尽管如此,这些长阵列的插入可能会影响染色质结构和目标基因座的功能。生物正交反应是一种生物相容性化学反应,在不与天然的生化过程相互作用或干扰的情况下,可实现在活细胞中对广泛的生物活性分子进行特异性标记
[19~21]。生物正交反应可用于聚糖、核酸、脂质、蛋白质等生物大分子的检测
[22]。利用生物正交系统成功标记肠道病毒71(enterovirus 71,EV71),实现实时追踪病毒早期感染过程
[23]。生物正交标记运用范围广,标记信号稳定,标记类型多样。但就核酸分子标记而言,其缺乏标记的特异性,难以对特定基因组位点独立研究。相比而言,CRISPR系统更易于生产且更高效,并且更适用于各种细胞系和活生物体中的高性能和多重基因组成像。该系统通过荧光标记的DNA结合蛋白形成一个通用平台,可对哺乳动物活体细胞中特定和重复的基因组元件进行成像
[24,25]。
表1比较了上述几种标记方式的不同。
1.3 CRISPR成像的发展
目前基于CRISPR/dCas9的成像系统主要包括:基于荧光蛋白的CRISPR/dCas9成像系统、基于有机染料的CRISPR/dCas9成像系统和基于荧光量子点的CRISPR/dCas9成像系统。
1.3.1 基于荧光蛋白的 CRISPR/dCas9成像系统
目前,用于研究染色质动态变化的CRISPR/dCas9成像系统主要基于荧光蛋白(fluorescent protein,FP)的使用。现已有多种dCas9/gRNA系统应用于活细胞标记。使用直接融合了增强型绿色荧光蛋白(enhanced green fluorescent protein,EGFP)的dCas9和结构优化的sgRNA研究了活细胞内高度重复的端粒动态变化的可视化;同时研究了
MUC4基因的非重复区域,结果表明对于非重复区域,26~36个sgRNA即可实现位点的有效标记
[26]。在此基础上,通过1 124个sgRNA在活细胞中绘制了人整条9号染色体的荧光成像图
[27]。对于重复序列,单一sgRNA即可有效富集荧光信号;而若标记非重复序列,则需最少同时表达30个sgRNA方能产生可检测的荧光信号,该方法操作难度大,转染效率低下,很难保证每个sgRNA表达水平一致,同时可能干扰靶位点的正常功能。将多个sgRNA连入一个载体中规避了这些问题,同时兼具了高效和灵活性的特点。有学者发展了一种称为gRNA寡核苷酸嵌合阵列(chimeric array of gRNA oligonucleotides,CARGO)的单分子组装的策略
[28],每个CARGO中可容纳12个不同的sgRNA,3个CARGO即可对
FGF5基因的增强子和启动子有效标记。其他学者也证实了多个sgRNA表达盒串联组装成单个质粒对于非重复基因组位点成像具有更高的可控性和可扩展性
[29]。
由于dCas9蛋白倾向于定位在核仁中,因此,基于荧光蛋白直接标记的dCas9成像,无论对重复基因位点还是非重复基因组位点的成像,都存在一定的非特异性背景荧光。通过间接标记dCas9的方式,可减少非特异性荧光信号。SunTag系统在dCas9蛋白C端增加了24个拷贝的GCN4多肽表位,通过融合可特异结合GCN4的单链片段可变 (single⁃chain fragment variable,scFv)抗体,dCas9⁃gRNA复合物得以招募更多的荧光蛋白。dCas9也可融合FP11标签,以按比例增强荧光信号
[30]。CRISPR⁃Taq系统证实在单细胞水平有效成像非重复基因位点时不会扰乱染色质结构或者影响转录和复制
[31]。此外,为提高成像的效率以及增加dCas9靶向不同位点的可能性,多种手段如基于BIFC、Aio⁃Casilio以及RNA适配体等已用于成像,其中适配体的应用较为广泛。适配体是一段短的寡核苷酸序列,其可以被特定的RNA结合蛋白识别。基于适配体的成像方法主要包括三个组分:dCas9、整合了适配体序列的sgRNA和融合荧光蛋白的适配体结合蛋白。增加单个sgRNA上适配体MS2位点的数目可显著提高dCas9/sgRNA复合物的荧光信号,单个sgRNA即可检测低至8个重复次数的序列,甚至在此基础上对sgRNA⁃MS2进一步优化可以检测到含有4个重复次数的序列
[32,33]。
多位点同时标记可实现细胞过程中感兴趣的基因相对位置和运动监视的目的。目前主要有两种思路。第一种基于来源不同的细菌物种的CRISPR/Cas9具有不同的gRNA结合特异性,因此将其与不同的荧光蛋白融合即可实现同时标记多个基因位点的目的。来源于金黄色葡萄球菌(
Staphylococcus aureus)的Cas9蛋白(Sa Cas9)用于成像内源性基因组,其稳定性和效率与来源于化脓链球菌(
Streptococcus pyogenes)的Cas9蛋白(Sp Cas9)的成像效果基本一致
[34]。依据来源于不同物种的三种dCas9,包括Sp dCas9、St1 dCas9和Nm dCas9实现同时标记多个不同内源基因组DNA
[35]。第二种方法主要是利用不同的RNA适配体和对应的结合蛋白标记不同的gRNA,与相同的dCas9蛋白结合同时标记多个基因位点。CRISPR Rainbow系统利用三种不同的适配体MS2、PP7和boxB可同时标记单一细胞中的6个基因位点
[36]。在此基础上,CRISPR⁃Sirius系统通过串联的三向接头连接8个MS2或者PP7,检测范围更加广泛。相比CRISPRainbow系统检测的序列需大于100重复次数方能产生检测信号,含有20个重复次数的重复序列即可通过CRISPR⁃Sirius系统产生检测信号
[37]。
此外,有学者开发了一种光诱导的CRISPR成像系统CASANOVA,其由融合了LOV2结构域的抗CRISPR蛋白抑制剂AcrIIA4(LOV2⁃AcrIIA4)构成
[38]。在黑暗条件下,AcrIIA4可有效结合dCas9⁃gRNA复合物,阻止其结合靶DNA序列;在蓝光照明条件下,LOV2会诱导AcrIIA4的构象改变,从而释放dCas9⁃gRNA复合物。光诱导型的CRISPR/dCas9成像系统可降低dCas9分子对靶位点基因表达和基因组结构的干扰。teohold介导的链置换反应(strand displacement reactions,SDRs)可以通过引入单链DNA片段与sgRNA支架碱基互补,改变sgRNA的构象,从而使其失去结合dCas9的能力,成像处于一种关闭的状态;当引入一个可以与单链DNA片段互补的信号,sgRNA构象恢复,成像也恢复到一个开放的状态
[39]。此类光诱导或者开关诱导的CRISPR/dCas9成像系统实现了成像的随开随关,也为活细胞成像提供了一种新思路。
1.3.2 基于有机染料的CRISPR/dCas9成像系统
基于荧光蛋白的CRISPR/dCas9成像系统存在荧光背景高、检测信号灵敏度低、光稳定性差等问题。相比于荧光蛋白,有机染料(即荧光团)亮度高,体积小,耐光性好;同时,当与相容的淬灭剂在空间上接近时,许多荧光团的荧光会显著降低。基于荧光团⁃淬灭剂的多种荧光探针已成功用于检测活细胞中特定的生物分子。其中最常用的荧光探针之一是分子信标(molecular beacon, MB)
[40,41]。分子信标是一种可以实现高信噪比的工具,它是一类小的单链杂交激活的寡核苷酸探针,在两个末端分别带有荧光团和淬灭剂。环结构域侧翼的短臂序列碱基互补形成稳定的双链茎。此时荧光团与淬灭剂空间位置紧密相连,荧光信号很低。当存在分子信标靶序列(MB target sequence,MTS)时,环结构域与靶序列杂交互补,破坏双链茎结构,使得荧光团与淬灭剂相互分离,荧光得以恢复。基于此,MB无需将未结合的探针洗去即可将靶序列转化为可测量的荧光信号,这使得MB成为活细胞内分析各种RNA的首选探针
[42~44]。利用dCas9、MB和sgRNA⁃MTS支架三个组件对活细胞端粒位点进行高特异且准确的成像和染色质端粒动力学监测;与基于如EGFP等的荧光蛋白方法相比,CRISPR⁃MB具有更强的抗光漂白性和更高时间分辨率灵敏性
[45]。在此基础上,发展了一种dual⁃FRET MB的策略,规避了因不完全淬灭或非特异性蛋白与单个MB结合所导致的背景信号,成功成像活细胞基因组位点内的非重复区域
[46]。
1.3.3 基于荧光量子点的CRISPR/dCas9成像系统
量子点(quantum dots,QDs)是直径介于1~10 nm之间的一种纳米材料,相比于有机染料和荧光蛋白,量子点具有优异的光学性能,因此可以将QDs与CRISPR联用,通过检测单个QDs的荧光信号实现可视化单个基因位点的目的。利用两种不用颜色的QDs对潜伏感染细胞中整合的HIV⁃1 DNA进行成像,结果显示,50%以上的量子点聚集在细胞核中,证明量子点标记的高效性
[47]。
表2总结了现有不同CRISPR/dCas9活细胞成像方法。
2 影响成像效果的因素
基因组的可视化需要在最大化目标信号和最小化背景信号之间取得平衡,即获得最优化的信噪比。信噪比是指靶位点荧光点的峰值强度与细胞核非聚集的荧光强度之间的比率。基于CRISPR成像的发展主要是以提高信噪比为目的,寻求操作更加简便、低背景值甚至无背景值的过程
[48~64]。影响成像效果的原因多种多样,现对其做一简单总结。
2.1 dCas9蛋白
过高或者过低的dCas9⁃FP表达水平均会阻碍目的位点信号的检测
[65]。强启动子如CMV驱使dCas9⁃FP的表达可能会观察不到目标的信号点,而是整个细胞都呈现荧光;弱启动子驱使dCas9⁃FP时细胞背景色会减弱,使得信号点的荧光相对增强,获得较为理想成像效果
[53]。但过低的dCas9⁃FP表达水平会导致没有可检出的荧光信号,无法实现正常成像。因此,dCas9的表达水平可以由诱导型启动子或弱启动子控制,以控制dCas9⁃FP的表达水平处于相对较低状态。
通过间接标记dCas9,减少游离的荧光蛋白产生的背景荧光,亦可大幅度提高信噪比。如双分子荧光互补(bimolecular fluorescence complementation,BIFC)与CRISPR/dCas9结合即可减少游离的未结合的荧光蛋白产生背景荧光,提高CRISPR/dCas9标记的信噪比和标记效率
[54]。
2.2 sgRNA
sgRNA本身对成像效果有影响
[66~68]。首先,sgRNA的结构会显著影响成像质量。基于此,通过将A⁃U碱基对翻转和发夹延伸优化的sgRNA支架被用于消除蛋白质聚集并增加亮点数
[30]。A⁃U碱基对被替换为G⁃C后,荧光检测的信噪比稳定提高
[36]。
其次,sgRNA种子序列的长短也影响标记的效果
[35]。CRISPR/Cas9系统在基因编辑应用中,sgRNA种子序列的长度一般不小于20 nt才能进行有效编辑;而在CRISPR/dCas9系统用于成像时,较短的sgRNA序列成像效果可能更好,长度为11 nt的sgRNA的成像效果优于20 nt的sgRNA
[36]。
此外,sgRNA的稳定性决定标记效率。适配体的插入位点不同会影响sgRNA的稳定性。3'末端插入MS2的sgRNA比在颈环结构处插入MS2的sgRNA表达水平更低
[37]。同时,插入适配体的数量也会对成像效果造成一定影响。比较了携带1个、2个和16个MS2适配体的sgRNA成像本氏猪笼草(
N. benthamiana)端粒的效果,结果显示,与MS2数量为2时相比,当MS2数量为1时,观察到的端粒信号的数量减少;MS2数量为16时,端粒信号并未增强,相反还出现了更强的背景信号
[63],该结果提示适配体的数量也会影响成像效果。
但是,靶位点可结合sgRNA的数量与标记的效率无直接的正比关系。如有实验表明具有17个重复单元的核糖体基因座获得的信号比具有70次重复的另一个基因座获得的信号更高。因此,CRISPR成像效率不是简单地由目标位点的拷贝数即结合sgRNA的数量决定
[34]。
除了sgRNA本身对成像效果的直接影响,sgRNA对dCas9蛋白的影响也对成像的效果至关重要。在酵母活细胞成像的研究中发现,没有sgRNA存在的条件下,dCas9⁃GFP信号主要分布在核仁中,少量分布在核质中;当存在非靶向的sgRNA时,dCas9⁃GFP信号均匀分布于细胞核;而在表达靶向目的位点rDNA的gRNA表达时,dCas9⁃GFP则定位在类似于染色质纤维的结构中,该结果表明sgRNA对dCas9的分布有至关重要的作用
[55]。Cas9靶向任何基因组的效率会受到所用sgRNA效率的显著影响。由于核仁中存在一些与dCas9亲和的核仁蛋白或者RNA,dCas9会偏向富集在核仁中
[34],核仁斑点会干扰标记基因组位点的充分成像。sgRNA表达的增强可以驱动dCas9从核仁到核质的易位,从而提高靶向效率。因此,通过增强sgRNA的表达以及提高其稳定性对于CRISPR成像尤其重要。证实了dCas9对于gRNA的稳定是必不可少的
[51]。综上所述,dCas9/sgRNA复合物的有效形成及准确靶向是成像的关键之一。
2.3 温度
温度也是影响标记效率的因素之一。本氏猪笼草基于适配体的CRISPR成像效率是FISH成像效率的73%~75%。相比于人类细胞培养,通过CRISPR成像获得的端粒信号数量几乎与通过FISH获得信号数量一致,推测有可能是因为Cas9最佳温度为37 ℃。而植物的最适温度是22 ℃,两者之间的温度差异可能是导致标记效率不同的原因
[63]。
2.4 转染方式
通过瞬时转染的方式将dCas9或者sgRNA递送至细胞内会不可避免地出现游离的dCas9⁃FPs或者未结合到靶位点的dCas9/sgRNA复合物,这就导致背景信号增强。同时转染存在一定的概率,细胞与细胞之间、不同类型的细胞之间的差异难以控制。通过获得稳转细胞系或者使用基于慢病毒的递送方式可以解决上述问题,但其又会带来新的潜在问题,即稳转细胞系可能会改变细胞生理,违背了基于CRISPR成像不损害细胞的基本原则
[32]。
2.5 靶位点
靶序列的分子特征可以影响sgRNA的稳定性、活性以及与Cas9结合的能力;同时,染色质可及性是决定体内dCas9结合的主要因素。因此,想要获得理想的细胞成像效果,要综合考虑各种因素,方能获得最优标记方案。
3 展 望
染色质的结构和动态变化在不同细胞功能中起着重要作用。CRISPR活细胞成像技术因其靶向的灵活性和精确性,有望揭露更多基因组和染色质的谜团。CRISPR成像系统具有其他成像系统无可比拟的优势,首先CRISPR/dCas9成像系统是非破坏性的,可实现瞬时成像或长期跟踪活细胞天然染色质状态;其次,CRISPR系统简便,通过简单地设计sgRNA,即可定向到任何感兴趣的基因座;第三,20~30个sgRNA即可对一个非重复区域有效标记,表明CRISPR/dCas9成像系统具有较高的特异性;同时,CRISPR/dCas9成像系统具有较高的兼容性,如多重sgRNA表达系统除可视化非重复DNA位点,也可调控内源基因表达
[29]。
目前对CRISPR/dCas9成像系统可视化活细胞中基因组的探索主要是开发基于dCas9/sgRNA原理,开发具备光学特性和简便标记策略的CRISPR衍生系统,以提高基因检测的灵敏度和可靠性。未来研究重心主要包括进一步优化sgRNA支架结构,以提高sgRNA的稳定性和对dCas9蛋白的亲和性,从而增强靶向效率;此外,CRISPR技术要想成为一项普遍使用的标记技术,开发更加简便、更灵敏的CRISPR标记系统以成像单拷贝基因是至关重要的;最后,基于CRISPR成像技术已用于哺乳动物细胞、昆虫细胞、植物细胞、酵母、甚至小鼠个体成像,更多的实验需在不同物种上进行验证。随着CRISPR活细胞成像技术的不断发展,其有望用于不同生物学背景下基因活动的研究。