0 引 言
大肠杆菌(Escherichia coli)作为一种常见的外源蛋白的表达宿主,具有遗传背景清楚、繁殖快、成本低、表达量高、表达产物易纯化等优点,近年来已受到越来越多的关注,是外源蛋白表达中最早和目前应用最广泛的经典表达系统。
重组目的蛋白质高水平表达是工业生产应用最重要的先决条件之一,但由于它们在宿主细胞内过表达时的快速合成和空间有限等原因,许多蛋白质容易错误折叠或形成不溶性包涵体,这直接影响蛋白质的功能和产量。最初合成蛋白质的细胞质环境是一种还原性环境,不利于二硫键的形成。而大肠杆菌周质空间包含一系列酶,如二硫键氧化还原酶(disulfide bond oxidoreductase, DsbA,DsbB,DsbC,DsbD)和肽脯氨酰异构酶(peptidyl⁃prolyl isomerase, SurA,Rota,FklB,FkpA)等,可促进含硫醇蛋白质的正确折叠。因此,将重组蛋白质分泌到更具氧化性的周质空间中再分泌至胞外比细胞内生产具有更多优势,如更利于蛋白质的正确折叠、简化下游加工、避免胞内蛋白酶对目的蛋白质的攻击以及增强蛋白质活性。
1 宿主细胞本身的蛋白质跨膜运输途径
1.1 Ⅰ⁃Ⅴ型蛋白质分泌系统
大肠杆菌是一种革兰氏阴性菌,具有两层生物膜——细胞质膜和外膜,中间有一层肽聚糖层,两层膜之间为周质空间。蛋白质在革兰氏阴性细菌中的跨膜分泌主要通过Ⅰ型、Ⅱ型、Ⅲ型、Ⅳ型和Ⅴ型分泌途径。
I型分泌系统的一个典型例子是大肠杆菌α⁃溶血素(α⁃hemolysin,HlyA)的分泌,运输该蛋白质的寡聚复合物由属于ABC(ATP binding cassette)转运蛋白质超家族的两个内膜蛋白(HlyB和HlyD)和内源性外膜蛋白TolC组成。HlyB和HlyD形成稳定的复合物,在细胞质中与带有HlyA信号序列的蛋白质结合,之后该复合物与TolC结合,形成连接质膜和外膜的通道,将蛋白质分泌至胞外
[1]。Ⅱ型的分泌途径分为两步。第一步:跨细胞质膜转运,Sec途径和双精氨酸转运(twin⁃arginine translocation,TAT)途径都可用于蛋白质跨细菌细胞质膜分泌;第二步:跨外膜转运,由12~16种蛋白质组成的专用分泌装置将蛋白质输出胞外
[1]。Ⅲ型分泌系统由横跨内膜和外膜的一个类似分子注射器的转运装置转运蛋白质,可以将蛋白质直接注射到宿主真核细胞中
[2]。Ⅳ型分泌系统与接合转移DNA系统有关,百日咳鲍特氏菌(
Bordetella pertussis)的百日咳毒素的分泌即采用了该分泌系统。使用此途径的蛋白质可以分泌到胞外环境中或直接分泌到宿主细胞中
[2]。Ⅴ型分泌系统分为:自动转运蛋白质系统、双伴侣系统和Oca家族。与Ⅱ型系统类似,分泌过程分为两步,第一步为前体蛋白质通过细胞质膜的转运,第二步为蛋白质通过β型桶形成的孔状结构转运穿过外膜
[2]。
E. coli K⁃12和B菌株主要通过Ⅰ和Ⅱ型系统分泌蛋白质。
1.2 蛋白质跨质膜转运途径
在大肠杆菌中,有两种主要的蛋白质跨细胞质膜转运途径:Sec途径和TAT途径,其中Sec途径分为共翻译转运途径和翻译后转运途径。分泌蛋白质都含有较短的特定氨基酸序列——信号肽,可作为靶向和识别信号引导新合成的蛋白质从细胞质中转运到膜外或周质空间中。分泌蛋白质的信号肽具有类似的结构,包括带正电荷的n区、中央疏水性h区和极性c区,其中包含信号肽酶的识别降解位点。
1.2.1 共翻译转运途径
共翻译转运途径即信号识别颗粒(signal recognition particle,SRP)介导的转运途径。如
图1 A①所示,在共翻译模式中,蛋白质的高疏水性的信号肽被SRP识别,并与之结合,形成核糖体新生链⁃SRP复合物,随后,该复合物与SRP受体FtsY结合,转移至SecY、SecE和SecG形成的跨膜通道并将蛋白质释放进入周质空间
[3]。
1.2.2 翻译后转运途径
翻译后转运途径即SecB依赖途径,该途径运输翻译后转运的蛋白质。如
图1 A②所示,通过此途径分泌的蛋白质与翻译后相互作用蛋白(post⁃translationally interacting proteins, PIPs)如SecB结合,SecB使含有信号肽的前体蛋白质保持在未折叠和可溶的状态,底物蛋白质的信号肽作为靶向和识别信号被位于细胞质膜的SecA特异性识别,使蛋白质与SecA结合,SecB从膜上释放出来。通过ATP降解释放的能量和质子动势(proton motive force, PMF)使蛋白质通过SecYEG跨膜通道转运至周质空间,在转运过程中或转运后不久,信号肽酶(SPase)将信号肽除去,成熟蛋白质释放进入周质空间
[1]。
1.2.3 TAT途径
该途径被称为双精氨酸转运途径,因为在Tat信号肽中,通常存在一个特征性氨基酸共有基序,其中包括两个高度保守的精氨酸残基(twin⁃arginine motif, RR)。Sec和Tat信号肽具有类似的结构,包括带正电荷的n区,中央疏水性h区和极性c区,其中包含信号肽酶的识别裂解位点。Tat信号肽h区的疏水性比Sec信号肽h区的疏水性小,通常存在带正电荷的氨基酸,以防止Tat底物误入Sec途径。如
图1 B所示,TAT途径转运的蛋白质在细胞质中可以结合特定的折叠辅助因子并完成折叠,其信号肽被细胞质中的TatBC复合物识别结合并促进复合物与细胞质膜上的TatA寡聚体的结合,蛋白质通过TatA和TatE寡聚体形成的通道转运
[3]。之后蛋白质的信号肽被信号肽酶去除,成熟蛋白质在膜的外侧释放。
2 改善重组蛋白质胞外分泌的策略
2.1 宿主菌株的选择和改造
由于部分大肠杆菌运输机制的分泌能力有限和蛋白酶水解目的蛋白质等原因,外源蛋白分泌效率较低、蛋白质活性低、胞外分泌量少,因此需要选择合适的宿主菌株进行重组蛋白质的表达。大肠杆菌K⁃12菌株及其衍生菌株(DH5α等)使用非常广泛。然而,K⁃12菌株表达蛋白质的过程中会产生高水平的乙酸盐,这是厌氧发酵过程中形成的副产物,会对细胞生长产生不利影响。而在大肠杆菌B菌株的发酵过程中由于乙酸盐积累较少,并缺失一些蛋白酶,因此可减少重组蛋白质的降解并提高产量,近年来常被使用。
可以通过敲除与细胞壁和膜生物合成相关的基因来构建重组渗漏菌株来增加膜的通透性,从而改善细胞外分泌。有一些基因编码大肠杆菌膜相关蛋白质或与膜相关生物分子相互作用,对于细胞壁和细胞膜的完整性至关重要。基于CRISPR/Cas9的基因组编辑和FlAsH标记分析阐明了多个基因缺失对细胞生长和蛋白质胞外分泌的影响,通过膜蛋白、周质蛋白和肽聚糖相关的多个基因突变,获得了具有较高蛋白质分泌能力的菌株
[4];敲除
D,
D⁃羧肽酶基因(
dacA和
dacB)破坏了肽聚糖结构,从而增强通透性,使大肠杆菌中重组蛋白质在胞外的含量提高
[5];此外,发现DacA或DacB的过表达可能也会导致细胞壁肽聚糖网络的破坏,使得重组淀粉酶和α⁃半乳糖苷酶的细胞外产量分别增加4.5倍和2.8倍
[6]。
尽管已证明开发重组渗漏菌株是输出目的蛋白质的有效方法,但由于外膜的损伤会降低细胞活力,还需研究其对细胞生长的影响。此外,近年来发现,下调与细胞壁和膜生物合成相关的基因而不是将其敲除可能是更好的选择
[7]。
共表达可以造成细胞膜损伤的蛋白质来构建重组渗漏菌株也成为有效措施之一。如姜琪等
[8]将蜡状芽胞杆菌(
Bacillus cereus)磷脂酶C(phospholipase,PLC)与嗜热放线菌(
Thermobifida fusca)的葡萄糖异构酶在单质粒中共表达,改善了重组蛋白质的细胞外产生,PLC的表达增强了细胞膜的通透性,并避免了研究者之前使用嗜热放线菌的角质酶共表达时易起泡的缺陷,改善了该渗漏表达系统在工业领域的可用性。
此外,通过在染色体
tatABCD操纵子的上游引入强诱导型启动子P
tac来构建TatExpress系列超级分泌菌株,使工业中常用的大肠杆菌(例如W3110和BL21)中的Tat系统转运蛋白质的能力大大提高,具有较强的工业应用潜力
[9]。该菌株显著改善了人类生长激素(human growth hormone,hGH)的表达。
2.2 信号肽的选择和优化
信号肽对于重组蛋白质的有效分泌至关重要。目前许多不同来源的信号肽被成功地用于大肠杆菌中重组蛋白质的分泌。
已经证明,胡萝卜软腐果胶杆菌(
Pectobacterium carotovorum)果胶裂解酶(pectate lyase II,PelB)的信号肽、大肠杆菌外膜蛋白(outer membrane protein A,OmpA)的信号肽以及铜绿假单胞菌(
Pseudomonas aeruginosa)金属蛋白酶(metalloprotease)PT121和其突变体Y114S的天然信号肽中,PelB的信号肽更适合于PT121和Y114S在大肠杆菌的胞外分泌
[10];发现大肠杆菌麦芽糖/麦芽糖糊精结合周质蛋白(maltose/maltodextrin binding periplasmic protein,MalE)的Sec依赖性信号肽和麦芽糖孔蛋白(maltoporin,LamB)的SRP依赖性信号肽可以提高伊德氏杆菌(
Ideonella sakaiensis)201⁃F6的聚对苯二甲酸乙二酯水解酶在大肠杆菌胞外的产量
[11]。
近年来也发现来源于其他菌的信号肽有时能更好地引导蛋白质分泌至胞外。如使用枯草芽胞杆菌(
Bacillus subtilis)脂肪酶A(lipase A,LipA)的信号肽和嗜热脂肪芽胞杆菌(
Bacillus stearothermophilus)US100菌株的α⁃淀粉酶(α⁃amylase)的信号肽可以成功地将嗜热地芽胞杆菌(
Geobacillus thermoleovorans)US105菌株的支链淀粉酶(pullulanase,PUL)分泌到大肠杆菌的胞外上清中,这是首次在大肠杆菌中使用其他菌来源的信号肽高效分泌约160 000的相对高分子量的PUL
[12];将考克氏菌菌株3⁃3(
Kocuria sp. 3⁃3)木聚糖酶(xylanase)的信号肽分别与地衣芽胞杆菌(
Bacillus licheniformis)DSM13的α⁃淀粉酶和果胶微球菌(
Sinomicrobium pectinilyticum)的α⁃淀粉酶融合,提高了大肠杆菌胞外α⁃淀粉酶的含量
[13]。
由于信号肽除了具有引导蛋白质穿越细胞膜的作用外,还对蛋白质的生物合成、折叠过程和稳定性有影响。因此目前尚无法预测在给定的蛋白质和表达宿主的情况下的最优信号肽,只能对最有可能的多种信号肽进行筛选,或是通过定点或随机突变优化策略优化信号肽。
2.3 质粒的选择和改造
表达重组蛋白质时通常将目的基因克隆到质粒中,其包含复制起位点、选择标记、启动子、翻译起始区(translation initiation region,TIR)以及终止子等。一般通过筛选可能适合的质粒或对质粒的定向改造来确定蛋白质表达载体。在大肠杆菌中表达绿色荧光蛋白(green fluorescent protein,GFP)时发现,将TIR中的SD序列从8个核苷酸的UAAGGAGG缩短到AGGAGG,同时使用富含A/U的增强子增强翻译水平,可以使GFP以更高水平表达
[14]。
pET表达系统是重组蛋白质生产中最常用的表达系统,但它并不普遍适用于所有蛋白质的表达。发现表达抗原结合片段(Fabs)时,大肠杆菌碱性磷酸酶(alkaline phosphatase,PhoA)启动子的分泌能力优于T7启动子
[15]。
迄今为止,已有大量表达载体被应用于重组蛋白质的生产。由于宿主菌株中外源蛋白的基础表达可能对宿主有害,从而导致表达系统不稳定。在研究长野芽胞杆菌(
Bacillus naganoensis)PUL的分泌时提出双重抑制策略
[16]。在大肠杆菌中,编码T7 RNA聚合酶的T7基因在染色体中被
lac操纵子调控,理论上,在无诱导剂的情况下,染色体中
lac阻遏蛋白与
lac operator的结合使T7基因保持沉默,抑制T7 RNA聚合酶的表达。而实际上,T7 RNA聚合酶会表现出基础活性并导致目的蛋白质的基础表达。对比pET⁃20b(+)和pET⁃22b(+)两种质粒发现,前者中无
lacI和
lac operator,而后者中有。因此pET⁃22b(+)也提供了
lac阻遏蛋白的结合位点。所以,在插入质粒pET⁃22b(+)⁃
pul的大肠杆菌中,染色体的T7 RNA聚合酶的合成和质粒上PUL的表达都将在诱导前阶段被抑制,潜在地减少PUL诱导前的基础表达,提高表达效率和胞外产量。
2.4 融合表达或共表达分子伴侣或促进细胞膜损伤的蛋白质
在大肠杆菌中重组蛋白质的过表达可能导致错误折叠的蛋白质积聚成包涵体,而分子伴侣可以有效改善目的蛋白质折叠、溶解性和跨膜运输。在大肠杆菌中表达异源蛋白质并分泌至胞外的前提是该蛋白质以可溶形式产生,否则无法释放出胞外。因此分子伴侣的共表达成为将目的蛋白质有效分泌到胞外的有效方法之一。近年来Takara公司利用此原理开发了几种广泛用于改善蛋白质的可溶性表达的大肠杆菌分子伴侣载体,如pG⁃KJE、pGr07、pKJE7等
[7],其中质粒pG⁃KJE8携带两组大肠杆菌的分子伴侣基因
groES⁃
groEL和
dnaK⁃
dnaJ⁃
grpE。通过双载体共表达——质粒pG⁃KJE8和携带人源角膜晶状体蛋白乙醛脱氢酶(Aldehyde dehydrogenase 3A1, ALDH3A1)基因的质粒pET⁃26b (+)/ALDH3A1,提高了ALDH3A1在大肠杆菌中异源表达的可溶性蛋白质产量
[17]。如
表1所示,使用分子伴侣GroES/GroEL和DnaK/DnaJ/GrpE的双载体共表达系统(大肠杆菌分子伴侣载体pGKJE3和携带CGTase的基因的质粒pTCGT1)来提升浸麻芽胞杆菌(
Bacillus macerans)的环糊精糖基转移酶(Cyclodextrin glycosyltransferase, CGTase)在大肠杆菌中的可溶性表达量
[18]。将炽热球菌(
Pyrococcus furiosus)的分子伴侣前折叠蛋白质(prefoldin)与炽热球菌的α⁃淀粉酶在大肠杆菌中在单或双质粒中共表达都改善了α⁃淀粉酶的可溶性表达
[19]。
对分子量低于40 kDa的20个选定的融合伴侣进行了研究,发现有12种可以改善大肠杆菌中枯草芽胞杆菌α⁃淀粉酶以及人瘦素(human leptin)的胞外分泌,其中分子伴侣渗透诱导蛋白Y(Osmotically⁃inducible protein Y,OsmY)的融合表达效果最好,但其缺点是需要切割以获得目的蛋白,并且融合伴侣蛋白质的大小可能会成为蛋白质跨膜分泌的限制因素
[20]。
融合表达或共表达促进细胞膜损伤的蛋白质也可以促进蛋白质释放出胞外。细菌素释放蛋白质(bacteriocin release protein, BRP)是大肠杆菌的脂蛋白,也被称为“裂解蛋白质”,可以改变大肠杆菌外膜的通透性。将BRP与嗜热脂肪芽胞杆菌F1的碱性蛋白酶(alkaline protease)在双质粒共表达系统中共表达,提高了表达后该酶在胞外的含量
[21]。大肠杆菌素E1裂解蛋白(colicin E1 lysis protein, Kil)可以抑制细胞壁肽聚糖的生物合成,促进大肠杆菌细胞的裂解。将Kil与解淀粉芽胞杆菌(
Bacillus amyloliquefaciens)的
β⁃葡聚糖酶在具有双启动子的质粒中共表达,提高了表达后
β⁃葡聚糖酶胞外含量
[22]。
除此之外,一些蛋白标签也可用作融合标签在大肠杆菌中提高表达的异源蛋白的可溶性,最终可提高蛋白质的胞外产量。例如大肠杆菌的硫氧还蛋白(thioredoxin,Trx)标签融合表达系统是在大肠杆菌中产生正确折叠和可溶的外源蛋白质的最成功的系统之一。将Trx和人甲状旁腺激素(human parathyroid hormone,hPTH)融合提高了hPTH在大肠杆菌中表达后的胞外含量
[23]。
2.5 培养条件的改变
大肠杆菌细胞膜具有选择性透过性。目前,研究发现许多培养基补充剂可以与膜相关成分作用来改变细胞膜的结构,在大肠杆菌的异源蛋白质的分泌中发挥作用。其中,甘氨酸、Triton X⁃100、SDS、吐温、蔗糖、山梨糖醇、脯氨酸和一些金属离子等被广泛应用。阿拉伯糖也被证明可以改变细胞膜的通透性,同时不会引起细胞裂解,因此阿拉伯糖可以作为额外的碳源和诱导剂应用其中
[10]。此外,发现向培养基中添加产气荚膜梭菌(
Clostridium Perfringens)或单核细胞增多性李斯特氏菌(
Listeria monocytogenes)来源的磷脂酶C对大肠杆菌 BL21(DE3)外膜通透性影响较大
[24]。为进一步提高大肠杆菌工程菌株表达异源蛋白的胞外含量提供新的思路。
在选择培养基添加剂时,也需要分析他们对细胞生长的毒害作用。众所周知,EDTA能破坏细胞膜,因此有助于蛋白质的释放。然而,EDTA的添加会对细胞产生毒性。而在发酵过程中添加适量聚乙烯亚胺几乎不会对细胞生长产生不利影响,并且可以增强外源蛋白向培养基中的释放
[25]。
自诱导培养基的开发是一项重大突破。在该培养基中,碳源是葡萄糖、甘油和乳糖的混合物。在大肠杆菌的生长过程中,当环境中有葡萄糖时,乳糖的摄取会被阻止,不会诱导外源蛋白的表达。一旦葡萄糖在对数期的中后期耗尽,乳糖便作为碳源转运到细胞中并诱导外源蛋白表达。自诱导培养基比常规方法可产生更多胞外的异源蛋白,因此近年来被广泛使用
[7]。
此外,表达过程中温度的控制也十分重要。为了更有效地改善细胞外分泌,需要优化各种培养条件协同作用,这将比单一因素的优化更适于外源蛋白的大规模生产。例如用自诱导代替IPTG诱导,并使用两阶段的温度控制表达,使克雷伯氏菌(
Klebsiella variicola)的支链淀粉酶的胞外产量得到了明显增加
[26]。还有研究也证明了培养基添加剂的组合效果,如Li等
[27]将甘氨酸作为培养基补充剂增强了大肠杆菌中浸麻类芽胞杆菌(
Paenibacillus macerans) JFB05⁃01来源的α⁃环糊精糖基转移酶的分泌,并且Ca
2+可弥补甘氨酸引起的细胞生长抑制,从而使α⁃环糊精糖基转移酶的分泌进一步增强。
2.6 密码子的优化
在大肠杆菌中表达的外源蛋白的基因中很可能存在大量稀有密码子,核糖体在遇到稀有密码子时可能会脱离mRNA并中止翻译,导致mRNA稳定性下降、移码、缺失、转录或翻译的过早终止和生长停滞,会给外源蛋白的表达过程带来潜在的障碍。对此,许多研究表明,通过补充稀有tRNA
[28]或者改造外源基因优先使用与宿主偏好性高的密码子而不改变氨基酸种类
[29],均可改善外源蛋白的表达。对牛黄杆菌(
Flavobacterium balustinum)的有机磷水解酶(organophosphorus hydrolase,OPH)的基因及其天然信号肽进行密码子优化,提高了OPH的翻译和折叠速率,提升了大肠杆菌中OPH的表达量和胞外产量
[30]。
2.7 多因素协同优化表达过程
通常人们需要分析表达过程中的诸多因素,将多种改进表达的方法综合应用,才能使外源蛋白在大肠杆菌中更多地分泌至胞外。如Kim等
[31]在南极假丝酵母(
Candida antarctica)脂肪酶B(CalB)N末端融合了pelB信号肽和5个天冬氨酸标签,该蛋白标签对CalB N端负电荷的调节不仅提高了其跨大肠杆菌外膜转运效率,还改善了大肠杆菌中CalB的表达量和胞外产量。使用T7启动子和pET系统表达荚膜红细菌(
Rhodobacter capsulatus)的
RchemA编码的5⁃氨基乙酰丙酸合成酶(5⁃aminolevulinic acid synthase,ALAS),在C4途径中通过ALAS的催化可以合成在农业和医药领域具高利用价值的5⁃氨基乙酰丙酸(5⁃Aminolevulinic acid,ALA)
[32]。研究者优化了
RchemA基因密码子,同时为了增强5⁃氨基乙酰丙酸合成酶的可溶性,将其与TrxA标签融合,并与分子伴侣GroELS在双质粒中共表达,并探索出最优表达的诱导时间、IPTG和培养基添加剂甘氨酸的浓度,以此提高5⁃氨基乙酰丙酸合成酶的胞外产量。
3 展 望
虽然大肠杆菌中外源蛋白的生产已在工业和医疗等领域广泛应用,但在蛋白质分泌过程的各个阶段仍有许多需要考虑和优化的因素,还需要根据外源蛋白自身的结构和性质来研究优化改进的方向。从这样的发展趋势来看,提高外源蛋白的胞外产量的方法中大多是多种改进方法协同作用,从改善外源蛋白的可溶性、表达的准确性、胞外分泌的高效性等角度综合提升表达效果,更全面地完善其大肠杆菌表达系统的应用前景。
国家自然科学基金面上项目(31470185)