牛结核病的病原微生物主要是牛分枝杆菌,牛分支杆菌可借助含菌气溶胶或者是食用了被感染的牛奶制品广泛传播,10%患结核病的人传染源为牛分枝杆菌
[1]。牛分枝杆菌呈细长、平直或略弯杆菌形态,长度为(1.5~4)μm×(0.2~0.8)μm,大部分单个排列,少数聚集在一起,不运动、无芽胞和荚膜,革兰染色阳性
[2]。牛分枝杆菌生长缓慢,生长最适pH范围为 5.9~6.9。牛分枝杆菌分泌的蛋白在迟发型变态反应过程有着举足轻重得作用
[3]。另外与毒力有关的物质索状因子是特殊的糖脂,它能够抑制细胞移动,线粒体膜的破环,细胞呼吸及氧化磷酸化都受索状因子影响
[4]。从而致使多种构造器官变成结核性肉芽肿,产生结节钙化。
卡介苗(BCG)可以用于牛结核病的预防,但是效果不佳,日常检疫工作困难重重
[5]。牛和其他一些动物均可以感染牛分枝杆菌和结核分枝杆菌。随着畜牧业膜的不断扩大发展,结核病给畜牧业造成重大经济损失,据不完全统计,全球每年有5 000万头结核阳性牛,损失在30亿美元以上,因患有牛结核病而死亡的人数也不断增多
[6-7]。在高收入国家,由耐药菌株引起的结核病也正在成为一个公共卫生问题。结核病流行的遏制工作依然任重道远。因此对牛分枝杆菌基因组特征,相关致病性,毒力因子,靶标抗药基因的研究分析为牛结核病的发生原因提供初步参考。
范围不断扩大的牛结核病对世界的经济和人们的生命遭受严重的损害。最近几年,我国的牛结核病问题也被全国人民所关注。结核病病原体结核分枝杆菌的全基因组测序(WGS)研究极大地推进了人们对这种病原体的认识和理解。自1998年第一份结核分枝杆菌基因组发表以来
[8],WGS对结核分枝杆菌群体中引起耐药性的基因组特征提供了更完整的描述,帮助填补了我们对经典和新型抗结核药物如何发挥作用的知识空白,并确定了允许结核分枝杆菌逃避这些药物影响的特定突变。WGS研究还揭示了耐药性在个体患者和患者群体中的演变过程,包括新获得耐药性和克隆传播的重要作用
[9]。目前也有研究应用免疫胶体金技术制备牛结核杆菌胶体金快速诊断试纸条做应用性鉴定,有较高的灵敏度
[10]。因此,要对某一病原体进行后续深入的探索,首先就要对其本身基因组成成分有较为清楚的认识,并了解清楚该物种中基因的结构以及功能相互之间的关系。
为进一步深入研究牛分枝杆菌CVCC68002基因组特征,致病性和遗传进化关系,本研究应用 Pac Bio Sequel 测序平台对牛分枝杆菌CVCC68002进行全基因组测序,并对基因序列进行基因预测分析和功能注释,尤其对致病性、毒力因子和耐药基因进行分析,为后续对该菌株分子生物学特征、致病性和耐药基因筛选研究奠定了理论基础,也为牛分支杆菌感染疾病的预防和深入研究提供参考。
1 材料与方法
1.1 材料
1.1.1 试剂
牛分枝杆菌 ( CVCC68002) 购自中国兽药监察所。7H9肉汤培养基和7H10固体培养基购自Sigma有限公司。SMRT bell TM Template kit(version 1.0)试剂盒、NEBNext®Ultra™ DNA Library Prep Kitfor Illumina (NEB,USA) 试剂盒、全基因组DNA提取试剂盒由上海晶诺生物科技有限公司提供。
1.1.2 仪器与设备
超低温冰箱(DW-86L388,青岛海尔);高压蒸汽灭菌锅(LDZF-30KB,上海申安医疗器械厂);生物安全柜(HFsafe-1200LC,上海力申科学仪器限公司) ;电热恒温培养箱(PYL-125,天津市莱玻特瑞仪器设备有限公司);恒温培养摇床(QYC-200,上海智城分析仪器制造有限公司);离心机(H1650W,湖南湘仪离心机仪器有限公司);Illumina和Pacbio测序技术平台(上海晶诺生物科技有限公司),菌体培养地点为天水市第五人民医院。
1.2 方法
1.2.1 菌株活化与培养
将冻干保存菌株接种于7H9肉汤培养基,37 ℃、150 r/min 摇床培养4周左右,转接种至7H10固体平板,37 ℃静止培养4周,分离单个菌落,再转接至7H9肉汤培养基于37 ℃、150 r/min培养 4周,收集菌体,如
图1所示。
1.2.2 基因组提取与测序
采用SDS或STE的方法提取牛分枝杆菌样本基因组DNA,并利用琼脂糖凝胶电泳的方法进一步检测DNA纯度及完整性,最后用Qubit对基因组DNA进行定量分析,并构建10K SMRT Bell库。通过Covaris g-TUBE将满足测序要求的高纯度DNA样品打断成适合大小的片段,完成文库构建,对其进行DNA损伤末端修复,将发夹接头连接至2个DNA片段末端,进一步纯化DNA片段并筛选特定大小的片段,并对SMRT Bell库进行浓缩筛选,同时对DNA进行损伤修复,再次纯化SMRT Bell库。通过Qubit对构建的文库进行定量,并验证插入片段的大小,最后在PacBio平台进行测序。
1.2.3 基因组序列组装与预测
对原始数据过滤处理,得到有效数据。从各样品质控后的有效数据出发,使用SMRT Link v5.1.0软件(
https://www.pacb.com/support/software-downloads/)
[11]对reads进行基因组组装,进一步将reads比对到组装好的基因组序列上,得到序列测序深度的分布状况。最后把原始数据和初步组装序列比对优化,校正组装错误的区域。比对分析优化后的组装结果,采用二代数据矫正,将染色体序列与质粒序列进行筛分,最后将染色体序列组装成环状基因组,也就是最终的0 gap完成图的序列。
1.2.4 序列分析和基因功能注释
使用GeneMarkS(Version 4.17
[12](
http://topaz.gatech.edu/GeneMark/)对基因组进行编码基因预测。将预测基因的蛋白序列与Nr、Swiss-Prot、KEGG、COG、GO、TCDB (Transporter Classification Database)、PHI (Pathogen Host Interactions Database)、VFDB(Virulence Factors of Pathogenic Bacteria)、ARDB(Antibiotic Resistance Genes Database)、CARD(Comprehensive Antibiotic Research Database)、CAZy (Carbohydrate-Active en ZYmes Database)数据库进行 Diamond比对注释(evalue≤1E-5)。比对结果(最高 score)进行注释(默认 identity≥40%,coverage≥40%)
[13]。从NCBI Gen Bank 数据库下载10株结核分枝杆菌参考基因组序列(
表1),与CVCC68002株基因组序列进行分子进化比较分析。利用MAFFT v7.490软件多序列比对
[14],比对后的序列对齐文件,用IQ-TREE(2.1.4)软件
[15]构建全基因组进化树。
2 结果与分析
2.1 基因组 DNA 检测分析
提取牛分枝杆菌CVCC68002基因组DNA如
图2所示,可以看到1条清晰条带,其条带大小在30~50 kb之间。经Nano Drop和Qubit检测,DNA 浓度达428 ng/μL,DNA 纯度(
Dp)为1.33(
Dp=
Nano Drop浓度/Qubit浓度,
Nano Drop浓度570,
Qubit浓度为428),综上说明提取的DNA符合标准,可以建库。
2.2 基因组组装与预测
对牛分支杆菌CVCC68002测序数据统计见
表 2,CVCC68002菌株过滤后的有效 reads为 118 623 个,平均测序读长为 6 601 bp。对基因组组装结果见
表 3,该菌株组装后基因组有1 个contigs,并且总长度为436 121 bp,GC 含量为 65.64%。编码基因预测结果如
表4,基因组全长为4 357 100 bp,得到4 145个编码的基因,读长总值为3 933 543 bp、读长平均值为949 bp。其基因的长度分布见
表5,基因组长度在400~500 bp的数量最多,达350个,基因组长度在700~800 bp的数量次之,达到305个,数量最少的基因组长度处于1 900~2 000 bp,只有42个,但是大于2 000 bp的基因数量也处于优势数量,可达到266个。
2.3 功能注释
2.3.1 不同数据库中基因功能注释数量
将预测基因与相应数据库比对可知,在Nr、Swiss Prot、KEGG、GOG、TCDB、GO、PHI、VFDB、ARDB、CARD、CAZy 数据库获得注释的基因个数分别为4 113、2 434、4 069、3 007、285、2 415、317、456、2、28、138 个(
图 3)。
2.3.2 NR 注释
NR注释结果表明,物种分类最高集中在结核分枝杆菌类别中,其次为牛分支杆菌类别中,从而确定牛分枝杆菌CVCC68002的分类归属。
2.3.3 GO 功能注释
GO数据库可以分为三大类:细胞组分(Cellular component),分子功能(Molecular function)和生物过程(Biological process)
[16]。结果显示牛分支杆菌CVCC68002中2415个基因在GO功能注释中注释,并占总编码基因的58.26%(
图4)。
在细胞成分分类中,有10种功能特性中的1 449个基因得到注释。其中细胞及细胞组分注释到530个基因,数量最多,比例达到36.58%;其次和大分子复合物相关的基因有127个;比例达到8.76%;24种功能特性中的4 438个基因在生物过程类中注释,其中1 458个与代谢功能有关的基因,富集最为显著,有1 209个与细胞过程有关基因,183个与刺激反应有关基因;10 种功能特性在分子功能类注释,其中有1 455个催化活性功能的基因,数量最高并占比50.77%;其次是结合功能基因数为1 055个。生物过程类组分注释结果表明,CVCC68002菌株可能有较强的代谢能力和环境适应能力,为其环境生存和宿主相互作用提供了可能。
2.3.4 KEGG 功能注释
KEGG数据库可从基因组序列和其他分子数据集了解细胞和生物体水平功能
[17]。牛分枝杆菌CVCC68002在 KEGG 功能注释中共有4 069个基因得到注释,在总编码基因占比为98.17%(
图5)。
3种通路在细胞过程类中注释,其中有37个基因在细胞群落-原核生物基因注释中分布,富集明显。其次,有23个基因分布在细胞生长和死亡通路基因注释中,运输与分解代谢注释有11个基因;有2种通路在环境信息处理类中注释,其中注释量最为明显的分布于膜运输相关基因中,共有84个,比例达到55.63%;有67个基因分布在信号转导通路注释中;4种通路在遗传信息处理类中得到注释,其中翻译通路有80个基因富集,数量最多;12种通路在人类疾病类中注释,其中有18个细菌感染性疾病通路相关基因,占比最高;抗菌耐药性通路有14个注释基因。有12 种通路在代谢类中注释,氨基酸代谢和碳水化合物代谢通路中基因数分布较多,分别为219个和205个基因;6种通路在生物系统类中注释,其中内分泌系统相关基因数最为明显,为18个。推测CVCC68002菌株体内糖类及氨基酸分解和代谢能力较强。人类疾病类通路中可以看出该菌株具有较强的致病性,并具有一定的耐药性。信号转导及膜运输相关基因注释量较高,并且主要分布于双组分系统和ABC 转运蛋白,该菌株可能具有较强的外界环境适应能力。
2.3.5 GOG 功能注释
COG数据库由NCBI创建并维护的蛋白数据库
[18]。通过比对将某个蛋白序列注释到某个COG中从而推测该序列的功能。GOG 数据库按功能可分为23类,牛分枝杆菌CVCC68002 GOG功能注释中共有3 007个基因注释,占总编码基因数的 72.55%(
图6)。图中可知有284个一般功能预测基因,富集最为显著,其次是脂类转运与代谢基因注释为299个,转录基因注释为 222 个,次级代谢产物的生物合成,转运与代谢共有基因数216个;有213个基因在氨基酸转运与代谢和辅酶转运与代谢注释中,推测该菌株可能对脂类、氨基酸等转运和代谢能力较强。能量产生与转化、核糖体的结构与生物的合成、无机物的转运代谢、碳水化合物的转运与代谢、细胞壁,细胞膜,胞外被膜生物合成、信号的转导机制、抵御机制、翻译后修饰,蛋白质转换,伴侣以及复制,重组和修复基因注释也相对较多,分别为197个、193个、166个、146个、145个、142个、138个、134个和107个。说明该菌株可能具有较强的生物膜形成能力,并能够抵抗外界不良环境,为其稳定的致病性提供必要条件。
2.3.6 TCDB注释
TCDB属膜转运蛋白数据库,包括离子通道、转运蛋白和相关辅助因子等分类系统
[19]。在CVCC68002菌株TCDB 注释结果中,主要主动转运蛋白和电化学势驱动转运蛋白的注释基因数量最高,分别为158个和60个(
图7)。根据结合膜运输通路基因的高注释结果,可以推测该菌株的运输方式以主动转运为主、离子通道运输为辅。
2.3.7 CAZy 注释
CAZy属于碳水化合物酶相关数据库,包括催化碳水化合物降解、修饰及生物合成等酶系家族
[20]。牛分支杆菌CVCC68002编码基因在CAZy数据库注释结果(
图8)可知,其中糖基转移酶注释量最高,可达54个,其次糖苷水解酶注释量较高。糖基转移酶的功能是催化糖类物质或者非糖物质连接糖基或者交换糖基,从而将底物糖基化。当聚糖与蛋白质共价结合生成蛋白聚糖或糖蛋白的底物,从而执行细胞中特定的生理过程
[21]。糖苷水解酶是一类水解糖苷键的酶类,并参与糖代谢通路中多糖水解过程。在糖苷水解酶作用下进行糖代谢过程中释放的大量能量,可为菌体生命活动提供能量。
2.4 分子进化分析
用于比较分析的牛分枝杆菌CVCC68002和其他菌株基因组均为单一拷贝,经多序列比对后构建全基因组进化树(
图9)。结果表明,系统发育树主要分成3个分枝,NZ.CP27035.1为一个分枝,CVCC68002为单独一个分支,其余9个菌株为第三分枝,牛分枝杆菌CVCC68002在进化上与其他菌株的亲缘关系较远。
2.5 致病性分析
2.5.1 病原与宿主互作数据库(PHI)注释
PHI是病原宿主互作数据库
[22],对有关药物干预靶基因的研究非常重要
[23]。PHI表型突变类型基因数目如
图10所示,突变后毒力降低相关的基因数最多,为137个;其次是毒力增加(高致病性)的突变基因,为100个,突变后不影响其致病性的基因数也较为显著,可达58个,而突变后致病性丧失的基因数有8个,致死基因数为7个,效应因子突变类型耐化学药物突变类型的靶基因数量都为2个。这些突变类型所突变的靶基因个数和位置已经研究明确,对该菌株后期的深入研究提供了重要的理论基础。
2.5.2 毒力因子注释
VFDB是研究致病细菌、衣原体等致病因子的数据库,可提供毒力基因物种信息、基本特征描述,及毒力基因功能和致病机制的细述
[24],通过VFDB注释分析,得到456个基因注释量,主要涉及细菌黏附、定殖、细菌逃避宿主免疫防御系统、分泌系统蛋白和转录因子等(
表6)。通常细菌一旦到达宿主体内,吞噬细胞会迅速反应进行捕捉并消灭病原体,但由于逃逸宿主免疫防御系统的毒力因子的存在,能帮细菌免于免疫防御系统的清除。细菌对宿主细胞的黏附与其自身存在的特殊结构或者某些蛋白密切相关。牛分枝杆菌中存在的部分毒力因子可能会介导其侵袭宿主内部,可能通过抑制补体介导的吞噬作用、促炎反应、增加菌体对宿主靶细胞的黏附作用。从测序结果看出毒力因子数量较多,该菌株具有较强的致病性。
2.5.3 耐药基因注释
ARDB结果中注释到7种耐药基因(
表7),
aac基因编码蛋白表现为奈替米星、妥布霉素、6_奈替米星、地贝卡星、庆大霉素耐药耐药,vanrb编码蛋白表现为万古霉素耐药,其他4种分别变现为青霉素、甲氧苄啶、qa_化合物、氟喹诺酮耐药。CARD注释到28个结果(
表8),包括多种抗生素抗性基因,包括多胺类抗生素、异烟肼、磷霉素、氨基香豆素素、吡嗪酰胺、氟喹诺酮等。多胺类,氟喹诺酮和吡嗪酰胺类的抗性蛋白注释量较高,推测牛分支杆杆菌CVCC68002可能对这些抗生素表达抗性。除此之外,外排泵抗性蛋白注释量也非常显著,推测细菌可能通过外排抗性蛋白将药物外泵,从而达到保护自身产生耐药性。研究发现,结核分枝杆菌外排泵蛋白是由巨噬细胞诱导产生,也是其菌体毒力决定因素,再诱导过程中抗菌肽可能是作为重要底物起作用
[25]。
3 讨论
牛结核病是由牛分枝杆菌(
Mycobacterium bovis)和结核分枝杆菌(
Mycobacterium tuberculosis)引起的一种慢性消耗性兽共患传染病,全球每年因该病造成的经济损失高达30亿美元
[26],2017年,估计新增结核病病例1 000万例,死亡160万例,虽然这些病例中的大多数是由结核分枝杆菌引起的,但约有142 000例新病例和12 500例死亡是由牛分枝杆菌引起的
[27]。由于乳制品,牛肉等与人们的生活息息相关,因此牛结核病对人类健康的危害性也是毋庸置疑。为了根除结核病,有必要确定新的化合物和药物靶点,这些化合物和靶点在耐药结核分枝杆菌菌株中发挥更快的作用并表现出活性
[28-29]。因此,为进一步对牛分枝杆菌的抑菌机理,致病性,耐药性等方面做深入研究,对该菌株做全基因组测序并对其进行基因功能注释和生物信息分析是基础和前提。
牛分枝杆菌CVCC68002基因组全长为4 357 100 bp,得到4 145个编码的基因,而已测序的两株结核分枝杆菌北京基因型菌株CCDC5079和CCDC5180全基因组大小分别为4 414 324 bp和4 414 344 bp,预测的编码基因数分别为4 158个和4 161个
[30],相比而言,CVCC68002菌株基因组和编码基因数有所降低。结合分析结果,推测牛分支杆菌感染宿主后,可能对糖类,脂质和氨基酸的分解和代谢能力较强。利用糖基转移酶使底物发生糖基化,从而发挥特定的生物功能,糖苷水解酶对多糖的水解,有助于自身摄取能量。但是糖苷水解酶不仅只是发挥降解多糖的作用,有研究发现糖苷水解酶的缺失会导致α-麦芽糖1-磷酸(M1P)毒性水平的快速累积,从而在细胞内引发多效性应激,导致细胞在大约两周内死亡
[31]。糖基转移酶的作用下帮助合成细胞膜上的脂多糖,并参与分枝杆菌细胞壁的生物合成
[32],并且糖基转移酶的突变或者确实会导致结核分枝杆菌对乙胺丁醇的耐药性
[33]。因此糖基转移酶和糖苷水解酶在结核菌生长,毒力,抗生素耐药性的产生等方面都发挥非常重要的功能。在后续新药的开发过程中,可对蛋白聚糖所对应的糖基转移酶位点定位,并作为药物靶点进行研究。
目前没有证据表明牛分枝杆菌不存在一种细胞器作为粘附素极性聚集的结构发挥黏附作用,推测牛分枝杆菌粘附素可能以膜蛋白的形式分布在表面
[34-35]。与强毒株相比,低致病性或非致病性菌株的粘附性显著降低
[36]。牛分枝杆菌中关于EF-Tu介导的黏附作用目前还没有报道,但是有研究发现猪肺炎支原体不仅通过调节活性因子H可帮助支原体逃避补体杀伤,而且可通过EF-Tu增加猪肺炎支原体与猪气管上皮细胞的粘附逃避补体激活
[37]。目前发现结核分枝杆菌中许多分泌系统蛋白与抗原变异和免疫逃避有关,包括典型VII型或ESX分泌系统分泌蛋白,
esx基因簇是由
esx-1至
esx-5的5个拷贝组成,VII型分泌系统研究最广泛的
[38-40]。体内感染模型显示,缺五种
esx⁃5编码的PE和PPE蛋白(PPE25、PPE26、PPE27、PE18和PE19)的结核分枝杆菌缺失突变体在严重联合免疫缺陷小鼠模型和具有免疫能力的小鼠中均表现出弱毒力,推测
esx-5相关的PE和PPE蛋白可能在结核分枝杆菌的致病潜力中起着至关重要的作用
[41-42]。另外,有研究对牛分枝杆菌AF2122/97与结核分枝杆菌H37Rv编码的PEP蛋白进行分析,发现二者共编码28个PPE蛋白
[43],牛分枝杆菌CVCC68002编码的毒力因子分泌蛋白数量最多可达102个,其中属于PPE蛋白家族的PPE蛋白有44个,PPE蛋白数量较H37Rv菌株和AF2122/97菌株数量明显较高。在后续牛分枝杆菌致病性研究过程中,可对菌体内相关分泌蛋白定位,并作为靶点进行深入研究。
结核分枝杆菌耐药性的产生机理与其药物耐药相关基因突变有关,也与双组分系统高表达量及外排泵的过量表达紧密相关
[44-45]。双组分调节系统(TCSs),高度保守在原核生物中,细菌通过调节一系列毒力因子,对病原菌在恶劣环境中的生存至关重要
[46-47]。细菌可以使用多种TCS感知、传递物理、化学和营养条件和相应的响应。TCS可能成为新型抗生素的靶标
[48]。成对双组分系统的自磷酸化是细菌对不同刺激作出反应的主要手段
[49]。双组分系统通过调节外排泵表达或改变细胞壁通透性参与结核分枝杆菌的多药耐药性
[50]。一般新抗结核药物一开始的治疗效果较好,但是由于结核分枝杆菌耐药机制的形成,导致抗结核药物长期使用的效果并不明显。通过分析发现7种耐药基因,28种抗生素抗性基因,在后续对该菌株的预防,抗结核药物靶点的发现,抗结核药物机制筛选等方面提供一定的参考。
细菌利用不同的互补机制来抵抗不同抗生素化合物的作用。这些包括抗生素的改变或破坏,抗生素靶点突变、抗生素膜通透性降低和过度表达射流泵的设计
[51]。根据序列同源性,细菌的外排泵被分为五个超家族,ATP结合盒(ABC)超家族,主要促进剂超家族(MFS),多药和有毒化合物挤压家族(MATE),即抗结瘤细胞分裂超家族(RND)和小型多药耐药家族(SMR)—5个家族的成员都与该病毒有关对不同抗生素的耐药性
[52]。结核分枝杆菌基因组编码多种不同的外排转运蛋白,其中大量主要是ABC和MFS超家族蛋白与耐药性有关
[53-54]。Braibant等人估计编码ABC超家族转运体的基因约占结核分枝杆菌基因组的2.5%
[55]。药物外排泵蛋白在结核分枝杆菌耐药过程中起着关键性作用。可将结核分支杆菌相关蛋白作为靶点,对后续结核分枝杆菌的耐药性研究方面设计有效方法,克服结核病的外排介导的耐药性。综上所述,为开发抗牛分枝杆菌药物及其耐药性奠定详细的背景信息,对后续结核分枝杆菌的深入研究具有重要意义。
4 结论
本研究从基因组层面对该菌株的基因功能进行了全面分析:(1)牛分支杆菌CVCC68002具有糖类代谢过程相关的酶和蛋白,具有较强的糖类、脂类、氨基酸分解和代谢功能,并且有丰富的双组分系统和ABC 转运蛋白,推测该菌株在宿主体内具有较强的环境适应及生存能力。(2) 根据对该CVCC68002菌株毒力因子注释结果分析,推测该菌株较易形成生物膜并黏附宿主细胞,生物膜的形成能够帮助菌体自身抵抗不利的外界环境因素,有利于寄生宿主体内,为其稳定的致病性提供必要条件;该菌株进入宿主体内后,可能通过对宿主细胞识别并调控表达相关膜蛋白、分泌系统蛋白、EF-Tu蛋白和clpC蛋白等黏附因子,使菌株对宿主细胞表面的黏附更加牢固,细菌黏附作用利于其对宿主防御系统的逃逸并牢固在宿主体内定植,并参与免疫调节,对于分枝杆菌在宿主体内的生存至关重要。(3)由于CVCC68002菌株具有多种抗生素抗性和耐药性,但是对利福平没有耐药性和抗性,因此可为后期进行抗菌抑菌实验的研究提供重要理论依据。(4)该菌株表达多种毒力因子,并对外界环境适应性强的特性,说明该菌株致病性较强。