椎间盘退变(intervertebral disc degeneration,IDD)是一种消耗大量医疗资源的慢性退行性疾病
[1]。IDD导致的椎间盘结构变化和脊柱不稳定,是背部疼痛、外周神经压迫症状以及椎管狭窄发生的主要原因
[2]。根据流行病学调查显示,坐骨神经痛(腰椎外周神经压迫症状)在全球范围内的发病率为1%~5%,其终生患病率高达43%,而80%的人一生中至少会受到1次腰痛的影响,这些现象不仅导致了严重的医疗负担还严重影响人们的生活质量
[3-5]。虽然许多腰痛和坐骨神经痛患者的疼痛症状在早期接受治疗的数周内明显减轻
[6]。但是,1项报告显示,45%的腰痛和坐骨神经痛患者1年后的残疾状况没有明显改善
[7],同时34%患者的症状在2年后转化为慢性疼痛
[8]。遗憾的是,目前IDD的病理生理机制尚不完善,并且缺少有效的诊断标志物。
MicroRNA是基因调控网络中的重要组成部分,主要通过与其靶基因的互补3’非翻译区来抑制该基因的表达。大多数MicroRNA在物种间具有高度保守性,同时其表达也具有空间、时间、组织和细胞类型特异性
[9-10]。大量证据表明,MicroRNA通过介导髓核细胞的增殖、凋亡以及细胞外基质重组,在IDD中发挥着关键作用
[11]。研究显示,has-miR-21在IDD组织中表达上调会导致髓核细胞的异常增殖和细胞簇形成进而导致IDD的发生发展
[12]。另1项研究表明has-miR-155可以通过下调细胞凋亡关键蛋白(Caspase3,CASP3)和磷酸化Fas相关死亡结构域蛋白(fas associated via death domain,FADD)来抑制髓核细胞凋亡,但该MicroRNA在IDD组织的髓核细胞中明显下降
[13]。此外,椎间盘细胞外基质重组也是IDD发生的重要原因,研究显示has-miR-377与该过程密切相关
[14]。总之,挖掘并探索MicroRNA在IDD中的生物学功能,可以提供更多IDD相关分子机制的理论依据,并为IDD的诊断和精准治疗带来契机。
随着多学科的交叉融合以及测序技术的进步,基于计算机科学和测序数据,研究者们对疾病的病理生理学机制有了更为深入的了解。孟德尔随机化是一种因果推断方法,通过遗传变异评估暴露因素(疾病、基因/蛋白表达、代谢产物和肠道菌群等)与临床结局之间的因果效应
[15]。该方法可以在很大程度上避免大多数混杂因素对结局的影响,因此被广泛应用
[16]。本研究获取MicroRNA、IDD及其相关疼痛症状的全基因组关联研究(genome-wide association studies,GWAS)数据和微阵列芯片数据,利用孟德尔随机化和生物信息学分析,挖掘出1个新的MicroRNA(has-miR-204-5p),揭示了IDD的一种新的病理生理机制,为后续的精准治疗提供新的思路。
1 资料与方法
1.1 数据获取
从1篇已发表的文献中获取75种MicroRNA的顺式表达数量性状位点(cis-expression quantitative trait locus,cis-eQTL)GWAS数据
[17];从GWAS Catalog数据库中下载背部疼痛(GCST90018797)和腰椎外周神经压迫症状(坐骨神经痛,GCST90044614)的GWAS数据。从GEO数据库((
www.ncbi.nlm.nih.gov/geo/)中下载IDD组织的MicroRNA(GSE116726)和mRNA(GSE23130)微阵列芯片数据,并对其进行背景矫正,标准化和探针注释。
1.2 孟德尔随机化分析
为筛选出合适的工具单核苷酸多态性(single nucleotide polymorphism,SNP),本研究进行了如下操作:①选择与MicroRNA表达量明显相关的SNP(
P<1×10
-5);②去除cis-eQTL中的SNP连锁不平衡,阈值设为:
r2<0.3,kb=500;③剔除
F统计值小于10的弱工具变量避免发生偏倚;④使用IEU OpenGWAS project数据库(
https://gwas.mrcieu.ac.uk)剔除与结局具有显著相关性的混淆因素。
为评估MicroRNA与IDD相关疼痛症状间的因果效应,本研究采用双样本孟德尔随机化分析,以逆方差加权法 (inverse-variance weighted,IVW)作为分析的主要指标。同时,结合MR-Egger法、加权中位数(weighted median)、加权模型(weighted mode)和简单模型(simple mode)算法对结果进行补充。在某一MicroRNA结果中,当5种算法的效应方向不一致时,则该MicroRNA不纳入后续分析。随后,基于Cochran’s Q检验评估变量间异质性以及MR-Egger-Intercept检验和MR-PRESSO检验评估变量间水平多效性,旨在对分析结果进行敏感性分析。
1.3 关键MicroRNA和靶基因的鉴定
首先,对GCST90018797和GCST90044614的孟德尔随机分析结果中的明显MicroRNA取交集。然后,使用Limma R包对GSE116726数据集进行正常样本和IDD样本间的MicroRNA差异表达分析,并将阈值设为:|LogFC|>1.5和P< 0.05。接着,使用multiMiR R包探索差异MicroRNA的靶基因,该软件包整合了来源于miRecords,miRTarBase,and TarBase数据库中MicroRNA及其靶向靶基因的相关数据,为探索MicroRNA在疾病中的分子机制提供了极大便利。同时,这些数据均从已发表的文献中收集整理,具有可靠性。随后,对GSE23130进行差异表达分析,相关阈值与上述一致。最后,将MicroRNA靶基因和差异表达基因进行交叉分析,旨在挖掘出关键靶基因。
1.4 关键靶基因的生物学功能富集分析
基于GeneMANIA数据库(
https://genemania.org/),对关键靶基因和20个与其密切相关的基因进行生物功能富集分析并构建蛋白互作 (protein-protein interaction,PPI) 网络。
1.5 统计学方法
本研究主要基于R软件(V 4.3.2)进行分析,相关图形由ggplot2 R包进行绘制。除外特殊说明。检验水准α=0.05。
2 结 果
2.1 关键MicroRNA的鉴定
孟德尔随机化分析结果显示,6种MicroRNA对背部疼痛(GCST90018797)具有因果效应,5种MicroRNA对坐骨神经痛(GCST90044614)具有因果效应(
图1),这些结果均通过了敏感性分析,具有可靠性。其中,2种MicroRNA(has-miR-125b-5p和has-miR-204-5p)在2个数据集中均有因果效应(
图2A)。但是,因果效应散点图显示has-miR-125b-5p在2个数据集中具有不同的因果效应,同时其在GCST90044614结果中的5种因果效应评估算法也不具有一致性,遂予以剔除(
图2B)。因此,has-miR-204-5p被鉴定为关键MicroRNA,并且在缓解IDD相关疼痛症状中发挥作用。
2.2 关键靶基因的鉴定
GSE116726差异分析结果显示,has-miR-204-5p在IDD组织中明显低表达(
图3A),而在其891个靶基因中,有3个基因(Ⅲ型胶原蛋白α1链(collagen type Ⅲ alpha 1 chain,COL3A1),核糖体蛋白侧柄亚基P1(ribosomal protein lateral stalk subunit P1,RPLP1)和转录因子4(transcription factor 4,TCF4)在GSE23130数据集中的IDD组织中明显高表达(
图3B~D)。这些证据显示,has-miR-204-5p在IDD组织的低表达会导致COL3A1,RPLP1和TCF4的表达上升,进而导致IDD及其相关疼痛症状的发生。
2.3 关键靶基因的生物学功能富集分析
GeneMANIA数据库主要基于物理学相互作用(physical interactions)、共表达(co-expression)、预测(predicted)、共定位(co-localization)、通路(pathway)、基因相互作用(genetic interactions)和共享蛋白结构域(shared protein domains)等方式筛选出与目标基因密切相关的20个基因并进行生物学功能富集分析和PPI网络构建。PPI网络结果显示,COL3A1主要富集在胶原蛋白上,RPLP1主要富集在核糖体上,而TCF4主要参与Wnt信号通路的调控(
图4A~C)。
3 讨 论
近年来,尽管经过大量的临床和基础研究,IDD的相关机制仍不清楚,阻碍了该疾病治疗策略的发展。本研究首次利用MicroRNA的cis-eQTL数据进行与背部疼痛和坐骨神经痛的孟德尔随机化分析,发现has-miR-204-5p与IDD相关疼痛症状呈负相关,并且分析结果均通过了异质性和水平多效性检验,证实了研究结果的可靠性。同时,生物信息学分析结果显示IDD组织中has-miR-204-5p的表达降低会导致COL3A1,RPLP1和TCF4的表达水平升高。这些证据揭示了一种IDD及其相关疼痛症状发生的新机制。
COL3A1编码的Ⅲ型胶原蛋白主要存在于皮肤、血管、肺和肠道等可伸展结缔组织中,与包括IDD在内的多种疾病密切相关,如肾病、主动脉瘤、埃勒斯-当洛斯综合征和肿瘤
[18-21]。研究表明,Ⅲ型胶原蛋白在IDD组织中的表达上调约3.25倍
[22],并且在髓核和纤维环也观察到其表达的增加
[23]。同时,也有证据显示,COL3A1在IDD组织中明显高表达,并且与腰痛密切相关
[2,24]。正常情况下,椎间盘细胞外基质处于一种平衡状态,但这种平衡在IDD中被打破,主要表现为胶原蛋白类型改变和蛋白聚糖含量减少,最终导致组织完整性丧失和相关症状出现
[25]。本研究发现,在IDD组织中,has-miR-204-5p的低表达会导致COL3A1的表达上调。这可能促使Ⅲ胶原蛋白的异常增加,进而影响椎间盘细胞外基质的平衡状态,最终导致IDD的进展。但这一复杂的分子机制仍不明确,值得后续深入探索。
RPLP1编码的蛋白是核糖体60S大亚基的重要结构成分,在神经系统发育过程中扮演着至关重要的角色,并且在肿瘤领域受到广泛关注
[26-27]。RPLP1在IDD组织中的高表达表达可能会导致核糖体功能异常并影响胶原蛋白、基质金属酶、组织蛋白酶等椎间盘高度相关蛋白质的表达水平,进而导致IDD的发生发展,其相关机制需在后续的研究中进行探索和验证。
TCF4编码的转录因子4在人体组织中广泛表达,并且在神经系统发育中发挥重要作用。同时,该基因与精神分裂症、福克斯内皮性角膜营养不良、原发性硬化性胆管炎和肿瘤等疾病密切相关
[28]。研究表明,TCF4是Wnt信号通路转导过程中的重要蛋白,其功能受损会导致Wnt信号传导抑制
[29]。Wnt信号通路与IDD密切相关,是该领域研究最多的信号通路之一。研究表明,Wnt信号通路的激活会抑制髓核细胞增殖、促进髓核细胞衰老和凋亡以及降解髓核细胞外基质,最终导致IDD的发生和进展
[30]。结合之前研究和本研究的结果,本研究提出了一个假设:IDD组织中has-miR-204-5p下调导致TCF4表达上升,激活Wnt信号通路,最终导致IDD的发生发展。因此,has-miR-204-5p/TCF4/Wnt信号轴,很可能是一种新的IDD发病机制,这为后续研究提供了一个全新的理论依据,非常值得后续深入研究。
当然,本研究存在着一定的局限性。首先,由于样本量较少,存在着个体间差异,这需要后续的大规模队列验证。其次,本研究未进行基础实验验证,后续需要予以补充以加强研究结果的可靠性。
总之,本研究基于孟德尔随机化和生物信息学分析,发现has-miR-204-5p在IDD组织中明显低表达会介导COL3A1,RPLP1和TCF4的表达水平异常升高,最终导致IDD及其相关疼痛症状的发生。这一证据揭示了一种新的IDD发生发展机制,为后续研究提供了参考。