再生障碍性贫血(AA)是一种以骨髓增生障碍和全血细胞减少为特征的骨髓造血衰竭(BMF)综合征,其年发病率在我国约为0.74/10万,为西方国家的2~3倍
[1]。AA可分为遗传性和获得性,而获得性再生障碍性贫血又可依据病因已知或未知分为继发性再生障碍性贫血或原发性再生障碍性贫血。继发性再障由可识别的外部因素引起骨髓造血功能衰竭,例如暴露于有毒化学物质、病毒感染或辐射等。诊断排除已知病因后的AA被归为原发性再障,目前认为主要机制涉及免疫功能紊乱介导的造血干细胞损伤和骨髓衰竭。然而,促进造血联合免疫抑制治疗的方案存在疗效慢、易复发、不良反应多等问题
[2],提示原发性再障的难治性和病因复杂性。确切诱发病因通常尚不清楚,因此原发性再障也被称为“特发性”。
自身免疫性疾病(ADs)是一类以免疫系统错误攻击自身抗原为特征,伴随炎症反应、组织损伤以及器官功能障碍的疾病
[3]。本文认为ADs所引发的AA可被纳入继发性再障的范畴,其病因可归纳为一种已知的疾病作为诱因产生致病介质破坏造血过程
[4],而关于致病介质及致病具体机制仍需进一步研究,可能涉及T细胞数量、功能及其亚群的相对比例以及细胞因子水平异常等。然而,在未明确外因的情况下,也可能出现免疫系统异常激活的原发性再障。或许存在直接针对AA发病的特异性自身抗原
[5],而不是由ADs相关免疫紊乱引起。因此,原发性再障也被部分学者认为是一种T淋巴细胞介导的自身免疫性疾病。无论是继发性还是原发性再障,免疫紊乱的现象表明AA与ADs之间可能存在的病因病机联系亟需揭示。
在一项法国AA流行病学的病例对照研究中,有慢性免疫疾病史的患者表现为更高的AA发病率,尤其是类风湿性关节炎(OR=6.8)
[6]。Stalder等
[7]同样表示ADs与AA的发病具有相关性,约10%的AA患者在其一生中会患上伴随性ADs。但有趣的是,他们还发现这种ADs的发生会出现在AA发作之前或之后的任何时间。这暗示了ADs与AA之间或许不存在绝对性的因果关联,AA的发病可能存在区别于某些ADs的独立免疫机制。关于RA合并AA的情况,大多数报道认为AA是使用金盐、非甾体类抗炎药、青霉胺等药物后所致
[8],也有报道认为其与药物无关
[9]。可以说,诸如用药史等混杂因素对ADs与AA因果关联的揭示具有一定程度的干扰。此外,外周血细胞减少在SLE中也较为常见,偶有病例报道SLE患者的骨髓异常,包括AA和骨髓纤维化等,暗示骨髓或许成为SLE的靶器官之一
[10],但尚无临床或组织学特征能够区分原发性再障和SLE相关性再障,仍需进一步研究探索其因果关联。总的来说,ADs与AA的共病可能存在相关联的致病机制——免疫异常或炎症通路的交叉。研究仍处于不断发展的阶段,尚未完全成熟。
尽管国内外已有不少病例报道和观察性研究,但大规模的系统性研究仍然较少,缺乏长期随访研究来评估ADs与AA间的因果关系。同时,临床研究容易存在样本量不足、混杂因素的干扰等问题,影响准确的因果推断
[11]。孟德尔随机化(MR)是一种以遗传变异为工具变量(IV),评估暴露与结局之间因果关联的分析方法。代表暴露与结局的单核苷酸多态性(SNPs)的等位基因遵循孟德尔遗传学定律,能够有效排除混杂因素和反向因果关系的干扰,得到更可靠的因果效应。国内外尚未有研究采用孟德尔随机化从基因层面探究ADs与AA的因果关联,本研究采用孟德尔随机化作为分析方法,排除观察性研究的固有缺憾,探究类风湿性关节炎(RA)、系统性红斑狼疮(SLE)、桥本甲状腺炎(HT)、格雷夫斯病(GD)、溃疡性结肠炎(UC)、克罗恩病(CD)、干燥综合征(SS)、自身免疫性肝炎(AIH)、原发性胆汁性胆管炎( PBC)和原发性硬化性胆管炎(PSC)10种临床常见ADs与AA之间的因果关联,以期为自身免疫性疾病和再生障碍性贫血的发病机制、共病规律提供研究思路,为防治疾病提供新方案。
1 材料和方法
1.1 研究设计
本研究采用两样本孟德尔随机化探讨自身免疫性疾病与再生障碍性贫血之间的因果关联(
图1),参考包含152个病种的美国自身免疫性相关疾病协会(ADAAE)的疾病清单(autoimmune.org)、相关病例报道以及第10版
Williams Hematology[12],以公开的数据库信息为基础,选择RA、SLE、HT、GD、UC、CD、SS、AIH、PBC和PSC为暴露因素,AA为结局变量;反向MR则以AA为暴露因素,RA、SLE、HT、GD、UC、CD、SS、AIH、PBC和PSC为结局变量。选用SNPs作为工具变量,确保其符合3大假设:(1)关联性假设:所选的SNPs与10种ADs显著相关;(2)独立性假设:SNPs仅通过ADs影响结局变量,与任何混杂因素无关;(3)排他性假设:所选择的SNPs不通过其他途径影响结局。首先,选择全基因组显著性阈值为
P<5×10
-8的与每个ADs相关的SNPs作为潜在工具变量组。此外,进行反向孟德尔随机化研究AA对ADs的因果关系。
1.2 数据来源
本研究使用的ADs和AA的全基因组关联研究(GWAS)的汇总统计数据主要来自IEU Open GWAS Project(
https://gwas.mrcieu.ac.uk/)和FinnGen Consortium(
https://r10. finngen.fi/)。ADs相关数据包括RA 153 457例(病例/对照=6236/147 221)、SLE 307 587例(病例/对照=1083/306 504)、HT 395 640例(病例/对照=15 654/379 986)、GD 412 181例(病例/对照=3176/409 005)、UC 411 317例(病例/对照=4320/210 300)、CD 411 973例(病例/对照=2033/409 940)、SS 214 435例(病例/对照=1290/213 145)、AIH 485 234例(病例/对照=821/484 413)、PBC 307 113例(病例/对照=609/306 504)、PSC 363 484例(病例/对照=1843/361 641),AA数据为 473 500例(病例/对照=4128/469 372)。具体信息详见
表1。
1.3 工具变量的选择
为确保ADs与AA之间潜在因果关系的可靠性,我们从GWAS汇总统计数据中筛选得到的IV需满足三大假设。首先,选择全基因组显著性阈值为P<5×10-8的与每个ADs相关的SNPs作为潜在工具变量。其次,对以上工具变量进行连锁不平衡(LD)检验,阈值设定为r2<0.001,聚集距离kb>10 000。此外,为避免弱IV造成的偏倚,筛选F>10的SNPs以量化IV强度并表示其强相关性,F统计量的计算公式为:
其中,N代表样本量,K代表IV的数量,R
2代表IV所解释的暴露方差
[13]。R
2的计算公式为:
其中,EAF指效应等位基因频率,β代表暴露的效应大小。在EAF数据缺失的情况下,则用公式:
来计算R
2[14]。再利用LDlink数据库(ldlink.nih.gov)剔除(win_size=5×10
5,r
2=0.8,Pop=EUR,Build=37)与选定SNPs相关的潜在混杂因素。最终筛选得到与暴露因素强相关且相互独立的SNPs。在该标准下筛选所得SNPs过少时,将其全基因组显著性阈值放宽为
P<1×10
-5。
1.4 孟德尔随机化及统计学分析
本研究中所有数据均使用R4.4.0版本进行分析,主要涉及“TwoSampleMR”、“MR-PRESSO”程序包。IVW假设所有SNPs均为有效的工具变量,能够汇总GWAS数据并提供最准确的估计
[15],故将其作为主要分析方法,MR Egger法、Weighted Mode法、Weighted median法和Simple Mode法则作为补充分析方法,以增强结果的稳健性。采用Cochran's Q检验潜在的异质性,若
P<0.05,则SNPs之间存在显著的异质性,需采用IVW随机效应模型进行因果推断。多效性分析采用pleiotropy函数和MR-PRESSO进行检验
[16],当
P>0.05,则提示不存在水平多效性,结果稳健;当
P<0.05时,剔除引起多重水平效应的异常值,重复分析。留一法用于敏感性分析,以评估SNPs对于因果关系是否存在单一驱动效应。结果采用比值比(OR)和95%置信区间(95%
CI)来表示,为进行多重比较调整,我们采用FDR(Benjamini-Hochberg False Discovery Rate)法进行校正,所得
P. adjust值低于0.05则被认为差异具有统计学意义。
2 结果
2.1 工具变量筛选结果
根据所建立的标准,最终得到剔除连锁不平衡(r2<0.001,10 000 kb)和回文结构的与10种ADs显著相关(P<5×10-8)的无混杂因素SNPs:RA 8个、SLE 5个、HT 7个、GD 11个、UC 5个、CD 8个、SS 4个、PBC 3个,其中,AIH与PSC在该标准下筛选得到的SNPs过少,故将其阈值放宽为P<1×10-5,得到AIH 25个、PSC 16个。在进行反向MR时,将AA作为暴露因素提取SNPs时,同样需将P值放宽为P<1×10-5。最终得到RA 18个、SLE 14个、HT 19个、GD 14个、UC 18个、CD 14个、SS 18个、AIH 19个、PBC 12个、PSC 12个。筛选所得的SNPs均满足F>10,不存在弱工具变量偏倚。
2.2 ADs对AA的因果影响
根据ADs与AA的IVW分析显示,遗传预测的RA(OR=1.094,95%
CI:1.023-1.170,
P=0.009)、SLE(OR=1.111,95%
CI:1.021-1.208,
P=0.015)、HT(OR=1.206, 95%
CI:1.049-1.387,
P=0.009)、GD(OR=1.083,95%
CI:1.001-1.171,
P=0.048)和SS(OR=1.173,95%
CI:1.054-1.306,
P=0.004)可能增加AA的发病风险。在Weighted median分析中也观察到类似的结果,支持RA、SLE、HT、SS与AA之间正向因果关联的稳健性。经FDR多重检验校正后,仍支持RA(
P. adjust=0.042)、SLE(
P. adjust=0.036)、HT(
P. adjust=0.029)、SS(
P. adjust=0.035)与AA的因果关联,不支持GD与AA的因果关联(
P. adjust=0.097)。但本研究未发现UC、CD、AIH、PBC、PSC与AA之间存在因果关系(
图2,
表2)。
Cochran's Q检验提示SS可能存在轻微异质性(IVW
P=0.098, MR egger
P=0.043),在SS相关的漏斗图中得到可视化的说明(
图3),采用IVW随机效应模型进行MR分析,所得结果仍然支持SS与AA间的因果关联(
P<0.05)。同时,MR egger截距显示不存在水平多效性(
P=0.957),MR-PRESSO也得出了同样的结论(
P=0.254)。经Cochran's Q检验、MR egger截距和MR-PRESSO全局检验得出,在其余所有ADs中均不存在异质性和水平多效性(
P>0.05)。由于PBC的IV较少,无法进行MR-PRESSO检验,因此我们以heterogeneity检验为准(
表3)。
散点图提示RA、SLE、HT和SS 4种ADs会增加AA的发病风险(
图4)。留一法显示无异常SNPs对结果产生影响(
图5),进一步证实了结果的稳定性。
2.3 AA对ADs的因果影响——反向MR分析
将AA作为暴露,10种ADs的发病风险作为结局,分别得到相应SNPs有RA 18个、SLE 14个、HT 19个、GD 14个、UC 18个、CD 14个、SS 18个、AIH 19个、PBC 12个、PSC 12个,5种分析方法均未发现显著的因果关联(P>0.05)。Cochran's Q检验显示SLE(MR Egger,P<0.001; IVW,P<0.001)、GD(MR Egger,P<0.001; IVW, P<0.001)、SS(MR Egger,P=0.002; IVW,P<0.001)和PSC(MR Egger,P=0.001; IVW,P=0.001)具有不同程度的异质性。
MR egger截距未显示出水平多效性,而MR-PRESSO分析发现SLE(rs3094680,rs7657126)、GD(rs3094680)、SS(rs3094680)、PSC(rs3094680)存在的异常值,剔除异常值后MR分析显示AA可能对SS存在微弱的因果关联,然而随后的FDR校正否定了上述结论(P. adjust=0.491>0.05)。利用LDlink检验所有SNPs未发现相关混杂因素。
3 讨论
大量观察性研究以及相关的病因学表明,自身免疫性疾病与再生障碍性贫血在病理上具有微妙而复杂的关系。尽管通过流行病学研究一定程度上说明了ADs与AA的关联
[6],但观察性研究极易受到混杂因素和反向因果关联的干扰。为此,我们采用双向孟德尔随机化探究ADs与AA之间的潜在因果关联。分析结果表明,遗传预测的RA、SLE、HT和SS与AA的发病风险呈正相关,提示患有RA、SLE、HT和SS的AA发病风险将分别增加约0.09、0.11、0.21、0.17倍。然而,我们的分析并不支持GD、UC、CD、AIH、PSC和PBC的遗传易感性与AA风险增加之间存在因果关系。此外,一系列的敏感性分析、多重校验和反向MR能够确保我们研究结果的稳健性和可靠性。
RA、SLE、SS的共同特点体现在同属于慢性全身性免疫介导的炎症性疾病,因而促成AA的一种可能机制是长期持续的炎症状态。在免疫介导的AA小鼠模型中,长期暴露于炎症导致造血干细胞(HSCs)功能和自我复制受损,显著加速造血衰竭
[17]。RA虽然以关节病变为主,但其炎症状态能够累及全身。有研究支持RA患者骨髓具有炎性病变,存在IL-1、IL-6等炎症因子的升高、TNF表达增强以及骨髓环境中T、B细胞的异常免疫反应
[18]。同样的,SLE患者的造血功能缺陷似乎与骨髓微环境的功能缺陷有关,至少部分是骨髓中存在的自身反应性淋巴细胞所致
[19]。这可能是由于炎症在AA发病过程中发挥了一定程度的推动作用,大量炎症因子通过破坏的组织侵入骨髓,改变骨髓微环境,攻击HSCs并抑制其造血功能。SS也是一种可累及全身的免疫介导炎症性疾病。一项28例原发性干燥综合征(pSS)并发贫血的临床研究指出,AA在pSS中的发病率约为7%
[20]。然而,全球范围内相关研究多为个案报告及病例分析,仍需进行更多的大规模研究来进一步证实SS与AA的因果关联。需要注意的是,临床上抗炎药的使用如阿司匹林、布洛芬、萘普生等,反而有诱导AA发生的可能
[21],在治疗相关疾病过程中应当予以重视。未来研究的方向或许可以考虑开发调控炎症缓解AA进展的治疗方案,以最大限度减少副作用,增强治疗效果。
有研究表示,HT可能通过免疫途径(包括IL-6、IL-17、IL-23、TNF-α、IFN-γ等细胞因子在骨髓中发挥作用)促进破骨细胞生成、抑制成骨细胞分化,导致骨髓微环境改变,从而影响骨的造血功能和免疫反应
[22]。同样的,SS固有免疫的紊乱也可体现在各种细胞因子水平的变化,特别是IFN-γ。SS患者的Th1细胞和血清中能检测到IFN-γ水平的升高,而IFN-γ可持续参与并扩大炎症反应和组织损伤、改变骨髓微环境、抑制造血细胞生成发育,最终引起进行性病变诱导造血衰竭
[23]。其潜在发病机制可能起始于B细胞和T细胞对自身抗原Ro/SSA和La/SSB等的异常免疫反应,自身抗原的暴露又导致受损的上皮细胞大量释放细胞因子进入循环中。而高水平的循环IFN-γ可能会增加AA的发病风险,暗示了IFN-γ作为AA潜在治疗新靶点的可能性
[24]。此外,IFN-γ还可以促进T细胞的增殖以及向Th1细胞和Th17细胞的分化,串扰适应性免疫系统,促进SS疾病进展并介导Fas/FasL途径使得造血干细胞凋亡。IFN-γ水平在RA和SLE患者中同样会出现异常:研究发现,RA患者滑膜中的CD8
+T细胞能够产生大量的 IFN-γ
[25];SLE患者血清中IFN-γ水平比健康个体高,且活动组IFN-γ水平高于稳定组
[26],推测IFN-γ在SLE进展过程中发挥一定的作用。IFN-γ或许能成为AA合并相关ADs的重要治疗靶点,为临床治疗提供新思路。
AA的主要发病机制通常与T淋巴细胞异常活化相联系,B淋巴细胞在AA发病中的作用则容易被忽视。B细胞作为抗体生产者,在RA骨髓中的异常激活能够产生类风湿因子(RF)和IgM抗瓜氨酸肽抗体(ACPAs),在RA的发病中起到关键作用。虽然在AA中尚未找到特异性自身抗体,但既往研究检测到的AA相关自身抗体在ADs中也有所发现
[5],例如抗moesin蛋白抗体在RA、SS患者和AA患者中存在
[27-29]。有研究强调了B调节性细胞(Bregs)而非T调节性细胞(Tregs)在AA发展中的作用:AA患者Bregs的数量在血液和骨髓中减少,免疫反应抑制作用减弱,这可能导致T细胞不受控制的免疫激活,从而造成骨髓衰竭
[30]。而Bregs的功能失调会导致RA、SLE的发生发展和持续存在
[31,32],可能会通过免疫反应的过度刺激,增加继发性再障的发病风险。B细胞在AA中多扮演辅助性角色,但可能在某些情况下对继发性再障的发展发挥重要作用。
作为AA发病的关键因素之一,T细胞趋化因子CXCR4在许多ADs中扮演着重要的角色,它能促使T细胞其向天然配体CXCL12迁移
[33]。在SS小鼠的唾液腺和泪腺中,CXCL12表达上调,介导T细胞向自身免疫靶点的迁移
[34]。有意思的是,CXCL12又在骨髓基质细胞中强烈表达,且在AA小鼠中抑制CXCR4表达或上游NF-kB信号能够减少T细胞归巢到骨髓
[35]。因此,SS介导AA发病的可能机制是:患者外周循环中上调的T淋巴细胞在CXCR4的作用下向CXCL12迁移,造成骨髓T淋巴细胞浸润。此外,在RA患者的血清和关节滑液、SLE患者外周血多个白细胞亚群中也发现了CXCR4随病情进展的高表达
[36,37]。同时,SLE患者骨髓中CXCL12水平越高,疾病活动指数也越高
[38]。升高的CXCL12可能吸引更多的CXCR4+T细胞进入骨髓,从而推动SLE的进展乃至骨髓衰竭。CXCR4与配体间的相互作用在介导T细胞迁移过程中发挥重要作用,异常的趋化因子信号可以通过介导T细胞浸润到靶组织而导致自身免疫性疾病,但具体的趋化因子、受体和T细胞群体在不同的ADs中的表达程度、作用机制有所差异。在我们的研究中,并未发现GD、UC、CD、AIH、PBC和PSC与AA之间的因果关联,可能与趋化因子表达情况有关。临床上GD、UC、CD、AIH、PBC和PSC与AA共病的其他原因还可能包括:AA与其具有部分重叠的生物学因素、相似的遗传结构、未测量的混杂因素、共同的环境风险等。
本研究存在以下几个方面的局限性。首先,这是一项基于欧洲人群的研究,我们的分析结果还无法推广到其他人群。其次,由于GWAS的样本量受限,我们筛选所得的IVs在一定程度上存在数量不足、代表性不充分等情况,仍需挖掘更大规模更全面的GWAS数据以满足MR分析需要。此外,我们的统计分析结果仍需更大规模的流行病学支持,ADs合并AA的病历较少,或许是AA诊断的精确性和严格性等因素导致合并病存在误诊、漏诊的可能。
综上,我们的研究揭示了RA、SLE、HT和SS是AA的显著危险因素。对确诊以上4类ADs的患者应当采取密切的血象监测,以早期发现AA,并制定个性化的治疗方案。我们未发现GD、UC、CD、AIH、PBC和PSC与AA之间的因果关联,仍需要更全面更大规模的流行病学研究以及GWAS数据库来全面探讨各种ADs和AA之间的关联,以期探寻复杂疾病共性病理基础、阐明重大疾病发生发展与转归的共性规律和机制,为临床辨证论治提供更有力的依据。