慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是以慢性呼吸道症状如呼吸困难、咳嗽、咳痰为特征的一种异质性疾病,由于气道异常(支气管炎、细支气管炎)或肺泡异常(肺气肿)导致持续性通常是进行性的气流阻塞
[1]。在过去的几十年中,COPD是全球范围内报道最多的呼吸系统疾病,患病人数达3.91亿人
[2]。预计到2030年,COPD会成为全球第三大患病及死亡原因
[3],造成了严重的疾病负担。
胃食管反流病(gastroesophageal reflux disease,GERD)是上消化道最常见的疾病之一,由于胃内容物反流到食道导致胃灼热、反流等不适症状或并发症,同时可伴有食管外表现包括喉部和肺部症状,如声音嘶哑、慢性咳嗽、咽喉炎,以及吸入性肺炎、肺纤维化等疾病
[4]。胃食管反流病在世界范围内十分常见,影响15%~20%的人口
[5],随着生活方式和饮食结构的改变,发病率在我国和全球范围内均呈现逐年上升的趋势。
既往大量观察性研究证据表明,胃食管反流病与COPD存在一定的相关性,胃食管反流病可能会促进COPD的进展。同时,COPD引起的胸腔压力变化可能增加发生胃食管反流病的风险
[6-9]。然而,由于传统观察性研究通常样本量有限,易受到吸烟等混杂因素及反向因果关系等的影响,胃食管反流病是COPD的原因还是结果仍存在争议,因此二者的因果关系仍需进一步调查。与观察关联不同,基因关联可以有效避免后天混杂因素及反向因果的影响
[10],因为等位基因在受孕时随机分配,且基因型先于疾病的发生,不受环境、生活方式和社会经济等影响。因此,本研究采用双向两样本孟德尔随机化(Mendelian randomization,MR)方法,与已知和暴露因素强相关的遗传变异如单核苷酸多态性(single nucleotide polymorphism,SNP)作为工具变量进行孟德尔随机化分析,进一步探讨胃食管反流病和COPD的因果效应及其方向性。
1 材料与方法
1.1 研究设计
孟德尔随机化是一种基于工具变量即SNP推断暴露与结局因果关系的一种流行病学统计方法。MR分析基于3个重要假设
[11]。首先,相关性假设即作为工具变量的遗传变异与暴露因素高度相关;其次,独立性假设指选择的遗传变异不能与混杂因素相关联;第三,排除限定假设指暴露因素是遗传变异影响结局的唯一途径。本研究是基于大规模全基因组关联研究(genome-wide association studies,GWAS)公共数据库中的汇总遗传数据进行的,因此不需要额外的伦理审批。本文研究设计及撰写基于孟德尔随机化研究的报告规范《STROBE-MR》
[12],MR研究总体方案如
图1所示。
1.2 数据来源
本研究中胃食管反流病GWAS数据从一项包含385 276个个体(其中病例80 265例,非病例305 011例)的GWAS研究
[13]中获得,GWAS数据ID为“GERD_UKBB_QSKIN.gwas”。该研究是来自英国生物样本库、QSkin研究及23andMe数据库的5个GWAS数据集的荟萃分析研究,具有较大的样本量。COPD GWAS数据来自芬兰开展的大型基因组研究FinnGen数据库
[14](
https://www.finngen.fi/en),GWAS数据ID为“finngen_R9_J10_COPD”。FinnGen数据库是规模最大的基因组研究项目之一,旨在通过基因研究改善人类健康,并最终确定多种疾病的新治疗靶点和诊断方法。该研究共329 552例参与者,其中包括18 266例COPD患者和311 286例对照者。研究人群之间不存在样本重叠,且均为欧洲人群,避免了种族差异造成的偏倚。文中所用GWAS数据的详细信息见
表1。
1.3 工具变量筛选
当以胃食管反流病为暴露因素时,首先选择与胃食管反流病强相关且全基因组显著水平为
P<5×10
-8、不存在连锁不平衡(
r2<0.001)的SNP
[15]。之后使用PhenoScanner V2(
www.phenoscanner.medschl.cam.ac.uk/)
[16]检查所使用的工具变量是否与潜在混杂因素吸烟相关,若发现与吸烟相关(
P<5×10
-8)的SNP则剔除。当以COPD为暴露因素进行反向MR分析时,为了获得更多有效工具变量,放宽全基因组显著阈值(
P<5×10
-7)
[17],之后剔除存在连锁不平衡(
r2>0.001)即与混杂因素吸烟相关(
P<5×10
-8)的SNP。最后得到与胃食管反流病或COPD强相关的有效SNP作为工具变量。
1.4 分析方法
1.4.1 MR分析
采用逆方差加权法固定效应模型(inverse variance weighted-fixed effects,IVW-FE)作为主要的MR分析方法。在不存在基因多效性即选择作为工具变量的SNP不能通过除暴露外的任何途径影响结果的情况下,IVW-FE是最有效的分析方法
[10]。同时,采用简单中位数法、加权中位数法、MR Egger回归法进行结果验证和稳定性检验。简单中位数法要求至少50%的遗传变异为有效工具变量,而加权中位数法要求由遗传变异贡献的权重至少50%是有效的
[18]。MR Egger回归法放宽了IVW方法中遗传变异之间不存在多效性的要求,它假设工具变量不或不完全通过暴露因素对结局产生影响
[19]。
1.4.2 敏感性分析
①计算SNP的
F统计量评估工具变量与暴露因素的关联强度,计算公式为
F=(beta/se)
2,其中beta为等位基因效应值,se为标准误
[20]。
F值小于10表明可能存在弱工具变量偏倚
[21],将其剔除。②采用Cochran
Q检验判断工具变量之间是否存在异质性,若
P>0.05则提示存在异质性的可能性较小
[22]。③采用MR Egger截距测试评估是否存在水平多效性,若截距项有统计学意义,则表明该研究存在明显的水平多效性
[23]。④孟德尔随机多态性残差和离群值(Mendelian randomization pleiotropy residual sum and outlier,MR-PRESSO)用于检测是否存在离群值,若存在则剔除异常值后重新进行分析来检测和校正水平多效性
[24]。⑤进行“留一法”敏感性分析,通过每次去除单个SNP来评估该遗传变异对整体因果效应的影响
[10]。
1.5 统计学方法
所有统计学分析均通过R软件4.2.2版中的“TwoSampleMR”包进行。研究结果以比值比(odds ratio,OR)及95%置信区间(confidence interval,CI)呈现。检验水准α=0.05。
2 结果
2.1 胃食管反流病对COPD发病风险的影响
经过筛选并剔除与混杂因素吸烟相关的SNP(rs10242223,rs597808)后得到11个独立的SNP。计算
F统计量,剔除
F<10的弱工具变量(rs12706746),最终共有10个SNP纳入研究。SNP详细信息见
表2。
IVW-FE表明与不患胃食管反流病人群相比,遗传学预测的患病人群发生COPD的风险增加了75.7%(OR=1.757,95%CI=1.425~2.166,P=0.000)。简单中位数法(OR=1.591,95%CI=1.188~2.132,P=0.002)、加权中位数法(OR=1.534,95%CI=1.129~2.084,P=0.006)同样显示胃食管反流病可增加患COPD的风险。然而,MR Egger回归法未显示出两者之间的因果关联(OR=4.282,95%CI=0.561~32.673,P=0.198)。
敏感性分析结果,如
图2所示,Cochran
Q检验显示SNP之间不存在异质性(
Q=12.624,
P=0.180);MR Egger截距测试(
P=0.412)表明此研究不存在水平多效性;进行MR-PRESSO未检测到显著的离群值(
P=0.270),MR结果稳健。此外,“留一法”分析逐个去除SNP,未观察到单个SNP对整体结果有较大影响,见
图3。散点图结果显示所选取的工具变量具有稳定性,且4种方法的斜率均为正,SNP对胃食管反流病的效应越强,则SNP对COPD的效应也越强,表明胃食管反流病与COPD之间存在正相关关系,见
图4。
2.2 COPD对胃食管反流病发病风险的影响
经过筛选,共纳入6个SNP作为工具变量进行MR分析,且未发现与混杂因素吸烟相关。
F统计量均大于10,有效避免了弱工具变量偏倚的影响,详见
表3。
IVW-FE结果显示,COPD不是增加胃食管反流病发病风险的危险因素(OR=0.999,95%CI=0.962~1.037,P=0.962)。同样,简单中位数法(OR=0.998,95%CI=0.945~1.053,P=0.929)、加权中位数法(OR=1.020,95%CI=0.973~1.068,P=0.406)、MR Egger回归法(OR=0.985,95%CI=0.857~1.132,P=0.839)未发现二者存在因果关联。
敏感性分析结果,如
图2所示,未发现SNP间存在异质性(Cochran
Q检验,
Q=3.798,
P=0.579);MR Egger截距测试未发现研究存在水平多效性(
P=0.842);MR-PRESSO未检测到异常SNP(
P=0.541)。同时,进行“留一法”分析逐个剔除SNP后,MR分析结果稳健,见
图5。散点图结果显示,与COPD和胃食管反流病密切相关的工具变量具有稳定性,但4种方法的斜率方向不一致,不能表明二者间具有相关关系,见
图6。
3 讨论
本研究采用双向两样本孟德尔随机化方法,从基因层面证明胃食管反流病可增加患COPD的风险。但反之,未发现COPD与胃食管反流病之间存在因果关联的证据。
之前关于胃食管反流病与COPD的关系推断主要来自观察性研究。既往1项综述研究表明在COPD患者中,胃食管反流病的患病率存在较大差异,从19%至78%不等(平均42.8%),但高于对照组患病率18.5%
[8]。一项全国性的队列研究显示,与无COPD的对照人群相比,COPD患者发生胃食管反流病的风险升高(
HR=2.10,95%CI=1.76-2.49,
P<0.001)
[6]。最近对12项研究的系统评价同样发现COPD病人胃食管反流的发生率较高,尤其是男性、有吸烟史、西方地区的病人
[25]。然而,观察到的胃食管反流病与COPD的关联可能受到吸烟的影响。一方面,吸烟是导致COPD患病的主要原因,与不吸烟者相比,吸烟者出现呼吸系统症状及肺功能异常的比例更高
[26];另一方面,烟草中含有的尼古丁可诱导食管括约肌肌肉松弛、张力降低,导致酸暴露及反流的频率增加,吸烟已被发现是胃食管反流病的危险因素
[27]。同时由于传统观察性研究无法区分正向和反向因果关系(即胃食管反流病和COPD发生的时间顺序),限制了对二者因果关系的深入理解。本研究使用孟德尔随机化的方法克服了混杂因素吸烟及反向因果的影响从遗传学的角度评估胃食管反流病与COPD之间的因果关系。
本研究发现与不患胃食管反流病人群相比,患病人群发生COPD的风险增加75.7%,但关于胃食管反流病导致COPD的具体机制尚不清楚,提出以下几种潜在机制。①胃食管反流是肺微误吸的危险因素
[8],反流物中的胃蛋白酶和微量吸入物破坏肺泡表面活性物质,导致肺萎陷以及死腔扩张,随之增加肺内分流,造成肺部不可逆气流受限。②胃内容物长期反流至支气管和肺组织,可能引起支气管和肺部组织发生慢性炎症反应,形成慢性支气管炎,进而发展为COPD
[28]。③由于在胚胎时期食管、支气管具有共同的起源,因此具有相同的神经支配。远端食管反流物中的酸性物质使食管到支气管的迷走神经弧被激活,导致支气管收缩,同时介导促炎介质释放,加重气道炎症和高反应性
[9]。此外,既往研究发现瞬时受体电位(transient receptor potential,TRP)通道的激活可以触发神经源性炎症,而TRP通道在肺平滑肌细胞、支气管上皮细胞、肺泡细胞中大量存在。这些通道可以被包括酸反流在内的各种刺激激活,并在气道炎症和高反应性中发挥重要作用
[29]。因此,上述胃食管反流病导致COPD相关机制也进一步验证了本研究的发现。值得注意的是,有研究表明为了克服肺部过度充气增加的吸气负荷,COPD患者吸气时需要增加呼吸肌吸气力,导致胸部和腹部之间的压力梯度增加,从而影响食管下括约肌的张力使反流更有可能发生
[30]。这与分析结果存在差异,原因可能是使用的COPD工具变量数目有限,且未纳入除欧洲人群外其他种族的GWAS数据,因此在更全、更新的GWAS数据中进一步研究是必要的。
本研究具有以下优势:①应用两样本双向MR方法来探索胃食管反流病与COPD的因果关系。与既往大量观察性研究相比,MR研究不受经典混杂因素(如吸烟)和反向因果的影响。②多种敏感性分析方法未发现基因异质性和水平多效性的证据,证实了结果的稳健性。③GWAS数据均未公开发表,提供了数千种人类性状的遗传变异,相对容易获取,节省时间和人力物力。
然而,本研究也具有一定的局限性。①所有GWAS数据均来自欧洲人群,限制了这些研究结果在其他人群中的临床推广性。②MR分析结果不能直接与来自临床研究的效应值进行比较,只能判断效应的方向并加强因果关系的推断。③不能避免未能观察到的工具变量的水平多效性。④本研究纳入的工具变量数目较少,未来需要在更多更大样本量的GWAS数据中进行更深入研究。
本研究通过两样本双向孟德尔随机化方法,从基因层面表明胃食管反流病与COPD的风险增加有显著的因果关系,反之没有发现COPD导致胃食管反流病风险增加的证据,但仍需在更大的GWAS数据中进行验证。在未来应关注胃食管反流病作为COPD潜在治疗靶点的可能性,并进一步研究其发生机制。