非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)是一种与代谢紊乱密切相关的慢性肝病,其特征是在排除过量饮酒等其他明确病因的情况下,肝细胞内出现过量脂质堆积,且常伴有代谢综合征,如胰岛素抵抗、2型糖尿病和肥胖等
[1-2]。流行病学研究
[3-4]显示:全球NAFLD患病率约为25%,且呈持续上升趋势。NAFLD的疾病谱包括非酒精性脂肪肝和非酒精性脂肪性肝炎及其相关的肝纤维化,约10%的NAFLD患者在诊断后的10~20年发展为肝硬化和(或)肝癌。NAFLD不仅显著影响患者生活质量,还给家庭和社会带来巨大的医疗经济负担。
血浆脂质是反映机体代谢状态的重要指标,包括甘油三酯、胆固醇、磷脂和游离脂肪酸等多种脂质分子。近年来研究
[5]表明:血浆脂质组分与NAFLD等多种代谢性疾病存在密切关联。病例对照研究
[6-7]结果显示:NAFLD患者常伴有特征性血浆脂质改变,主要表现为甘油三酯水平升高和高密度脂蛋白胆固醇水平降低。脂代谢异常会增加NAFLD发生风险
[8]。动物实验研究
[9]显示:脂质代谢紊乱通过影响肝脏脂质代谢、炎症反应和氧化应激等多种机制参与NAFLD的病理过程。脂质代谢异常也能影响肝酶水平,这种关联在NAFLD患者中表现尤为显著
[10-12]。然而,传统观察性研究在评估血浆脂质与NAFLD和肝酶关系时常受到饮食习惯和肥胖等混杂因素的影响,难以确定二者之间的因果关系。
孟德尔随机化(Mendelian randomization,MR)是一种基于孟德尔遗传定律的因果推断方法,该方法利用单核苷酸多态性(single nucleotide polymorphism, SNP) 作为工具变量 (instrumental variable, IV)来评估暴露因素与结局之间的因果关联。基因型在减数分裂过程中遵循独立分配定律,这一随机分配机制与随机对照试验中的随机分组过程类似。MR方法可有效避免混杂因素的影响并消除反向因果关系的干扰,为因果推断提供了可靠方法。目前该方法已被广泛应用于评估多种暴露因素与结局之间的潜在因果关联
[13]。本研究基于全基因组关联研究(genome-wide association study,GWAS)数据,使用MR方法系统探究血浆脂质与NAFLD和肝酶的因果关系,这有助于识别特定脂质分子在NAFLD发病中的作用,明确不同脂质分子对肝酶的影响,为阐明脂质代谢在NAFLD发病机制中的作用提供新的科学证据。
1 资料与方法
1.1 暴露与结局数据
本研究采用双样本MR方法,以血浆脂质中的179种脂质分子作为暴露因素,以NAFLD和4种肝酶作为结局。4种肝酶包括:丙氨酸氨基转移酶(alanine aminotransferase,ALT)、天冬氨酸氨基转移酶(aspartate aminotransferase,AST)、γ-谷氨酰转移酶(gamma-glutamyl transferase,GGT)和碱性磷酸酶(alkaline phosphatase,ALP)。利用多变量MR方法校正体质量指数(body mass index,BMI)对血浆脂质与NAFLD之间关联的潜在影响。研究所用GWAS数据来自4项独立研究,所有数据均通过GWASCatalog网站(
https://www.ebi.ac.uk/gwas/)获取。血浆脂质数据来自GeneRISK队列研究
[14],该研究基于7 174名芬兰裔受试者,采用鸟枪法脂质组学技术检测了甘油脂质、甘油磷脂、鞘脂和甾醇四大类脂质中的179种脂质分子。NAFLD的GWAS数据库来自SUN等
[15]基于英国生物银行(UK Biobank)的研究,该研究排除了酒精性肝病、酒精滥用、病毒性肝炎和威尔逊氏病以及有肝损伤性药物使用史的参与者,最终纳入了32 941名研究对象(6 623例NAFLD患者和26 318名健康对照者)。ALT、AST、GGT和ALP的GWAS汇总数据则来自2021年BARTON等
[16]基于UK Biobank的一项研究。BMI相关的GWAS数据来自2018年人体测量试验遗传调查(genetic investigation of anthropometric traits,GIANT)数据库
[17],各数据集的信息见
表1。
1.2 IV选择
使用遗传变异作为血浆脂质的IV需满足3个核心假设:①遗传变异与血浆脂质显著相关(相关性假设);②所选遗传变异与血浆脂质和结局关联中的任何潜在混杂因素均不相关(独立性假设);③遗传变异仅通过影响血浆脂质水平而与结局相关联(排他性假设)。本研究采用严格的IV筛选策略:首先,参考既往研究
[18]并权衡统计效能,将全基因组显著性阈值设定为
P<5×10
-6。为解决基因组中的连锁不平衡(linkage disequilibrium,LD)现象,本研究采用1 000基因组计划欧洲人群数据作为参考,实施严格的SNPs筛选策略。筛选标准:相邻SNPs间最小物理距离设为10 000 kb,并确保任意2个SNPs之间的LD系数 (
r²) <0.001,从而有效保证了所选IV的独立性。其次,采用公式
F=
R²(
n-2)/(1-
R²)计算
F统计量,其中
R²表示SNP对暴露变异的解释程度,
n代表研究样本量,仅保留
F>10的SNP,避免弱工具变量偏倚。最后,通过PhenoScanner数据库排除与结局变量和混杂因素(肥胖、酒精摄入、吸烟和代谢性疾病)存在直接关联的SNP,以确保IV的有效性。
1.3 统计学分析
本研究采用双样本MR分析,采用逆方差加权法(inverse-variance weighted,IVW)作为主要方法,IVW基于遗传变异严格满足3个核心假设的前提下,综合各个遗传变异对应的Wald估计效应值,从而获得暴露对结局因果效应的整体估计。为确保结果的稳健性,研究同时采用了MR-Egger回归、加权中位数法(weighted median estimator,WME)、加权众数法(weighted mode,WM)和简单众数法(simple mode,SM)4种方法作为补充。本研究采用Bonferroni校正方法:对于血浆脂质与NAFLD的分析,将显著性水平设定为2.793×10-4(0.05/179);对于血浆脂质与4种肝酶的分析,将显著性水平设定为6.983×10-⁵[0.05/(179×4)]。当P值小于相应校正后的显著性水平时,认为存在因果关联;当P值大于等于校正后的显著性水平但小于0.05时,认为存在提示性因果关联。当2种及以上补充分析方法检测到因果关联,且关联方向与IVW结果一致时,则可认为该血浆脂质与结局之间存在较为稳健的因果关联证据。采用Steiger方向性检验和反向MR分析,以验证因果关系的方向性。采用多变量MR方法对BMI进行校正,以评估血浆脂质与NAFLD之间的关联是否独立于BMI,进一步确保血浆脂质和NAFLD之间因果关联的稳健性。
1.4 敏感性分析
本研究采用多种方法进行敏感性分析。MR-Egger回归的截距项用于检测潜在的方向性水平多效性,当截距项显著偏离零时,表明存在水平多效性偏倚。通过留一法分析评估单个遗传变异对因果效应整体估计的影响,以识别可能的异常SNP。Cochran's Q统计量用于检验各遗传变异的因果效应估计之间是否存在异质性,当P<0.05表明存在显著异质性,采用随机效应模型进行分析;若P≥0.05,则采用固定效应模型。应用MR-PRESSO的离群值检测功能识别并剔除可能具有多效性的异常SNP,随后对剩余的IV进行重新分析,从而获得更为可靠的因果关系估计值。使用MR-PRESSO Global检验评估IV中是否存在水平多效性,当P<0.05时表明存在显著多效性。对于显示SNP存在显著水平多效性的分析结果,考虑其因果效应估计可能存在偏倚,本研究将上述结果从最终报告中排除,以确保研究结论的可靠性和准确性。所有统计分析均采用R软件(4.1.2版本) 完 成, 主 要 使 用 的 R 软 件 包 包 括“TwoSampleMR”、“MendelianRandomization”和“MR-PRESSO”。
2 结 果
2.1 IV的选择结果
本研究以179种血浆脂质作为暴露因素,以NAFLD和4种肝酶作为结局指标,根据预设标准筛选SNP作为IV。在初始数据集中,共有2 026 052 670个SNPs。本研究对IV进行了系统筛选,以P<5×10-6为阈值进行初筛,获得83 074个SNPs。采用1 000基因组计划欧洲人群数据为参考,设定相邻SNP的最小物理距离为10 000 kb,任意2个SNP之间LD系数r2<0.001,进一步筛选得到2 675个SNPs。所有入选SNPs的F统计量均>10(范围:17.53~184.35),有效控制了弱工具变量偏倚。通过PhenoScanner数据库排除与结局变量及潜在混杂因素存在直接关联的SNPs,并删除不相容或回文等位基因后,最终确定2 626个SNPs作为179种血浆脂质的IV用于MR分析。
2.2 血浆脂质与NAFLD的因果关联
研究使用双样本MR方法评估179种血浆脂质对NAFLD的因果效应。IVW分析未发现血浆脂质与NAFLD之间存在因果关联(
P>2.793×10
-4),但识别出11种甘油磷脂和1种鞘脂与NAFLD之间存在提示性因果关联(2.793×10
-4<
P<0.05)。敏感性分析结果表明:磷脂酰肌醇(16:0/18:1)和磷脂酰肌醇(18:0/20:4)在MR-Egger截距检验和MR-PRESSO Global检验中均呈现显著水平多效性(
P<0.05),表明这2种脂质分子与NAFLD的因果关联估计可能存在偏倚,因此将其从后续分析中剔除。其余10种脂质分子未显示显著的异质性和多效性,结果见
表2。采用MR-Egger回归、WME、WM和SM方法进行补充分析,结果见
图1,磷脂酰胆碱(18:0/20:5)对NAFLD具有保护作用[比值比(odds ratio,OR)=0.988,95%置信区间(confidence interval,CI)(0.977,0.999),
P=0.028],而磷脂酰肌醇(16:0/18:2)[OR=1.016,95%CI(1.000,1.032),
P=0.046]和磷脂酰肌醇(18:0/18:2)[OR=1.012,95%CI(1.002,1.022),
P=0.021]则会增加NAFLD的发生风险。留一法分析结果表明:单个SNP对总体因果效应估计值无显著影响。
为评估BMI对血浆脂质与NAFLD之间关联的潜在影响,本研究进行多变量MR分析,结果见
表3。结果显示:校正BMI后,3种脂质分子中仅磷脂酰肌醇(18:0/18:2)[OR=1.019,95%CI(1.007,1.035),
P=0.008]与NAFLD之间存在显著关联,提示该脂质分子与NAFLD之间的因果关联独立于BMI,而磷脂酰胆碱(18:0/20:5)和磷脂酰肌醇(16:0/18:2)在校正BMI后与NAFLD的关联无统计学意义(
P>0.05),表明这2种脂质分子与NAFLD的关联可能受到BMI的中介或混杂影响。
2.3 血浆脂质与4种肝酶的因果关联
基于IVW法在探索血浆脂质和肝酶(ALT、AST、GGT和ALP)之间的因果关联,结果显示:8种血浆脂质与肝酶之间存在因果关联(
P<6.983×10
-5)。敏感性分析结果显示:在8种与肝酶显著相关的血浆脂质中,磷脂酰肌醇(16:0/20:5)和磷脂酰肌醇(16:1/20:4)在MR-Egger截距检验中表现出显著的水平多效性(
P<0.05),表明这2种脂质分子与肝酶之间的因果关联估计可能存在偏倚,将其从后续分析中剔除。其余6种脂质分子均未表现出显著的异质性和多效性,结果见
表4。MR-Egger回归、WME、WM和SM法分析结果见
图2,磷脂酰胆碱(16:0/20:5)[效 应 值(beta,
β)= 0.026,95%CI(0.015,0.036),
P=9.93×10
-7]、磷脂酰 胆 碱 (O-16:0/22:5) [
β=0.057, 95%CI(0.035,0.078),
P=1.79×10
-7]、三 酰 甘 油(56:7)[
β=0.057,95%CI(0.035,0.079),
P=2.53×10
-7]和 三 酰 甘 油(56:8)[
β=0.067,95%CI(0.047,0.087),
P=1.19×10
-10]的水平升高与ALT水平升高呈显著正相关关系。三酰甘 油 (53:2)[
β = 0.160, 95%CI (0.123,0.197),
P=1.55×10
-17]的水平升高与AST水平升高呈显著正相关关系。留一法分析结果显示单个SNP对总体因果效应估计值的影响均不显著。
2.4 Steiger检验和反向MR分析
Steiger方向性检验结果显示:SNP对暴露因素(血浆脂质)的解释方差显著大于其对结局(NAFLD或肝酶)的解释方差(P<0.05),表明从血浆脂质到NAFLD/肝酶的单向因果关系。反向MR分析结果未发现NAFLD或肝酶与已识别的血浆脂质水平之间存在显著因果关联。
3 讨 论
本研究利用公开的GWAS数据集进行双样本MR分析,系统评估了179种血浆脂质对NAFLD和4种肝酶的因果关联效应。MR分析结果表明:特定血浆脂质分子与NAFLD发生风险和肝酶水平存在因果关系,这为深入阐明NAFLD的发病机制提供了新的研究视角。
本研究发现:磷脂酰胆碱 (18:0/20:5) 对NAFLD具有保护效应,而磷脂酰肌醇 (16:0/18:2)和磷脂酰肌醇(18:0/18:2)则会增加NAFLD的发生风险; 在校正BMI后仅磷脂酰肌醇 (18:0/18:2)与NAFLD存在关联。磷脂酰胆碱作为肝细胞膜的主要结构组分,在维持肝细胞正常形态和功能方面发挥着关键作用
[19]。磷脂酰胆碱合成酶基因的功能缺失性变异可能导致肝脏磷脂酰胆碱合成减少,进而增加脂肪肝的发病风险
[20]。当磷脂酰胆碱合成不足时,可导致极低密度脂蛋白的分泌障碍,引起肝细胞内甘油三酯异常蓄积
[21]。磷脂酰胆碱具有抗炎特性并能保护线粒体功能,可有效减轻肝细胞的氧化应激损伤
[22]。多烯磷脂酰胆碱作为一种外源性磷脂补充剂,在临床上被证实可有效改善NAFLD患者的症状
[23],动物实验研究
[22]表明其机制可能与恢复肝细胞膜磷脂平衡和促进脂质代谢有关。关于磷脂酰肌醇与NAFLD关系的研究结果存在一定争议。研究
[24]表明:磷脂酰肌醇3-激酶通路的异常激活会导致肝脏脂肪变性并促进肝脏肿瘤的发展。然而,一项动物实验研究
[25]结果显示:膳食中的磷脂酰肌醇能显著阻止大鼠肝肿大和肝脂肪变性的发生,并降低肝损伤标志物水平。磷脂酰肌醇在NAFLD发病机制中的具体作用仍需进一步研究。
本研究进一步揭示了血浆脂质与肝酶之间存在因果关联,结果显示:三酰甘油(56:7)和三酰甘油(56:8)与ALT水平呈显著正相关关系,三酰甘油(53:2)与AST水平之间呈显著正向因果关联。研究
[26]表明:肝脏三酰甘油沉积可诱导氧化应激增加,引起肝细胞炎症、纤维化和坏死,上述病理改变在NAFLD的发病过程中起关键作用。TIROSH等
[27]研究发现:当肝细胞暴露于0.1%的三酰甘油乳剂后,细胞内活性氧水平明显升高,引发脂质过氧化和细胞损伤,最终导致细胞坏死。此外,本研究还发现磷脂酰胆碱(16:0/20:5)、磷脂酰胆碱(18:0/20:5)和磷脂酰胆碱(O-16:0/22:5)均与ALT水平呈显著正相关关系,磷脂酰胆碱 (18:0/20:5) 与GGT水平呈负相关关系。该结果与既往临床研究结果存在一定差异。WAEV等
[28]研究表明:NAFLD患者在接受多烯磷脂酰胆碱治疗后,ALT和GGT水平均呈显著下降趋势。
本研究通过MR法系统评估血浆脂质与NAFLD和肝酶之间的因果关联,为阐明血浆脂质在NAFLD发生发展中的作用提供了证据支持,MR方法有效规避了混杂偏倚和反向因果的影响。本研究使用Bonferroni校正严格控制多重比较中的Ⅰ类错误率,同时结合MR-Egger回归、WME、WM和SM法及多种敏感性分析方法确保了因果推断的稳健性。本研究还采用多变量MR分析校正了BMI的潜在影响,进一步明确了特定血浆脂质对NAFLD的因果关联独立于肥胖因素。然而,本研究仍然存在一些局限。首先,研究所使用的GWAS数据来源于欧洲人群,限制了研究结果向其他种族人群的推广性。其次,由于血浆脂质GWAS样本量较小(n=7 174),宽松的IV筛选标准(P<5×10⁻⁶)可能增加水平多效性风险,为减轻这一风险,本研究通过PhenoScanner数据库排除与结局或混杂因素存在直接关联的SNPs,使用MR-Egger截距检验和MR-PRESSO方法进行水平多效性评估。本研究未能深入阐明上述脂质分子影响NAFLD和肝酶水平的具体分子机制。基于此,未来研究应着重在不同种族人群中开展验证性研究,深入探讨相关脂质分子的作用机制,并评估上述脂质分子作为NAFLD早期诊断标志物或潜在治疗靶点的临床应用价值。本研究通过MR分析系统探索了179种血浆脂质分子与NAFLD发病风险和4种肝酶之间的因果关联,为探索NAFLD的发病机制,明确特定脂质分子对肝功能标志物的影响提供了科学依据。