胰腺癌(pancreatic cancer,PC)因其临床症状隐匿、进展节奏快且治疗选择有限而居全球恶性肿瘤病死率前列。根据最新的流行病学数据,PC的5年总体生存率不足10%
[1]。大约80%~90%的患者在首次就诊时已处于局部晚期或伴随远处转移,导致失去手术机会;即使接受手术切除,术后复发情况仍屡见不鲜,此外,现有的放疗、化疗和免疫治疗对延长总体生存期的效果仍然有限
[2-3]。因此,寻找新的早期诊断标志物和靶向治疗策略是提高PC患者生存率的迫切需求。
近年来,代谢重编程已被证明是PC发生、进展以及耐药的关键分子特征之一,成为早期诊断和靶向干预的新研究方向。代谢重编程是指肿瘤细胞为适应自身快速生长需求,通过调节代谢途径而产生代谢模式变化的过程,因此代谢物的水平变化能够反映肿瘤在发生发展过程中的代谢状态
[4-7],其中又以脂质代谢异常尤为突出
[8]。脂质代谢物通常指脂肪酸、甘油三酯、磷脂、胆固醇等脂类分子及其代谢产物
[6,9],其水平变化与肿瘤进展密切相关。例如Shu等
[7]通过分析167种血清代谢物,发现多种脂质代谢物与PC风险存在显著相关性。然而,这些发现主要依赖于观察性研究,难以排除混杂偏倚和反向因果的影响,因此尚缺乏遗传因果关系的有力证据。一项通过核磁共振(NMR)分析血液样本的研究
[6],评估了PC确诊前1个月至17年内采集的血液样本,但未能证实之前认为的支链氨基酸作为PC潜在标志物的假设。
传统的观察性研究容易受到混杂因素和反向因果的影响,难以确立代谢物与疾病之间明确的因果关系。而孟德尔随机化(Mendelian randomization,MR)作为一种新兴的因果推断方法,通过选择与暴露因素(如代谢物)显著相关的遗传变异[通常是单核苷酸多态性(single nucleotide polymorphisms,SNP)]作为工具变量,可以有效控制混杂因素和避免反向因果关系,从而更加可靠地推断暴露与疾病之间的因果关系
[10]。目前已有研究运用MR方法证实了某些代谢特征与癌症风险之间的因果联系
[11-12],为进一步探索PC代谢领域的研究奠定了方法学基础。
然而,目前国内外针对血清NMR代谢物与PC脂质代谢异常之间的因果研究仍较为有限
[13-14],仅有部分研究如Qin等
[15]利用动物模型和临床样本,明确提出脂质代谢异常在PC进展过程中的关键作用。这些前期工作提示通过遗传学手段进一步验证相关代谢标志物与PC风险的因果联系具有重要的研究价值和前沿性。
因此,本研究创新性地整合了UK Biobank数据库中325种血清NMR代谢物的大型GWAS结果
[16],并结合芬兰数据库中PC的GWAS数据
[17],采用双样本MR分析方法,系统评估了不同代谢特征对PC风险的遗传因果效应。研究旨在揭示PC潜在的代谢诊断标志物及治疗靶点,为提高PC患者早期诊断和精准治疗水平提供新的理论依据。
1 资料与方法
1.1 研究设计
本研究采用双样本MR设计,旨在评估325种NMR生物标志物与PC风险之间的潜在因果关系。MR研究通过SNP作为工具变量,能够克服传统观察性研究中的混杂偏倚和反向因果问题,为因果推断提供可靠依据。MR研究应满足以下三个核心假设:(1) 相关性假设:工具变量与暴露因素之间应具有强相关性,即所选择的SNP应能显著影响相关代谢物的水平,从而确保暴露与工具变量之间的关系明确;(2) 排他性假设:工具变量与结局(PC风险)之间不应存在直接关系,而应仅通过暴露(代谢物)间接影响结局;(3) 独立性假设:工具变量与任何影响暴露和结局的混杂因素无关。为了确保这一点,本研究利用公共数据库中的遗传数据,严格控制可能存在的混杂偏倚。整体分析流程见
图1。
1.2 数据来源
325种NMR代谢物数据来自于UK Biobank
[16],覆盖了约27.5万名参与者,包含脂肪酸、氨基酸、酮体、炎症指标等多个维度的生物标志物信息,该数据最终纳入95 372例具备高质量全基因组测序数据的欧洲个体,可通过GWAS Catalog网站下载数据。PC GWAS数据来源于FinnGen生物库第11轮,GWAS ID为finngen_R11_C3_PANCREAS_EXALLC,该数据共纳入347 110例受试者,其中病例(PC阳性)1 992例,对照345 118例,共分析20 092 400个SNP。由于暴露与结局GWAS数据皆源于欧洲人群,本研究避免了跨族群遗传结构差异带来的偏倚
[18],可提高因果推断的可靠性。具体数据信息来源见
表1。
1.3 工具变量的选择
在本研究中,为了评估代谢物与PC风险之间的因果关系,选择与暴露因素相关的SNP作为工具变量,为确保其有效性并减少潜在的偏倚影响,需遵循以下严格的筛选标准。首先通过设置P值阈值为5×10⁻⁸,确保所选SNP与暴露因素(代谢物)之间具有显著的相关性。为了避免连锁不平衡偏倚的影响,进一步剔除了r²>0.001的SNP,同时限制SNP之间的遗传距离不超过10 000 kb。此外,确保所选工具变量与暴露因素之间具有强关联性,计算了每个SNP的F统计量,并以F>10为标准,排除了F值较小的工具变量,从而确保所选工具变量的解释力足够强,不易受到弱工具变量偏倚的干扰。
为了进一步去除潜在的混杂偏倚和离群值,采用了多种方法进行严格筛选。使用MR-PRESSO和RadialMR
[19]去除离群值,该方法广泛用于识别和剔除MR分析中的异常值。之后利用PhenoScanner V2网站对所选SNP进行核查,确保它们与PC结局变量之间没有显著的混杂关系。通过这三种方法的结合,确保了所选SNP不仅与暴露因素具有强关联,同时与结局变量(PC)没有直接关系,从而增强了MR分析的可靠性与准确性。
1.4 统计学处理
因逆方差加权(IVW)法
[20]在双样本MR分析中具有卓越的因果关系检测能力,被广泛应用于此类分析,所以在本研究中使用IVW法作为主要的MR分析方法。同时,为了验证结果的稳健性和可靠性,采用了MR-Egger回归法
[21]、加权中位数法
[22](weighted median)、加权模式法
[23](weighted mode)、贝叶斯加权孟德尔随机化
[24](Bayesian weighted Mendelian randomization,BWMR)和约束最大似然法(constrained maximum likelihood estimation,cML)
[25]作为辅助分析方法。最终的MR分析结果选取了6种MR方法的β值同向的结果,以确保分析的可靠性和一致性。
为了检测潜在的多效性问题,使用了MR-Egger回归法和MR-PRESSO法进行水平多效性检测,若截距项的P<0.05,则表明存在水平多效性。此外,研究通过Cochran's Q检验用于评估工具变量之间的异质性,当P>0.05时,表明存在异质性。
为规避反向因果偏倚,本研究使用Steiger方向性检验对每对暴露与结局进行评估,验证所选工具变量的合理性,确保暴露与结局不存在反向因果关系,提高因果推断的有效性。
所有的统计分析均在R(版本4.2.2)环境中进行,主要使用TwoSample MR和MR-PRESSO等R包进行双样本MR分析。
2 结 果
2.1 MR分析揭示NMR生物标志物与PC风险的因果关系
通过6种MR方法评估了325项NMR血清生物标志物与PC发生风险之间的因果联系。分析最终锁定4项显著关联的代谢物,其效应方向在全部方法中保持一致(
图2),表明结果的稳健性。
在这些代谢物中,有3种代谢物与PC风险呈显著的保护性关联。其中,中密度脂蛋白(IDL)中磷脂与总脂质的比值(GCST90445881)升高与PC发生呈明显负相关,IVW结果显示每升高1单位可使风险降低约降0.741倍(OR=0.741,95% CI=0.612~0.897,P=0.002)。小高密度脂蛋白(HDL)中磷脂与总脂质的比值(GCST90446027)同样表现出保护效应,IVW结果表明其增加会使PC风险降低0.816倍(OR=0.816,95% CI=0.676~0.984,P=0.033)。此外,极大极低密度脂蛋白(VLDL)中游离胆固醇与总脂质的比值(GCST90446151)与PC风险呈负相关,IVW分析显示该代谢物每增加1个单位,PC的风险大约降低0.702倍(OR=0.702,95% CI=0.537~0.917,P=0.009)。相反,乳糜微粒和极大VLDL中甘油三酯占总脂质比值(GCST90446157)则与PC呈正相关,每单位增幅使发病风险上升1.355倍(OR=1.355,95% CI=1.069~1.718,P=0.012)。整体来看,磷脂和游离胆固醇相关比例的升高倾向于降低PC风险,而甘油三酯比例的增加则可能促进疾病发生,这为代谢物介导的风险评估和干预提供了新的线索。
2.2 敏感性分析结果
为进一步观察各工具变量的单独效应,首先绘制了单一SNP效应森林图(
图3),结果显示4种显著代谢物的所有SNP效应方向基本一致,与总体IVW估计保持同向。随后,我们对显著关联的代谢物进行了多重敏感性分析,验证结果的稳健性与可信度。MR-Egger截距项检验显示,所有模型的截距均
P>0.05,提示未检测到显著的水平多效性;MR-PRESSO全局检验亦无异常(
P>0.05),进一步排除了潜在多效性或离群值对结果的干扰。Steiger检验结果显示不存在反向因果关系(
表2)。
其次,Cochran's
Q检验未发现工具变量之间存在明显异质性(均
P>0.05),说明各SNP效应量的一致性良好。综合上述结果,可确认本研究的因果估计未受到水平多效性或异质性的显著影响,分析结论具有较高的稳健性与可靠性。留一法逐一剔除SNP后,剩余工具变量的效应量始终落在总体95%
CI之内,误差线未越过零效应界,表明任何单一SNP均不足以主导结果(
图4)。散点图和漏斗图的对称性进一步证实了结果的稳健性和一致性(图
5-
6)。
3 讨 论
本研究系统地利用MR方法,结合来自UK Biobank和FinnGen的大规模GWAS数据,评估了325项NMR血清生物标志物与PC风险之间的因果关系。结果确认4项脂质代谢物与PC风险显著相关,其中磷脂/总脂质比例(GCST90445881、GCST90446027)和游离胆固醇比例(GCST90446151)的升高与PC风险显著负相关,提示这些代谢物具有保护作用,而甘油三酯(GCST90446157)的增高则促进PC的发生。这一发现为理解PC的代谢重编程提供了新的视角,也为脂质代谢指标成为PC早期诊断标志物及潜在治疗靶点奠定了重要基础。与现有文献相比,本研究通过遗传工具克服了传统观察性研究中的混杂偏倚和反向因果关系问题,提供了更为强有力的因果证据。此外,研究利用6种不同的MR方法验证了结果的稳健性,通过多重敏感性分析排除了潜在的多效性和异质性,确保了因果推断的准确性与可靠性。
脂质代谢在PC的发生和进展中扮演着重要角色。PC细胞的生长离不开磷脂、胆固醇及脂滴存储,因此其对外源脂质摄取与内源脂质合成高度依赖
[26]。磷脂和胆固醇不仅是细胞膜的关键成分
[19],也与细胞的生物膜流动性、信号转导及抗凋亡能力密切相关
[27]。其中,磷脂/总脂质比例的升高可通过增强膜流动性和稳定性,改善细胞在应激环境中的生存能力,从而对PC形成一定的保护作用
[28];此外,在很多肿瘤细胞中都能观察到大量的脂滴积累,如乳腺癌
[29]、PC
[30]等,而磷脂含量增加还会降低脂滴生成,限制肿瘤细胞获得氧化脂肪酸
[31]。值得一提的是,近期有研究证实磷脂代谢与铁死亡之间的重要联系
[32],磷脂代谢重塑可以调控铁死亡的敏感性,从而获得肿瘤细胞对放化疗的抗性。游离胆固醇与总脂质的比例升高也与PC风险呈负相关,该比例的升高通常与胆固醇酯化程度下降相伴,而PC常通过ACAT1介导的胆固醇酯化来维持内质网稳态和转移潜能
[33],例如,Sun等
[34]指出,抑制ACAT1可增强CD8⁺ T细胞抗肿瘤活性并抑制肿瘤生长,同时促进肿瘤微环境中免疫反应的活化。因此游离胆固醇比值升高可能破坏肿瘤细胞的代谢适应性
[35],进而抑制肿瘤生长。这一发现与现有文献一致,例如Bilen等
[36]和Gutierrez等
[35]就已发现治疗高胆固醇血症的药物bempedoic acid(ETC-1002),它在肝脏中被激活后通过抑制ACLY并激活AMPK,从而降低胆固醇和脂肪酸合成。这些发现为我们观察到的游离胆固醇/总脂质水平升高与PC风险负相关提供了机制支撑,为未来胆固醇代谢作为靶点的治疗策略提供了理论支持。
甘油三酯/总脂质比例的增加则反映肿瘤细胞对高能量供给的依赖,通过活化PPARδ通路,促进了肿瘤细胞的快速增殖
[37],增强癌细胞的存活能力
[38-39]。此外,甘油三酯丰富的脂蛋白可被脂蛋白脂酶
[39]及CD36
[40-41]高效水解摄取,为快速增殖的PC细胞提供β-氧化底物与炎症脂质介质。同时,Guerrero-Rodríguez等
[42]表明,若在小鼠模型中敲除或抑制CD36可减缓肿瘤的生长,肿瘤生长将显著减缓,进一步验证了脂质代谢在肿瘤生长中的重要作用。本研究的遗传证据与上述代谢依赖性高度吻合,并支持“脂质重编程”是PC发生的关键节点。
综上所述,本研究利用MR方法,首次从遗传角度揭示了脂质代谢与PC风险之间的因果关系。特定脂质组分的增加可能有助于减少PC的发生,而甘油三酯的增加则可能促进疾病进展。这些结果提示,脂质代谢相关的血清标志物,如磷脂/胆固醇比值和甘油三酯/总脂质比值,可能成为PC早期诊断的潜在生物标志物。临床上可以通过血液检测这些代谢物,结合其他风险因素(如CA19-9、家族史等),提高高危人群的早期筛查效率。此外,针对脂质代谢的干预,如降低甘油三酯水平或调节胆固醇代谢,可能为未来PC的早期诊断、预防和治疗提供了新的理论依据和方向,并为未来的多组学研究和临床干预提供了潜在方向。
然而,本研究也存在一些局限性。首先,本研究的数据来源于欧洲人群,结果的普适性需要通过多族群的验证,未来研究应在不同种族人群中复现这些发现,进一步验证跨族群的一致性与普适性。其次,尽管研究通过敏感性分析排除了潜在的多效性问题,仍可能存在遗传背景和环境因素未被完全控制的情况,例如代谢物水平还可能受到饮食、用药史、合并疾病等生活方式和临床因素的影响,当前MR设计因缺乏个体水平数据而无法完全调整上述潜在混杂因素。未来可以通过整合个体层面临床、生活方式和环境暴露信息,进一步提高因果推断的精度。第三,本研究结局数据的病例数相对有限,可能限制了检测低效应量暴露的统计效能。因此,未来研究中有必要增加更大的PC队列数据,以确保结果的统计效力和稳健性。并进一步探讨这些脂质代谢物的具体分子机制,并结合单细胞、多组学分析揭示其具体的肿瘤微环境调控作用,或能开发针对脂质代谢通路的临床干预策略,以期在PC早期诊断和精准治疗中实现临床转化应用。