胰腺癌(pancreatic cancer,PC)是世界范围内最致命的恶性肿瘤之一,以其发病隐匿、进展迅速和治疗效果差而著称。2022年全球PC新发病例数超过49万例,死亡病例数约46万例,其年龄标化发病率在北美、欧洲等高发展水平地区较高,且不同国家PC的5年净生存率普遍低于10%
[1],提示明显的人群和地区差异,并反映全球诊疗水平不均
[2]。目前,手术切除仍是PC唯一有望实现治愈的治疗方法,但超过80%的患者在诊断时已为晚期,丧失了手术机会
[3]。尽管近年来治疗技术不断进步,但PC的总体预后仍未获得明显改善。因此,深入探讨PC发病机制、识别早期诊断标志物及潜在治疗靶点至关重要。
血清代谢物是机体代谢状态的直接反映,已被广泛应用于肿瘤风险评估与生物标志物开发
[4-5]。多项前瞻性研究表明,部分代谢物在PC临床确诊前数年已出现异常,如支链氨基酸和能量代谢相关代谢物与PC风险呈稳健关联
[6-9]。然而,该领域仍存在若干关键争议,例如不同研究平台和质控流程导致结果复现性受限
[10-12];代谢物易受炎症、吸烟、药物等多因素干扰,存在残余混杂
[13-14];不同脂质组分与癌症风险的关联在观察性研究与遗传学研究中结论不一等等
[15-17]。因此,利用遗传工具进行因果推断,对阐明代谢物在PC发生中的具体作用具有重要意义
[18]。
在此背景下,本研究基于大规模GWAS数据与胰腺组织eQTL数据,综合运用孟德尔随机化(Mendelian randomization,MR)方法
[19],系统评估325种血清代谢物与PC风险的因果关联,筛选PC风险相关基因,并进一步构建基因-代谢物-PC的因果链条,以期在跨人群适用性与方法学稳健性兼顾的前提下,为PC的早期标志物遴选与可干预代谢靶点提供新的证据支撑。
1 资料与方法
1.1 研究设计
本研究综合应用双样本孟德尔随机化(two-sample Mendelian randomization,TSMR)分析和基于汇总数据的孟德尔随机化(summary-data-based Mendelian randomization,SMR)分析,以系统探讨血清代谢物、PC风险基因与PC之间的因果关系,并表征与代谢物相关通路的因果联系。具体步骤如下:首先使用TSMR分析确定325种血清代谢物与PC风险之间的因果关联,筛选出与PC显著相关的代谢物;利用SMR分析方法,以PC GWAS数据和胰腺组织的eQTL数据为基础,筛选PC风险相关的基因(阈值设为P_SMR<0.05且P_HEIDI>0.05);最后使用上述筛选得到的PC风险基因的eQTL数据,与第一步中的阳性血清代谢物进行TSMR分析,确定显著的基因-代谢物因果配对,据此描绘基因、代谢物及PC的因果关联链。
1.2 数据来源
为确保TSMR分析中因果推断的稳健性,数据均限定于欧洲血统样本,以降低由连锁不平衡结构和等位基因频率差异导致的估计偏倚。其中,风险基因
eQTL数据来源于GTEx v8数据库的胰腺组织eQTL数据,避免跨组织信号引入的混杂,共纳入670个欧洲血统个体。血清代谢物GWAS数据(GCST90445833-GCST90446157)来自GWAS Catalog数据库(
https://www.ebi.ac.uk/gwas),涵盖325种核磁共振技术检测的血清代谢物,包括脂质、脂蛋白及代谢产物,共纳入94 711个欧洲血统个体,涉及15 039 063个单核苷酸多态性(SNP)。PC GWAS数据来源于芬兰生物库FinnGen第12轮数据,GWAS编号为finngen_R12_C3_PANCREAS_EXALLC,涵盖381 888例欧洲个体,共包含20 111 170个SNP位点(
表1)。
1.3 工具变量筛选
工具变量筛选严格遵循MR分析的三个基本假设:(1) 工具变量与暴露因素显著相关;(2) 工具变量与潜在混杂因素无关;(3) 工具变量仅通过暴露因素影响结局变量。TSMR分析中,采用P<5×10-8阈值筛选显著SNP;SMR分析中,采用P_SMR<0.05且P_HEIDI>0.05作为筛选风险基因的标准。通过连锁不平衡筛选确保SNP独立性(r²<0.001,窗口大小为10 000 kb),并计算工具变量F统计量(F>10)确保有效性。
1.4 统计学处理
本研究中,TSMR分析主要采用逆方差加权法(inverse variance weighting,IVW),同时进行MR Egger回归(MR-Egger)、加权中位数法(weighted median)及加权模式(weighted mode)作为敏感性分析。SMR分析用于筛选PC风险基因,采用SMR工具对PC GWAS数据与胰腺eQTL数据进行分析。使用MR-PRESSO进行多效性检验,Steiger检验验证因果方向,Cochran Q统计量进行异质性检验。所有统计分析均在R软件(版本4.3.2)环境中完成,主要使用TwoSampleMR和MR-PRESSO软件包。
2 结 果
2.1 与PC风险呈显著因果关联代谢物筛选
本研究利用TSMR方法,系统分析325种血清代谢物与PC风险之间的潜在因果关系。最终鉴定出4种血清代谢物与PC风险显著相关(
图1)。其中GCST90445837(血清白蛋白水平)与GCST90446023(小高密度脂蛋白(HDL)中游离胆固醇占总脂质的百分比)表现为PC的危险因素。具体而言,血清白蛋白水平每增加1个单位,PC风险增加45.6%(
OR=1.456,95%
CI=1.139~1.862,
P=0.003);小HDL中游离胆固醇占总脂质的百分比每增加1个标准差,PC风险增加18.9%(
OR=1.189,95%
CI=1.054~1.340,
P=0.005)。
相反,GCST90445881[中间密度脂蛋白(IDL)中磷脂占总脂质的百分比]和GCST90446027[小HDL中磷脂占总脂质的百分比]则表现出显著的保护作用。其中,IDL中磷脂占总脂质的百分比每增加1个标准差,PC风险降低20.8%(OR=0.792,95% CI=0.685~0.916,P=0.002);小HDL中磷脂占总脂质的百分比每增加1个标准差,PC风险降低16.4%(OR=0.836,95% CI=0.718~0.973,P=0.002)。
为验证上述关联的稳健性与可靠性,研究进一步开展敏感性分析。留一法分析显示,当逐个剔除单个SNP后,4种代谢物的因果效应估计结果未发生明显改变,表明单个SNP并未过度影响整体结果(
图2A)。漏斗图分析结果呈现出良好的对称性,未发现明显的横向多效性和异质性(
图2B)。此外,散点图分析进一步表明各遗传工具变量效应大小与总体效应方向一致(
图2C)。森林图分析也证实了各个SNP在效应估计中的一致性(
图2D),进一步保证了结果的稳健性与可靠性。
2.2 SMR分析鉴定PC风险基因
为进一步揭示PC风险的潜在遗传机制,研究结合PC GWAS数据与GTEx v8胰腺组织的eQTL数据,利用SMR分析共鉴定出196个与PC风险显著相关的基因(
图3)。其中111个基因表现为保护性基因,即其表达升高与PC风险显著降低相关;另有85个基因表现为风险基因,即其表达升高与PC风险显著升高相关。具体而言,
CDC37P1、
DGKQ、
SULT1A2、
CDYL2等基因的高表达显著提高PC的发生风险,而
PALMD、
SULT1A1、
HEG1、
UCA1等基因的高表达则显著降低PC的风险。
2.3 PC风险基因与代谢物因果关系对
为进一步探讨PC风险基因与关键血清代谢物之间的调控机制,研究再次进行TSMR分析,以筛选出的196个PC风险基因的eQTL数据作为暴露因素,以显著相关的4个血清代谢物为结局变量。结果最终明确了32对显著的基因-代谢物因果关系(
图4A)。其中16对的基因表达升高显著促进代谢物浓度升高(
OR>1),另有16对基因表达升高则显著降低代谢物浓度(
OR<1)。
图4B通过桑基图进一步直观地展示了这些显著基因-代谢物配对的相互作用关系,线条粗细代表效应大小。
3 讨 论
本研究系统探讨了血清代谢物、PC风险基因及PC之间的因果关联与作用机制。研究首次利用TSMR分析明确了4种血清代谢物(血清白蛋白水平、小HDL中游离胆固醇占总脂质百分比、IDL中磷脂占总脂质百分比、小HDL中磷脂占总脂质百分比)与PC风险之间存在显著的因果关联。其中血清白蛋白水平和小HDL游离胆固醇比例的升高与PC风险显著增加相关,而IDL和小HDL磷脂比例升高则表现为保护作用。此外,研究还通过SMR分析进一步鉴定出196个显著影响PC风险的基因,并最终建立了32对显著的基因-代谢物因果关系配对,揭示PC风险基因可能通过调控特定血清代谢物,进而影响PC的发生,为深入理解PC的发病机制奠定了坚实基础。在临床转化层面,现有前瞻性与验证性研究已表明,代谢物与糖类抗原(CA19-9)联合可显著提高对PC与良性胰腺疾病的判别效能
[20-21],受试者工作特征曲线下面积可达0.90~0.94,且在确诊前多年即出现可检出的信号
[22];在此基础上,本研究所提示的小HDL与IDL相关脂质组分为构建“代谢物+CA19-9”的多模态风险评分提供了优先候选,适合用于高风险人群的分层筛查与复检转诊路径优化
近年来,大量研究提示代谢异常与癌症的发生、发展密切相关,代谢紊乱在癌症进展中的关键作用也已逐步被证实
[23-24]。本研究中发现血清白蛋白水平升高与PC风险显著增加,这与既往部分研究结论有所差异。传统观点认为,低血清白蛋白水平与癌症患者的营养不良及预后较差相关
[25-27]。这种差异可能源于测量学与生物学层面的不同:本研究基于NMR平台测定的白蛋白,其遗传工具反映的是个体长期的、固有的白蛋白水平倾向,涉及肝脏合成与代谢调控通路
[28];而临床观察中的白蛋白是典型的负急性期蛋白,在疾病晚期炎症状态往往下降
[29]。因此,遗传决定的较高基础白蛋白水平,可能反映了机体在肿瘤发生早期异常的蛋白质合成状态或特定的代谢背景,而非单纯的营养或炎症指标。不宜将NMR白蛋白的MR效应简单等同于临床时点白蛋白测值,后续需在外部队列中以靶向定量和分层分析(炎症状态、肝功能)进一步检验其稳健性
[30]。
此外,研究发现的小HDL游离胆固醇比例升高与PC风险增加的结论,与前期已有研究提出的脂质代谢紊乱与多种癌症风险升高一致
[23, 31-32],进一步证实其在癌症风险中的重要性。脂质代谢紊乱不仅与癌细胞的能量代谢重塑有关
[33],还可能调节肿瘤细胞的增殖、迁移及凋亡过程
[31]。而IDL与小HDL中磷脂比例的升高则表现为保护性因素,这可能与磷脂在维持细胞膜结构稳定、细胞凋亡、炎症调节、抑制癌细胞的侵袭及转移有关
[34-35]。以上发现进一步凸显了脂质代谢在PC发生中的重要性,不仅为风险筛查提供了线索,也提示了潜在的干预方向。在药物干预层面,激活LXR-ABCA1轴以促进胆固醇外排
[36-37]或抑制脂肪酸合成酶
[38],已在临床前研究中显示出抗肿瘤潜力;而流行病学研究提示他汀类药物与PC风险小幅下降相关,但其预防价值尚需在特定代谢亚群中进一步验证
[39]。在生活方式层面,有氧运动与体质量管理被证实能改善脂蛋白功能,为通过非药物途径调控代谢、预防PC提供了可能
[40]。
研究还通过SMR分析揭示了PC风险相关的基因特征,特别是
CDC37P1、
DGKQ、
SULT1A2、
CDYL2等基因的表达与PC风险显著升高的关系值得关注。已有研究表明,DGKQ和SULT1A2在乳腺癌、胃癌等其他肿瘤中的异常表达与患者预后不良密切相关,可能通过调控细胞周期及代谢途径影响肿瘤发生与进展
[41-43]。与之相对,
PALMD、
HEG1、
UCA1在肿瘤研究中多表现出肿瘤抑制作用,通过抑制细胞迁移、促进细胞凋亡发挥保护作用
[44-46],提示这些基因可能在PC中也具有重要的保护作用。结合PC以纤维化反应强、脂质代谢重编程显著为特征的生物学背景,本研究的基因信号与4种关键代谢物所代表的脂蛋白与磷脂谱改变在通路层面具有一致性,如DGKQ所属的二酰甘油—磷脂酸信号轴关联膜磷脂重塑与mTOR相关代谢调控
[47-48],SULT1A2的硫酸化酶活性影响胆固醇衍生物与药物内源性代谢
[49],CDC37P1可能反映CDC37-HSP90伴侣轴对KRAS依赖性激酶的稳定维持
[50-51],HEG1与细胞黏附及脂筏结构相关
[52]等等,这些机制恰与本研究在小HDL游离胆固醇比例、IDL与小HDL磷脂比例以及白蛋白表型上观察到的方向性变化相吻合,提示风险基因通过调控胆固醇外排与膜磷脂组成、信号脂质周转及炎症相关的蛋白合成状态,进而影响PC易感与进展。
更重要的是,本研究建立的32对基因-代谢物因果关系对揭示了PC发生发展的基因-代谢网络调控机制。从机制层面来看,许多风险基因本身编码蛋白直接参与脂质、氨基酸等关键代谢途径的调控,影响细胞能量供应、膜结构、信号传导、炎症微环境等多个癌症相关生物过程。此前,尽管已有少数研究提示部分代谢物可能介导遗传因素对癌症风险的影响
[53-54],但基因-代谢物-PC风险的整体因果链条尚未被全面探索与验证。通过本研究的系统分析,不仅发现了单基因与单代谢物的作用,还揭示了多基因、多代谢物交织形成的复杂调控网络,为此,在后续的转化研究中,或可以在患者来源类器官与癌相关成纤维细胞共培养体系中,以与膜磷脂重塑与胆固醇外排密切相关的基因组分作为优先级入口,分别对基因实施基因编辑或小分子抑制,观察小HDL与IDL相关磷脂与游离胆固醇表型的可逆性及对化疗敏感性的影响;继而将经体外验证的基因-代谢标志整合进“代谢物+CA19-9”的临床风险评分,用于外科术前分层与随访决策
[55]。在不扩大数据分析范围的前提下,上述路径将研究所见的因果对从通路层面连到病理特征层面并进一步连到可干预与可测量的临床场景,从而使本研究结果对临床实践具有明确的解释力与可操作性。
当然,本研究亦存在若干局限。首先,所用eQTL数据为胰腺组织数据,但组织异质性及转录调控复杂性仍需结合更大规模、多区域、多节点的组织样本加以佐证,未来可结合多组织eQTL及pQTL数据,在遗传层面构建“基因-蛋白-代谢物”的一致性因果链条。其次,MR分析虽揭示了因果关系,但缺乏实验验证。未来计划通过收集临床标本(如术前血浆与配对肿瘤组织)来初步验证关键的基因-代谢物关联,并利用患者来源类器官模型,对核心通路进行功能干预,以直接评估其生物学效应。最后,本研究样本主要源于欧洲血统,结论的普适性有待确认。后续将在多祖源队列中重复上述分析,进行交叉验证以评估结果的跨人群适用性。
综上所述,本研究通过MR分析方法明确了PC风险基因、血清代谢物与PC风险之间的因果关系,为PC的发病机制研究提供了新的见解,也为PC的早期诊断、生物标志物筛选及个体化治疗策略的开发提供了重要科学依据。