结直肠癌(CRC)是全球第3大常见肿瘤,也是主要癌症致死原因之一。其发生发展受遗传易感性、表观遗传调控及环境因素等多重影响,但机制尚未完全阐明
[1]。近年来,分子生物学和流行病学研究拓宽了人们对CRC的认识,尤其是T细胞在免疫监视中的作用及肠道菌群对肿瘤发生发展的影响
[2, 3]。研究表明,肠道菌群失衡可通过诱导慢性炎症和代谢调节促进肠上皮恶性转化
[4, 5];同时,菌群代谢产物如短链脂肪酸丁酸可抑制肿瘤生长并增强抗肿瘤免疫
[6]。
肠道菌群作为人体重要的共生生态系统,不仅参与物质代谢和能量转化,还在免疫调节和宿主防御中发挥关键作用
[7]。其稳态破坏与多种消化道疾病密切相关,菌群失衡可通过代谢产物及抗原呈递途径干扰免疫应答,进而参与结直肠癌发生
[8, 9]。研究表明,肠道菌群可通过表观遗传调控和免疫细胞间通讯影响T淋巴细胞亚群的分化与功能,从而改变机体对病原体和异常细胞的识别能力
[10]。例如,厚壁菌门的
Blautia属为产乙酸菌,其短链脂肪酸可促进调节性T细胞,抑制炎症并减缓结直肠癌进程
[11];脆弱拟杆菌(
Bacteroides fragilis)通过分泌SMO蛋白产生致癌毒素,损伤结肠上皮DNA,并通过激活Th17反应促进肿瘤发生
[12];
Fusobacterium nucleatum可分泌Fap2蛋白结合T细胞受体TIGIT,抑制其抗肿瘤作用,同时其短链脂肪酸与GPR43结合,调控IL-17表达,加剧炎症并推动癌变
[13]。
T淋巴细胞作为适应性免疫的核心效应细胞,其通过特异性受体识别抗原的机制已被广泛认知
[14]。在结直肠癌微环境中,不同T细胞亚群呈现显著的生物学异质性:CD8
+细胞毒性T细胞通过穿孔素-颗粒酶途径介导肿瘤细胞溶解,而调节性T细胞则通过免疫抑制微环境促进肿瘤免疫逃逸
[15, 16]。这种免疫平衡的动态变化为揭示结直肠癌发生机制提供了方向。
基于遗传变异的孟德尔随机化(MR)方法,通过筛选与暴露因素强相关的单核苷酸多态性(SNP)作为工具变量,能够有效克服传统流行病学研究中的混杂因素干扰
[17]。
本文采用双向MR分析揭示了暴露因素与结局的因果关系,克服了传统观察性研究中的混杂偏倚和反向因果问题,为阐明肠道微生态与T细胞联合作用于结直肠癌提供因果证据,并为靶向干预提供理论支持。结直肠癌与肠道菌群或T细胞的关系已成为研究热点。例如,拟杆菌分泌脆弱拟杆菌毒素可破坏肠上皮紧密连接,诱导IL-17、IL-22等促炎因子,促进Th17细胞极化并抑制Treg和树突状细胞功能,营造免疫抑制微环境,推动肠癌发生
[18];而产丁酸菌减少则导致短链脂肪酸缺乏,无法通过促进Treg分化、抑制Th17炎症反应来维持肠道屏障和抑制炎症,最终形成促癌环境
[19]。但三者间的因果联系仍不清。本研究整合GWAS等数据库,采用两样本正反MR分析,以逆方差加权法(IVW)为主,结合MR-Egger、加权中位数法(Weighted median)、简单模式法(Simple mode)、加权模式法(Weighted mode)的方法,并利用MR-PRESSO和MR-Egger回归检测水平多效性,Cochran's Q检验识别异质性,留一法进行敏感性分析,系统解析肠道菌群与T细胞亚群特征对结直肠癌的因果作用,揭示潜在机制,为预防和治疗提供新思路。
1 资料和方法
1.1 数据来源
肠道菌群GWAS数据来自MiBioGen数据库,共有211个肠道菌群,包含9个门、16个纲、20个目、35个科和131个属,该数据库囊括了24个队列中的18340名个体的全基因组基因型信息(
https://mibiogen. gcc.rug.nl/menu/main/home/);T细胞数据来自IEU OpenGWAS(
https://gwas.mrcieu.ac.uk/datasets/ebi-a-GCST90001511/);结直肠癌数据来自IEU OpenGWAS(
https://gwas.mrcieu.ac.uk/datasets/ebi-a-GCST90018 808/)本研究暴露因素和结局的数据均为公开数据库数据,无需伦理批准。
1.2 研究假设
作为遗传工具变量的SNP位点需要满足以下假设
[20]:SNP与目标暴露因素存在显著遗传关联;SNP独立于混杂因素,其分布不受到潜在混杂变量的影响;SNP对疾病结局的作用必须完全由暴露因素介导,且不存在其他生物学通路。
1.3 工具变量的筛选与去除
在本研究中,为了确保肠道微生物群与结直肠癌或T细胞之间因果关系的准确性和有效性,我们采用
P<1.0×10
-5来筛选SNP,并基于此标准选取相关的SNP作为IVs;而T细胞和结直肠癌之间的采用
P<5.0×10
-8来筛选SNP,也基于此标准选取相关的SNP作为IVs
[21]。设置连锁不平衡系数
r2 <0.001,区域宽度kb=10 000,以消除连锁不平衡关系
[22],保证SNP相互独立,避免偏倚。计算
F统计量,若
F<10提示该SNP为弱IVs,对其进行剔除。当检测到回文SNP时,为了消除等位基因对因果关系分析的潜在影响,将这些回文SNP从数据集中剔除。
1.4 统计学分析
所有数据分析与可视化均使用R语言(4.4.2)。以IVW作为主分析方法,同时采用MR-Egger、Weighted median、Simple mode、Weighted mode作为补充进行孟德尔随机化分析以评估IVW方法的稳健性
[23],以优势比(OR)和95%置信区间(
CI)来评估特定肠道菌群、T细胞水平与结直肠癌风险之间的关联强度,接着,为了检验遗传变异作为工具变量的有效性,运用MR-PRESSO和MR-Egger回归方法来检测水平多效性,确保遗传变异主要通过肠道菌群或T细胞影响结直肠癌风险。同时,通过Cochran's Q检验来识别不同遗传变异与结直肠癌风险关联之间的异质性,以确保结果的普遍性。最后,采用留一法进行敏感性分析,逐个排除每个遗传变异,以评估单个变异对整体结果的影响,从而提高研究结果的稳健性和可信度。通过这一系列方法的综合应用,能够更准确地揭示肠道菌群、T细胞与结直肠癌之间的因果关系。
使用MR-Egger方法检验并校正潜在的多效性影响,虽然其统计效率不及IVW,但当工具变量之间存在多效性时,MR-Egger成为更合适的选择
[24];而在估计中若有一半的工具变量可能无效,Weighted median方法则能提供更为稳健的因果效应估计
[25],Simple mode通过快速识别最常见估计值简化了分析过程,而Weighted mode则通过考虑工具变量的统计权重来提高估计的精确性,两者在处理特定情况,如当IVW的严格假设不满足或存在无效工具变量时,能够提供额外的稳健性
[26]。
为确保结果的稳定性,研究进行了一系列敏感性分析。首先,使用Cochran Q 统计量来检测SNPs之间是否存在异质性,
P<0.05表明存在异质性
[27];接着,通过MR-Egger回归的截距项来识别水平多效性,
P<0.05则提示存在水平多效性,其中截距项代表在暴露量为零时结局的发生情况,若截距项接近零,则IVW和MR-Egger的结果较为一致,否则表明存在水平多效性;为校正水平多效性,本研究采用MR-PRESSO方法移除引起显著差异的SNPs,以获得更准确的估计值
[28];此外,运用留一法来检查是否存在对结果有显著影响的SNPs
[29]。最后,Steiger检验被用于评估MR-Egger回归中遗传变异与暴露因素关联的稳健性,以确定是否存在潜在的多效性影响,
P≤0.05为差异有统计学意义
[30]。
1.5 反向MR分析
反向MR分析主要用于检验因果关系是否存在双向性,排除结局变量对暴露因素的反向因果效应,从而验证正向MR结果的可靠性,若结果不显著则表明正向MR的结果具有可靠性,这种方法是通过双向检验排除干扰,使因果结论更严谨。为了排除三者之间的反向因果影响,以结直肠癌或T细胞为暴露,以肠道菌群为结局,进行反向MR分析以及为了排除结直肠癌对T细胞的反向因果影响,以结直肠癌为暴露,以T细胞为结局,进行反向MR分析,其方法与正向 MR 分析相同。
2 结果
2.1 肠道菌群与结直肠癌的正向MR分析结果
以肠道菌群为暴露因素、结直肠癌为结局变量,在211种肠道菌群中,按照F>10,MR-Egger回归分析的截距中不存在水平多效性,异质性检验及多效性检验显示没有异质性及多效性的筛选标准,共筛选出11种菌。森林图见(
图1),留一图见(
图2)。这11种菌的IVW分析结果为:
Prevotella7属(OR=1.101,95%
CI:1.033~1.172,
P=0.003)、
Faecalibacterium属(OR=0.861,95%
CI:0.750~0.988,
P=0.034)、
Ruminococcaceae UCG011属(OR=1.095,95%
CI:1.007~1.189,
P=0.033)、Ruminococcaceae UCG004属(OR=1.162,95%
CI:1.037~1.302,
P=0.010)、
Eubacterium brachy group属(OR=1.121,95%
CI:1.036~1.214,
P=0.005)、Lachno-spiraceae FCS020 group属(OR=1.115,95%
CI:1.012~1.229,
P=0.028)、
Eubacterium xylanophilum group属(OR=0.818,95%
CI:0.712~0.940,
P=0.005)、
Coprobacter属(OR=1.103,95%
CI:1.008~1.207,
P=0.033)、
Prevotella9属(OR=0.903,95%
CI:0.828~0.985,
P=0.021)、Enterobacteriaceae科(OR=0.841,95%
CI:0.733~0.963,
P=0.012)、Enterobacteriales目(OR=0.841,95%
CI:0.733~0.963,
P=0.012)。其中,
Prevotella7属、Ruminococcaceae UCG011属、Ruminococcaceae UCG004 属 、
Eubacterium brachy group属、Lachnospiraceae FCS020 group属、
Coprobacter属与结直肠癌风险呈正相关,而
Faecalibacterium属、
Eubacterium xylanophilum group属、
Prevotella9属 、Enterobacteriaceae科、Enterobacteriales目呈负相关。
2.2 肠道菌群与结直肠癌的反向MR分析结果
根据2.1项下得到的具有显著性的肠道菌群进行了反向MR,结果显示,本研究中的正向MR的结果不存在反向因果关联(
表1)。
2.3 T细胞与结直肠癌的正向MR分析结果
采用两样本MR方法,发现CD25
++CD45RA
- CD4非调节性T细胞(占CD4
+ T细胞的比例)与结直肠癌风险之间存在统计学显著的负向关联。基于IVW的分析显示,该细胞比例每增加一个标准差单位,结直肠癌风险将降低6.5%(OR=0.935,95%
CI: 0.878~0.995,
P=0.035)。结果见(
表2)和(
图3)。在敏感性分析中,多项检验进一步验证了结果的可靠性,异质性检验:MR-Egger(Q=3.23,
P=0.072)和IVW(Q=3.36,
P=0.187)均未发现显著异质性,显示遗传工具变量的效应方向一致,未受潜在混杂因素干扰;多效性检验:MR-Egger回归的截距项无统计学意义(截距=0.021,SE=0.106,
P=0.874),显示所选基因变异不存在明显的水平多效性偏倚;留一法验证:未发现单个SNP对整体关联存在过度影响,显示结果具有稳健性。
2.4 T细胞与结直肠癌的反向MR分析结果
反向MR结果显示,结直肠癌与CD25
++ CD45RA
-CD4非调节性T细胞不存在因果关系(
表3)。
2.5 肠道菌群与T细胞的正向MR分析结果
森林图见(
图4);留一图见(
图5)。IVW分析结果为:Ruminococcaceae NK4A214 group属(OR=0.775,95%
CI:0.615~0.978,
P=0.031)、
Eubacterium xylano-philum group属(OR=1.359,95%
CI:1.016~1.818,
P=0.039)、Ruminococcaceae UCG010属(OR=0.739,95%
CI:0.547~0.998,
P=0.049)、Selenomonadales目(OR=1.459,95%
CI:1.079~1.972,
P=0.014)、Family XIII AD3011 group属(OR=0.717,95%
CI:0.560~0.917,
P=0.008)、
Coprobacter属(OR=0.812,95%
CI:0.672~0.981,
P=0.031)、Negativicutes纲(OR=1.459,95%
CI:1.079~1.972,
P=0.014)、Bifidobacteriaceae科(OR=1.255,95%
CI:1.002~1.572,
P=0.048)、
Allisonella属(OR=0.815,95%
CI:0.692~0.960,
P=0.014)、Bifido-bacteriales目(OR=1.255,95%
CI:1.002~1.572,
P=0.048)、
Coprococcus1属(OR=1.273,95%
CI:1.020~1.589,
P=0.033)。其中,
Eubacterium xylanophilum group属、Selenomonadales目、Negativicutes纲、Bifido-bacteriaceae科、Bifidobacteriales目、
Coprococcus1属与T细胞风险呈正相关;而Ruminococcaceae NK4A214 group属、Ruminococcaceae UCG010属、Family XIII AD3011 group属、
Coprobacter属、
Allisonella属呈负相关。
2.6 肠道菌群与T细胞的反向MR分析结果
根据2.5项下得到的具有显著性的肠道菌群进行了反向MR,结果显示,本研究中的除Allisonella属外,其余10种菌的正向MR的结果均不存在反向因果关联(
表4)。
2.7 肠道菌群、T细胞和结直肠癌的异质性检验
在进行敏感性分析时,本文对所选研究进行了异质性和多效性检验。分析结果中,当
P>0.05,这显示研究结果不存在异质性和多效性问题,反之亦然。此外,通过留一法分析进一步验证了结果的稳健性。具体的异质性分析结果可参见(表
5、
6)。
3 讨论
近年来,尽管在探索肠道菌群与结直肠癌之间的关联机制方面取得了一定的研究成果,但关于特定肠道菌种类与T细胞以及结直肠癌发生之间具体联系的研究仍然相对较少。因此,本研究建立了肠道菌群-T细胞-结直肠癌在临床上的联系,采用中介分析量化T细胞中的成分,并通过双向孟德尔随机化分析排除反向因果,这从方法上突破传统观察性研究的局限。研究结果显示:首先,11种肠道菌群与T细胞存在因果关系,其中6种菌群与T细胞呈正相关,5种呈负相关;其次,CD25++CD45RA-CD4非调节性T细胞与结直肠癌存在因果关系;第三,11种肠道菌群与结直肠癌存在因果关系,其中6种菌群与结直肠癌呈正相关,5种呈负相关。值得注意的是,Coprobacter属和Eubacterium xylanophilum group属是两类研究中共有的菌属。Eubacterium xylanophilum group菌可通过促进CD25++CD45RA-CD4非调节性T细胞的活性从而抑制结直肠癌的发展;而Coprobacter属菌可导致CD25++CD45RA-CD4非调节性T细胞未加入而使结直肠癌恶化。由此建立的"菌群-T细胞-结直肠癌"单向因果链揭示了肠道菌群通过调控T细胞功能影响结直肠癌发生的机制。
在探讨肠道菌群与T细胞之间的因果关联时,MR分析显示
Allisonella属与T细胞之间存在正向关联,但反向分析也显示有统计学差异,提示该结果可能存在多重可信性缺陷,包括工具变量有效性不足、显著的水平多效性、因果方向合理性存疑,以及菌群测量误差的潜在干扰
[31]。这些因素显示,该双向阳性关联不符合孟德尔随机化研究的核心假设,不能认定为
Allisonella属与T细胞之间存在真实的因果关系,而可能是由方法学偏倚及未控制的混杂因素所导致的虚假关联。
在结直肠癌与肠道菌群的反向MR敏感性分析中,发现Prevotella7属、Faecalibacterium属和Coprobacter属与结直肠癌存在异质性,提示这些遗传变异可能并非特异性通过结直肠癌或肠道菌群单一途径发挥作用,而是可能涉及其他未知的生物学过程或混杂机制。
Coprobacter属属于拟杆菌门,该属最早从人类粪便中分离得出
[32]。
Coprobacter属在结直肠癌患者的粪便菌群中丰度显著降低
[33],且拟杆菌门与促炎反应、肠道屏障功能障碍相关,对宿主免疫系统具有双向调节作用,既可以充当免疫促进剂,也可能成为免疫抑制剂
[34];
Eubacterium xylanophilum group属于厚壁菌门下的毛螺菌科,是一类厌氧或兼性厌氧的革兰氏阳性菌,通常与肠道微生物群密切相关,参与分解复杂多糖(如木聚糖)等重要代谢过程
[35]。另外,
Eubacterium xylanophilum group通过促进Th17细胞活化并分泌IL-17、IFN-γ等促炎因子,进而引发结肠组织炎症细胞浸润等病理变化,肠黏膜通透性增加,血清脂多糖水平升高,进一步加剧炎症反应
[36];在结直肠癌小鼠模型中,
Coprobacter属的
Coprobacillus cateniformis可下调树突状细胞 PD-L2 表达,解除其与T细胞 RGMb 的抑制性结合,从而激活CD8
+ 效应T细胞、抑制调节性T细胞功能,增强抗 PD-L1 治疗对结直肠癌的抑制效果
[37]。
综上所述,本研究通过借助公开的基因组关联研究数据,不仅为深入理解肠道菌群在结直肠癌免疫微环境中的作用提供了思路,还为探讨肠道菌群与T细胞相互作用机制提供了临床研究依据。同时,本研究致力于开发基于肠道菌群-T细胞通路的靶向治疗方法,旨在提高结直肠癌患者的生存率和生活质量。此外,本研究为后续的流行病学研究提供了科学依据,并进一步强调了在临床研究中实施肠道菌群监控的必要性,提出将肠道菌群监控与免疫系统监控结合,作为一种前瞻性策略,用于结直肠癌的预防、诊断和治疗。