慢性阻塞性肺疾病(COPD)是一种可预防和可管理的呼吸系统疾病,其特征是持续性气流受限
[1]。人口老龄化加重的现况下,COPD的发生率激增,45岁及以上人群的患病率为9%~10%
[2, 3]。2型糖尿病(T2DM)是2022年慢性阻塞性肺病全球倡议(GOLD)指南中公认的COPD最常见的合并症之一
[1]。COPD和T2DM的共发病率每年都在增加,导致对此类患者的临床治疗更加复杂,疾病负担持续增加
[4]。由于COPD引起的许多肺外炎症反应,COPD患者中T2DM的发生率远高于一般人群
[5, 6],应考虑探索这两种疾病的共同致病机制,以实现更合理的治疗策略。多种细胞因子参与的低度全身炎症通路可能是COPD和T2DM之间的共同联系,也是目前研究的热点
[4]。然而,这两种疾病共同的生物学机制仍知之甚少,特别是在分子生物学水平上的研究较为匮乏。针对这些患者的基于共同基因的研究尚未有报道,也罕有临床研究报告。随着基因组技术的进步,科学家们获得了海量基因信息,生物信息学可以处理分析大型数据,它是一种结合数学、信息学、生物学的新型研究工具,其利用公共疾病数据库与多种算法,可以用于分析生物数据背后的作用机制。为此,本研究利用生物信息学技术对两种疾病共同的基因进行了生物信息学研究。
1 材料和方法
1.1 数据来源
在基因表达综合数据库
[7](GEO)中筛选与COPD或T2DM相关的转录组数据集。mRNA表达数据的选择标准包括:智人;同一疾病数据集内的样本类型一致;所有数据都是可访问和可用的。最终选择数据集GSE76925、GSE76894作为COPD和T2DM的相关分析数据集。GSE37768和GSE25724作为验证数据集。数据集具体信息见
表1。
1.2 疾病相关差异基因的筛选
对原始数据进行背景校正和标准化,与基因符号匹配后使用R语言“limma”包
[8](
http://bioconductor.org/packages/release/bioc/html/limma.html)分别对GSE76925 COPD数据集和GSE76894 T2DM数据集中正常和患病组样本来计算基因表达的P值和logFC(倍数变化)并进行差异表达基因(DEGs)分析,筛选同时满足差异倍数1.2倍的基因为差异基因。基于它们的上调或下调鉴定两种疾病差异基因,“VennDetail”包(
https://github.com/guokai8/VennDetail)进行Venn图分析,得到表达趋势一致的两种疾病的共易感基因进行下一步分析。
1.3 共易感基因GO和KEGG富集分析
利用R语言“clusterProfiler”包
[9]对共易感基因进行基因本体论(GO)和京都基因和基因组百科全书(KEGG)(
https://www.kegg.jp/)通路富集分析,阈值筛选
P<0.05。GO由基因的分子功能、细胞成分、生物过程组成。
1.4 共易感基因的PPI网络构建和候选hub基因鉴定
利用STRING
[10]数据库(版本11.5,
http://string-db.org/)构建共易感基因的蛋白互作网络,互作参数设为0.4。使用cytoHubba
[11]插件中4种拓扑分析算法(MCC、BottleNeck、Degree和EPC)分别探索PPI网络中前20个重要基因,4种算法得到的排名前20的交集基因用于Friends分析后,得到候选hub基因。
1.5 候选hub基因的表达验证和诊断效能评价
利用分析数据集(COPD:GSE76925、T2DM:GSE76894)和疾病验证集(COPD:GSE37768;T2D:GSE25724)对上述候选基因进行差异表达验证。采用
t检验对hub基因在患病组和对照组进行差异分析,
P<0.05认为差异有统计学意义,验证筛选得到最终hub基因。通过R包pROC
[13](版本1.18.0,
https://www.rdocumentation.org/packages/)绘制受试者工作特征曲线(ROC),以评估诊断特征的准确性。
1.6 候选hub基因与免疫细胞浸润关联分析
基于CIBERSORT算法
[14](量化特定细胞类型的丰度)计算数据集GSE76925(COPD)和数据集GSE76894(T2DM)所有样品中22种免疫细胞的丰度。通过Spearman相关性分析hub基因与22种免疫细胞的关系。
1.7 药物-基因预测
筛选出的基因用DGIdb数据库
[15]浏览搜索并筛选药物-基因互作关系信息和可药用的基因并用Cytoscape构建网络图。
1.8 hub基因单基因GSEA分析
利用GSEA算法以识别最终hub基因高表达组和低表达组之间的差异调节通路,以确定两种疾病中激活的信号通路。利用“clusterProfiler”包,以KEGG数据集为富集背景,进行单基因GSEA富集分析,显著富集阈值设定为矫正adj.P<0.05。随后通过对两个疾病训练集数据进行GSEA来选择与枢纽基因的高表达密切相关的活化途径。
1.9 临床样本采集和测定
收集于2024年1月~2024年6月在福建省立医院住院患者的血液样本。基于GOLD指南标准诊断COPD,包括持续超过3个月的慢性咳嗽或咳痰、呼吸困难、反复下呼吸道感染和/或暴露于生物燃料因素等。进行肺功能测试确认COPD,表现为使用支气管扩张剂后的FEV1/FVC比值小于0.70。2型糖尿病(T2DM)诊断基于典型的糖尿病症状,包括多饮、多尿、多食、体质量减轻,以及满足血糖水平标准如下:随机血糖水平≥11.1 mmol/L,空腹血糖水平≥7.0 mmol/L,或在葡萄糖负荷后2 h血糖水平≥11.1 mmol/L。排除标准急性疾病(如急性肺栓塞、急性心肌梗死、急性肾衰竭等),除COPD外的其他慢性肺部疾病(如结核病、支气管扩张、间质性肺炎、哮喘等),外分泌胰腺疾病(包括胰腺炎、胰腺外伤/切除、胰腺肿瘤、囊性纤维化、血色病等),其他内分泌疾病、恶性肿瘤、自身免疫疾病、血液病和严重的心脏、肝脏、肾脏功能障碍。本研究收集了匹配年龄、性别和吸烟史的患者数据,并分为4组:健康对照组(n=12)、无COPD的T2DM组(n=12)、无T2DM的COPD组(n=12)和COPD合并T2DM组(n=12)。本研究方案与知情同意书均经福建省立医院医学伦理委员会审核批准(伦理批号:K2019-01-003)。
对这些患者的血清样本进行了酶联免疫吸附测定(ELISA)分析。此外,研究还评估了合并T2DM的COPD患者的肺功能。受试者进行3次测定,选择3次测量中的最佳结果进行分析。使用年龄、身高和体质量的预测值来计算以下参数所需的百分比。研究评估了以下参数: 用力肺活量(FVC,L)、一秒用力呼气量(FEV1,L)、FEV1/FVC比值(%)、一秒用力呼气量占预测值的百分比(FEV1% pred)。酶联免疫吸附测定(ELISA)分析所用试剂盒(Beyotime);肺功能测定所用仪器(Jaeger Master Screen)。
1.10 统计学分析
使用SPSS 24.0统计软件进行数据分析。连续变量以均数±标准差表示,分类变量以n(%)表示。使用t检验对两组间的连续变量进行比较,而卡方检验用于分类变量的比较。P<0.05时认为差异具有统计学意义。
2 结果
2.1 两种疾病相关共同易感基因的筛选
从GSE76925中,筛选得到疾病种上调基因有1757个,下调基因有1582个,基于T2DM数据集GSE76894样本的基因表达矩阵,筛选得到了上调基因有696个,下调基因有1105个,差异基因火山图(
图1A、B)。对2种疾病的差异基因进行Venn图分析(
图1C),得到T2DM和COPD2种疾病的共易感基因175个(92个上调基因和83个下调基因)。
2.2 共易感基因GO和KEGG富集分析
GO分析发现:BP水平上,上调的基因在伤口愈合、对IL-6的反应和整合素激活等过程中显著富集;下调基因与神经元识别、少突胶质细胞分化相关。在MF水平上,上调基因与跨膜受体蛋白酪氨酸激酶活性和跨膜受体蛋白激酶活性相关;下调基因与胃酸分泌、轴突引导和生长激素合成有关。
另外,KEGG富集分析发现上调基因前3位的重要信号通路分别是是补体和凝血级联反应、丁酸甲酯代谢和NOD样受体信号通路等;下调基因在有胃酸分泌、轴突导向和生长激素的合成、分泌与作用等通路中观察到富集(
图2)。
2.3 共易感基因的PPI网络构建和候选hub基因鉴定
利用STRING数据库对2种疾病173个共易感基因进行蛋白互作网络构建(
图3A),然后使用cytoHubba插件中4种拓扑分析算法(MCC、BottleNeck、Degree和EPC)分别预测和探索PPI网络中前20个重要的基因(
图3B),由4种算法得到10个交集基因为:CXCL12,ROBO1,GNAI1,FLT3,CD3D,SEMA5A,GNAS,MMP14,ITPR2和SIRP2(
图3C)。Friends分析表明,CXCL12,ROBO1,GNAI1,FLT3和CD3D表现出最强的关联;CXCL12表现出与其他差异基因的最强关联(
图3D)。
2.4 候选hub基因的表达验证和诊断效能评价
对候选hub基因CXCL12、ROBO1、GNAL1、FLT3和CD3D在分析数据集(GSE76925和GSE76894)和验证数据集(GSE37768和GSE25724)中进行表达验证,只有CXCL12的表达差异情况在两个验证集中和分析数据集中的结果一致,均表现在疾病组中呈上调趋势。(
图4A、B)。对候选hub基因CXCL12、ROBO1、GNAL1、FLT3和CD3D进行ROC曲线绘制(
图4C),结果显示,训练集和验证集中,只有CXCL12的AUC值均得到0.7以上,即CXCl12预测疾病的诊断能力较优异。
2.5 临床数据验证
在福建省立医院收集T2DM患者和COPD患者的血清,使用ELISA测定CXCL12的浓度。结果显示,与对照组(
n=12)相比,COPD患者(
n=12)中CXCL12的表达水平较高,差异具有统计学意义(
P<0.05,
图5A)。T2DM患者的血清CXCL12浓度高于非糖尿病患者(
P<0.05);FEV1% pred与血清CXCL12表达水平之间差异有统计学意义(
r=-0.603,
P<0.05,
图5B)。
2.6 候选Hub基因与免疫细胞浸润关联分析
GSE76925分析显示,与对照组相比,COPD组表现出CD8
+T细胞、γδT细胞、记忆B细胞和单核细胞免疫浸润增加,M0巨噬细胞、CD4
+静息记忆T细胞和树突状细胞免疫浸润减少(
图6A)。GSE76894数据显示,与对照组相比,T2DM组中表现出CD8
+T细胞、调节性T细胞、NK细胞和嗜酸性粒细胞免疫浸润增加(
图6B)。在两种疾病数据集中,CD8
+T细胞均显示免疫浸润增加。GSE76925中COPD样本的进一步分析显示,只有CD8
+T细胞的浸润水平与5个先前的Hub基因(CXCL12、ROBO、GNAI1、FLT和CD3D)相关(
图6C)。在这些基因中,CXCL12与CD8
+ T细胞、γδT细胞和静息肥大细胞呈正相关,而与静息NK细胞和嗜酸性粒细胞呈负相关,所有差异均具有统计学意义(
P<0.05)。
2.7 药物-基因预测
利用DGIdb数据库对5个候选hub基因进行药物-基因预测,得到3个基因,299个药物,99个关系对构建网络(
图7A),与CXCL12相关的药物包括长春新碱、氟达拉滨、阿仑单抗、苯丁酸氮芥、环磷酰胺、强的松、利妥昔单抗等。
2.8 CXCL12单基因GSEA分析
利用GSEA算法以识别最终hub基因高表达组和低表达组之间的差异调节通路,以确定两种疾病中激活的信号通路(
图7B)。选取在2种疾病中同时富集到的与最终hub基因的高表达密切相关的3条通路为细胞因子-细胞因子受体相互作用、造血细胞谱系和黏着过程。
3 讨论
COPD和T2DM是影响人类生活质量的常见慢性疾病,其全球死亡率和发病率逐渐上升
[16]。T2DM是COPD患者的常见并发症,不利于此类患者预后
[17]。然而,COPD和T2DM之间潜在共同发病机制仍不清楚,对同时患有COPD和T2DM的患者的药物治疗策略仍不确定。本研究旨在分析COPD和T2DM之间的共同分子机制,探寻潜在分子靶点。我们使用GEO数据库分析COPD与T2DM芯片数据,共得到175个共易感基因。随后利用STRING数据库构建PPI网络,并进行Friends分析以确定特征基因。通过ROC曲线分析特征基因,观察到CXCL12表达特征对COPD和T2DM有显著价值。本研究表明,CXCL12可能是COPD和T2DM的共同病理因素,为未来针对该特定患者群体的分子生物研究提供了新见解。
基质细胞衍生因子-1(CXCL12),参与体内各种生物过程的重要趋化因子。有研究观察到COPD患者血清中CXCL12显著增加,且与肺气肿程度有关
[21],CXCL12与其配体CXCR4的活化将使成纤维细胞募集到肺部,可导致小气道纤维化,从而使肺功能下降
[18]。此外,它作为重要的调节因子也参与单核细胞肺部募集并促进COPD肺损伤的过程
[19, 20]。CXCL12对T2DM的发生、进展和并发症的出现具有预测意义
[22],它参与调节胰岛β细胞自身免疫并保护β细胞功能
[23]。此外,Yin等
[24]报告CXCL12基因的多种单核苷酸点突变分别与2型糖尿病、血脂异常、血压升高有关。本研究通过对COPD和T2DM的共易感基因进行GO和KEGG富集分析,发现共易感基因在有关伤口愈合、IL-6反应和整合素激活的通路中显著富集。另外,针对CXCL12的GSEA分析显示CXCL12在细胞因子-细胞因子受体相互作用、造血细胞谱系和黏着斑3种通路对两种疾病存在共同作用。因此,CXCL12在生物学上可能参与COPD气道阻塞和肺组织损伤过程,也可能参与糖尿病的发生、发展与转归过程。
细胞因子在炎症反应中的作用需要免疫细胞的参与,因此我们着重分析了CXCL12与免疫细胞浸润的关系,结果表明在两种疾病数据集中均显示CD8
+ T细胞免疫浸润增加。GSE76925中COPD样本的进一步分析显示,只有CD8
+ T细胞的浸润水平与5个先前的Hub基因(CXCL12、ROBO、GNAI1、FLT和CD3D)显著相关。在这些基因中,CXCL12与CD8
+ T细胞呈正相关。CXCL12可诱导人类CD8
+ T细胞表达诱导性一氧化氮合成酶,其与肺损伤有关
[25, 26]。有研究发现,CXCL12可以调节CD8+T细胞对肿瘤的免疫监视
[27]。在肝脏疾病模型中,CXCL12也参与调节CD14
+CD8
+T细胞上的整合素表达,促进它们与局部基质的相互作用
[28]。另外,在肺部感染期间,迁移的中性粒细胞会留下持续的CXCL12痕迹,引导CD8
+ T细胞在肺部募集
[29]。在糖尿病小鼠模型中,用CXCL12下游配体CXCR4的拮抗剂LY2510924减少CD57
+ CD8
+ T细胞的免疫浸润,并改善了高血糖
[30]。因此我们推测:CXCL12在糖尿病合并COPD患者的肺部炎症过程中与其与CD8
+ T细胞的相互作用有关,这还有待于基础实验研究的进一步验证。
目前,对于COPD合并T2DM的患者尚无明确的药物治疗指南,如能针对二者共有的炎症介质设计靶向药物,从而同时解决肺部炎症(COPD)和糖尿病相关炎症很可能是同时治疗T2DM和COPD的最佳方法之一
[32]。基于CXCL12表现出的潜在生物标志物潜力,针对CXCL12设计药物将是很好的策略。靶向CXCL12下游配体CXCR4的AMD3100显著改善了香烟烟雾诱导的小鼠肺泡大小、肺容积和肺静态顺应性
[31]。本研究发现目前临床上的数据库中针对CXCL12的均为化疗相关药物,细胞毒性较大,研究针对CXCL12的小分子药物可能是未来的研究方向。
DPP-4抑制剂是批准用于治疗T2DM患者高血糖症的药物,其主要通过抑制胰高血糖素样肽-1(GLP-1)的降解发挥作用。与DPP-4抑制剂相比,在临床实践中,使用SGLT-2抑制剂可降低阻塞性气道疾病的风险和加重率
[33]。使用GLP-1R激动剂的糖尿病合并COPD患者出现急性加重的风险较低
[34]。由此看来,相较DDP-4抑制剂,GLP-1R激动剂与SGLT-2抑制剂可能更适用于COPD合并T2DM患者的治疗。这可能与CXCL12是DPP-4的天然底物,且CXCL12在肺部发生的炎症效应有关
[35]。因此,通过药物改造降低DDP-4对CXCL12的作用可能是未来提高DDP-4对于COPD合并T2DM患者疗效的方向。
综上所述,CXCL12已被确认为T2DM和COPD之间交叉作用的关键基因之一。针对CXCL12设计药物治疗靶点,将为临床医生制定护理和支持计划提供有价值的信息。