(2024-04-22)
目前,随着牙种植体的制造技术的发展及价格成本的降低,牙种植体已经逐渐成为牙缺失的重要修复方式之一。尽管如此,种植治疗仍然可能因术后或远期的并发症而失败。种植体周围炎是1种由菌斑引发的感染炎性疾病,其病理过程主要表现为植体周围软组织及硬组织的慢性炎症,导致种植体周围软硬组织慢性吸收,最终使种植体失去骨组织的支持,从而引发脱落并导致种植治疗失败。这一病症通常由多种因素,如微生物感染、机械刺激以及宿主免疫反应等因素的相互作用所致。1项Meta分析显示,在欧洲、南美和北美,种植体周围粘膜炎和种植体周围炎的加权平均患病率分别为43%和22%
[1]。1项前瞻性研究显示,国内患者种植体周围炎及种植体骨水平略微降低的概率分别为19%和11.2%
[2]。种植体周围炎目前仍是种植治疗失败的主要原因,患者经过个性化的治疗及护理后,5年留存率有明显升高,但约3/4的种植体仍存在种植体周围组织的慢性炎症,难以根治
[3]。
种植体周围炎的发病过程与多数慢性炎症相似,涉及多种免疫细胞的浸润以及它们之间复杂的相互作用,这些相互作用共同引发免疫反应并导致炎症的激活
[4-5]。为了深入了解这一过程,本研究采用了生物信息学的方法,通过单样本基因集富集分析(single-sample gene set enrichment analysis,ssGSEA)对种植体周围炎症组织的免疫细胞进行分析。这种方法能够提供关于疾病发生过程中免疫细胞活动的关键信息,有助于更全面地理解种植体周围炎的发病机制
[6]。Albrektsson T等
[7]的研究表明,植入物在体内存活是由于慢性炎症和先天免疫系统激活形式的平衡防御反应,当防御/愈合平衡被破坏时,可能会导致种植体边缘骨吸收。以前的研究主要集中在牙周炎与种植体周围炎之间的差异,如差异表达的lncRNA和mRNA
[8],不同的疾病机制
[9]。Zhang XG等
[10]报道了种植体周围炎的潜在基因标志物,但未能深入探索种植体周围炎的免疫细胞及其相关调节的功能。鉴于深入理解免疫生物学过程对于开发精准治疗策略至关重要,本研究聚焦于这一核心且尚未得到充分探索的领域,以期为种植体周围炎的治疗提供新的突破点。
本文运用生物信息学手段,筛选出与种植体周围炎免疫应答相关的差异免疫基因,并通过最小绝对收缩和选择算法(least absolute shrinkage and selection operator,LASSO)逻辑回归进行变量缩减,鉴定种植体周围炎免疫应答的特征性基因,结合KEGG及GO富集分析,进一步阐述特征性基因在种植体周围炎病理过程中主要参与的生物学过程及通路。这一研究旨在为未来种植体周围炎免疫转录调节的深入研究及治疗方案的开发提供新的视角和思路。
1 材料与方法
1.1 微阵列数据
从美国国家生物技术信息中心基因表达数据库(
https://www.ncbi.nlm.nih.gov/gge/)下载3个基因微阵列数据集(GSE106090、GSE33774、GSE57631)。GSE106090包含6个种植体周围炎牙龈样本和6个健康牙龈组织样本。GSE33774包含7个种植体周围炎样本和8个健康牙龈组织样本。GSE57631包含6个种植体周围炎样本和2个健康牙龈组织样本。
1.2 数据预处理和免疫相关差异基因筛选
根据每个数据集平台注释信息将探针转化为对应基因名,使用R软件包limma(version 3.4.2)的removeBatchEffect函数进行去除批次效应,获得去除批次效应后的矩阵。筛选种植体周围炎与健康牙龈组织之间的差异表达基因(differentially expressed genes,DEG),筛选条件为:
P<0.05,|log
2FC|>1。下载ImmPort数据库(
https://immport.org/shared/)收录的免疫相关基因,与差异基因取交集,获得免疫相关差异基因。
1.3 筛选免疫特征性基因
将免疫相关差异基因进行LASSO逻辑回归。本研究采用R软件包glmnet中的cv.glmnet函数进行拟合LASSO模型。以上述处理后的数据为基础,生成受试者工作特征(receiver operating characteristic,ROC)曲线验证筛选出疾病敏感性基因。
1.4 免疫细胞浸润分析及相关性分析
为探索免疫特征性基因和免疫细胞之间的关系。使用“GSVA”软件包(Version 1.50.0)进行ssGSEA分析,并计算标准化的ssGSEA评分以评价每个样品中免疫细胞的富集水平。免疫细胞的标志基因从前人研究中获得
[11],包含12种类型的固有免疫细胞亚群和16种类型的适应性免疫细胞亚群,从TISIDB数据库(
http://cis.hku.hk/TISIDB/)下载。该标志基因列表用于免疫细胞亚型的共有分子亚型分型和估计免疫细胞丰度。分析得到的免疫细胞ssGSEA评分采用Mann-Whitney秩和检验比较健康组与种植体周围炎组的统计学差异,检验水准
α=0.05。
将免疫特征性基因的表达量与免疫细胞ssGSEA评分进行皮尔逊相关性分析,以评估基因与种植体周围炎免疫应答的相关性。
1.5 基因富集分析
为确定免疫特征性基因相关的信号通路及生物学过程,基于R软件包“ClusterProfiler”(Version 4.10.0),对基因名转化的ENTREZ ID及log2FC矩阵进行GO数据库和KEGG数据库的基因集富集分析(gene set enrichment analysis,GSEA)和传统的GO富集分析,获得种植体周围炎发生主要变化信号通路及生物过程,筛选得到免疫特征性基因及差异基因主要参与的种植体周围炎病理机制。
2 结 果
2.1 差异基因筛选
整合并将GSE106090、GSE33774及GSE57631标准化去批次后,每个数据集的表达量分布具有均一性。将标准化的表达矩阵进行差异基因分析,其中
P<0.05共有1 701个基因,
P<0.05且|log
2FC|>1共有242个基因。为排除具有统计学差异但表达量变化不大的基因,本研究采用后者限定差异基因标准。从ImmPort数据库下载了1 793个免疫相关基因列表,并与差异基因取交集,结果显示差异基因中有41个涉及免疫应答的差异基因(
图1)。
2.2 LASSO逻辑回归寻找种植体周围炎免疫特征性基因
将以上筛选出的41个基因通过LASSO逻辑回归筛选变量,随着log(λ)回归系数不断收敛,最终收敛成0,在变量为8时二分类偏差降至最低,模型拟合效果最佳。如
表1所示,最终LASSO回归算法得到以下基因:趋化因子CC配体18(C-C motif chemokine ligand 18,CCL18)
、白细胞介素-1β(interleukin 1 beta,IL1β)
、补体C3(complement C3,C3)
、白细胞介素-6(interleukin 6,IL6)
、利钠肽受体-3(natriuretic peptide receptor 3,NPR3)
、肽酶抑制因子-3(peptidase inhibitor 3,PI3)
、白细胞免疫球蛋白样受体-B3(leukocyte immunoglobulin like receptor B3,LILRB3)
、富亮氨酸重复序列G蛋白偶联受体-4(leucine rich repeat containing G protein-coupled receptor 4,LGR4)。为验证得到的基因是否对种植体周围炎具有疾病敏感性,使用3个数据集整合的矩阵绘制了受试者工作特征(receiver operating characteristic,ROC)曲线,结果显示8个免疫特征性基因均具有0.8以上的曲线下面积(area under the curve,AUC),其中NPR3的AUC达到了0.964(
图2)。
2.3 免疫细胞浸润评分分析
采用ssGSEA分析得到每个样本中28种免疫细胞亚型的浸润评分。其中包含活化树突状细胞、巨噬细胞、肥大细胞、骨髓来源抑制细胞(myeloid-derived suppressor cells,MDSC)等12种固有免疫细胞亚群,主要对侵入的病原体迅速应答,产生非特异抗感染免疫作用,还包含T细胞和B细胞的16种适应性免疫细胞亚群,主要对非己抗原性异物产生特异性的免疫排斥反应,并对抗原产生免疫记忆。相比健康牙龈组织,种植体周围炎样本中23种免疫细胞亚型ssGSEA评分均有不同程度增高。将免疫细胞浸润评分与免疫特征性基因进行皮尔逊相关性分析,
C3、CCL18、IL1B、LGR4、LILRB3及
NPR3与多种免疫细胞均有明显相关性(
图3)。
2.4 GSEA富集分析及免疫特征性基因功能评估
对种植体周围炎组的基因表达变化进行GSEA富集分析后,发现种植体周围炎在GO数据库中主要促进白细胞粘附正向调控、白细胞迁移、细胞趋化、细胞活化的正向调控和白细胞趋化等生物学功能,主要促进表皮形态发生、皮肤生长、角化、表皮生长、半桥粒装配等生物学功能(
表2)。
在KEGG的通路富集中,主要促进N-聚糖生物合成、趋化因子信号通路、移植物抗宿主疾病、产生IgA的肠道免疫网络、细胞因子-受体相互作用等信号通路,主要抑制嗅觉转导、丁酸代谢、细胞色素p450对外源性的代谢、细胞色素p450药物代谢、核苷酸切除修复等信号通路(
表3)。
进一步分析免疫特征性基因在GO数据库的GSEA富集结果中发挥的作用,发现
CCL18富集在白细胞迁移,
PI3富集在体液免疫反应中,说明其在抗体产生和体液免疫调节中扮演关键角色。
LILRB3富集在适应性免疫反应中,可能参与了T细胞和B细胞的活化与调控。
C3在体液免疫反应及适应性免疫反应中均有富集,
IL1B和
IL6在以上提到的3个生物学过程中均富集到,进一步强调了它们在免疫反应中的多功能性和重要性。
LGR4作为免疫特征性基因中少有的下调表达基因,富集在皮肤表皮生长生物过程中,提示其在表皮稳态和再生中可能发挥重要作用(
图4)。
然而,在KEGG与GO数据库的GSEA富集分析结果中均未发现
NPR3所参与的生物过程或信号通路,为深入探究
NPR3在种植体周围炎中的确切作用,本研究另做了传统富集分析。传统富集基于超几何分布方法,专注于在两组样本中识别那些明显富集差异基因的功能类别或生物通路。需要注意的是,与GSEA分析相比,传统富集结果虽然能够指出哪些功能或通路在疾病状态下存在差异,但无法提供这些通路或功能在疾病状态下的具体表达趋势。通过传统的GO富集分析,结果显示
NPR3参与了GO生物过程的白细胞增殖和体液水平调节(FDR<0.05)(
表4,
图5)。
3 讨 论
种植体周围炎是口腔种植体周围软组织及骨组织的感染性慢性炎症,造成支持种植体的牙槽骨慢性骨溶解,最终导致种植体松动脱落,是种植治疗失败的主要原因
[12]。越来越多的研究证据显示,免疫应答在种植体周围炎中起关键的作用
[13-14],但目前的研究仅关注少数几种免疫细胞在种植体周围炎中的骨免疫串扰,且不易将免疫反应与疾病病理过程中关键治疗靶点联系起来。本文旨在研究种植体周围炎发生过程中重要的免疫细胞浸润和重要的免疫特征性基因,并进一步探讨筛选出的免疫特征性基因的生物学机制。通过LASSO逻辑回归和GSEA富集分析,本研究发现
IL1B、IL6、LILRB3、CCL18、C3及
PI3主要调节种植体周围炎发展过程中的体液免疫、适应性免疫及白细胞迁移等生物学过程,而
LGR4主要参与负调控种植体周围炎的上皮生长过程。通过差异基因的GO富集分析,发现
NPR3主要参与白细胞增殖及体液水平调节的生物过程。
将ImmPort数据库下载的免疫相关基因与差异基因交集,得到41个涉及免疫应答的基因,在GSEA的富集分析结果中进行对比,发现这些基因大多都参与到种植体周围炎明显上调的炎症免疫相关的生物学过程中,但41个基因的数量对于疾病特征性基因的筛选显然过多。在此本研究采用了LASSO逻辑回归的算法来进一步收缩特征性基因,LASSO回归目前已是一种广泛采用的机器学习算法,可将数据中不重要的变量系数压缩为0,既实现了较为准确的参数估计,也实现了变量选择或者变量降维。在此本研究将41个免疫相关差异基因纳入LASSO逻辑回归模型的构建,选取了二变量偏差最低时的8个基因组成的模型,即
IL1B、IL6、LILRB3、CCL18、C3、PI3、LGR4及
NPR3。在此8个基因中,有常见的与免疫-炎症串扰的经典炎症因子,如
IL1B、IL6,已被证实在多种炎症反应及骨免疫中发挥重要作用
[15]。LILRB3全名为白细胞免疫球蛋白样受体B3,在免疫细胞上表达,与抗原呈递细胞上的MHC I类分子结合,并转导抑制免疫应答刺激的负信号,在大量研究中提示可抑制免疫活性从而促进肿瘤发展
[16-17]。但在本研究的种植体周围炎组织中发现
LILRB3存在具有统计学差异的上调变化,可能是慢性炎症刺激中的负反馈反应,具体机制有待进一步研究探讨。CCL18作为一种趋化因子,在调节炎症过程中起着关键作用,CD4
+/CD8
+ T淋巴细胞及活化的巨噬细胞显示趋化活性,在体液免疫和适应性免疫中均发挥作用
[18]。补体成分C3在补体系统的激活中起着核心作用,目前已有大量证据表明补体系统与骨骼的免疫有紧密联系,补体C3在人骨髓间充质干细胞、破骨细胞及成骨细胞中均有表达,且C3能促进破骨细胞的分化
[19]。
PI3编码弹性蛋白酶特异性抑制剂,作为抗革兰氏阳性和革兰氏阴性细菌以及真菌病原体的抗菌肽发挥作用,其表达受到细菌脂多糖和炎症细胞因子而上调。PI3最早发现于过度增殖的人表皮的角质形成细胞中,在持续受到炎症刺激的上皮中组成性表达,例如口腔牙龈上皮中,在上皮完整性调控中起到重要作用
[20]。
种植体周围炎是由种植体周围积聚的细菌生物膜引起的,然而,细菌不会直接进入软组织,因为角质形成细胞和黏膜软组织的生物密封起到保护屏障的作用
[21]。在种植体周围炎与健康组的GSEA富集分析中观察到了与角化黏膜生物屏障相关的结果,GO数据库的结果中角化、表皮生长等生物学过程明显下调,其中特征性免疫基因
LGR4也参与了该过程,提示炎症反应下种植体周围黏膜屏障的破坏。种植体周围的致密角化龈在控制牙菌斑和抵抗口腔咀嚼运动的机械刺激中起到关键作用。根据观察到的明显下调结果,本研究发现种植体周围炎的免疫反应引发的炎症破坏了周围组织的防御能力,使得外源性刺激更容易突破上皮并深入至骨组织,进而引发骨组织的炎症反应和边缘性骨吸收
[22]。另外,通过种植体周围炎基因表达模式的分析,本研究发现
IL1B、IL6、LILRB3、CCL18、C3、PI3参与调控的白细胞迁移、体液免疫反应、适应性免疫反应也存在具有统计学差异的明显上调。且这些基因在种植体周围炎GSEA结果中
P值居前5位以内,结合ssGSEA分析结果,进一步证实了特征性免疫基因在种植体周围炎免疫反应中的重要功能。在Ganesan SM等
[23]最近的微生物组学研究中,种植体周围炎软组织在锌指蛋白、凋亡、膜转运、免疫炎症系统和细胞-细胞粘附方面比健康软组织表现出更多富集。这与本研究的富集分析结果一致,即与健康样品相比,先天免疫系统、适应性免疫系统、白细胞趋化迁移、生物粘附功能在种植体周围炎组织中上调。
NPR3在表现上与其他7种免疫特征性基因有所不同,其在ROC曲线分析中展现出了最大的AUC值(AUC=0.964),并与10种免疫细胞亚群之间存在明显的相关性,在种植体周围炎免疫反应中的关键作用得到了验证。但在GSEA富集分析中,本研究并未发现
NPR3直接参与任何GO生物过程或KEGG通路。在后续的差异基因GO富集结果中显示
NPR3主要富集于白细胞增殖和体液水平调节生物过程中。NPR3也称利钠肽受体C,是C型利钠肽的主要受体,广泛表达于内皮细胞、平滑肌细胞、成纤维细胞上,针对NPR3的研究主要与心血管系统的功能调节和疾病相关
[24]。在免疫炎症领域,Harrington EO等
[25]发现NPR3能够介导心房利钠肽抑制急性肺损伤中的中性粒细胞肺部募集,这表明NPR3在调控急性炎症反应中具有一定作用,另1项由Cheng C等
[26]进行的研究则揭示了NPR3在动脉粥样硬化病理过程中的重要性,研究发现NPR3与炎症、氧化应激以及自噬等过程紧密相关。尽管有这些关于NPR3在急性或慢性炎症中的研究,但关于其在感染性慢性炎症,尤其是种植体周围炎中的作用,目前的研究仍显不足。有趣的是,一项基于生物信息学的侵袭性牙周炎研究同样观察到了
NPR3明显下调的趋势(log
2FC=-1.69),且该基因位于前10位明显下调的基因之列
[27],与本研究的结果高度一致(log
2FC=-1.66,明显性排名第8)。在类似疾病背景下的相同趋势暗示了NPR3在牙龈、牙槽骨等口腔组织感染性慢性炎症中可能发挥着潜在的重要作用。这为进一步深入研究NPR3在口腔慢性感染性疾病中的具体作用机制提供了有力的证据。
本研究对种植体周围炎的遗传和免疫生物学过程进行了深入探讨。研究结果显示,IL1B、IL6、LILRB3、CCL18、C3、PI3、LGR4及NPR3等基因在疾病免疫反应中发挥了至关重要的作用,被鉴定为免疫特征性基因。这些基因共同参与了种植体周围炎发展过程中固有免疫及适应性免疫的多种免疫细胞的浸润,其中白细胞的浸润在GSEA富集分析中显示出关键的作用。此外,这些特征性基因与差异基因共同调控种植体周围炎的多种免疫反应和种植体周围黏膜屏障的破坏,进一步突显了其在疾病发展中的重要功能。但本研究仍存在一些局限性,分析共纳入了19例种植体周围炎组织和16例健康牙龈组织,样本量较少,在建立LASSO回归模型时无法再次将样本拆分做“内部-外部”交叉验证,于是本文中仅在内部模型中验证免疫特征性基因对疾病的敏感性。为了更深入地解释本文的结论,后续研究将计划收集更多的种植体周围炎样本,对样本量进行扩充并作基因转录和蛋白表达的验证。另外,在GEO数据库选取的数据集中,并非所有种植体周围炎组织均为同一解剖位置,这可能导致生物信息学富集分析中的偏差,但本研究结果中组内同质性尚可,分析结果仍对关注种植体周围炎的研究者具有参考意义。