肠上皮化生(IM)是由于胃黏膜长期慢性炎性损伤导致胃黏膜正常上皮细胞被肠型上皮细胞取代,进而出现杯状细胞、潘氏细胞及吸收上皮细胞的一种病理形态学改变
[1]。在炎症反应的长期作用下,胃黏膜上皮持续遭到破坏,进而出现IM或异型增生,甚至向胃癌方向演变
[2]。研究证实IM是胃癌的独立危险因素
[3],肠化生患者在3年、5年、10年的胃癌年发病率分别为0.4%、1.1%、1.6%
[4]。因此,早期诊断并及时治疗是阻止IM进展、降低胃癌发生的关键。
转录组学测序是用于分析基因表达和发现新型RNA的常用方法,在生物医学领域的得到了广泛运用
[5]。转录组学信息能够反映各种细胞在特定发育阶段或生理状况下的状态,了解转录组对于解释基因的生物学功能,揭示细胞、组织的分子组分以及探索疾病的发病机制至关重要
[6]。研究发现,在过去的10年中,转录组学测序明确了多种无法诊断疾病的具体病因,加深了我们对疾病病理生理的认识和理解
[7]。通过转录组学测序,能够发现疾病的生物标志物,以便更好地了解IM发生的分子机制。但目前仍然缺乏适用于临床的与IM相关的生物标志物。因此,探索可靠的生物标志物,阐明IM有效治疗靶点意义重大。本研究旨在通过转录组学测序,从IM患者及正常受试者胃组织中筛选差异表达基因,进而筛选可用于IM临床诊治的潜在生物学标志物。
1 资料和方法
1.1 研究对象
纳入2022年1月~6月就诊于安徽中医药大学第二附属医院脾胃科的21例IM患者及同期在我院体检中心接受胃镜检查的21例健康者。所有受试者均同意参与本研究,并已签署相关知情同意书,所有流程均符合《赫尔辛基宣言》。本研究经安徽中医药大学第二附属医院医学伦理委员会批准(伦理批号:2022zj20)。
1.1.1 纳入标准
接受胃镜检查且病理检测确诊为IM者;接受胃镜检查的正常者;自愿参与本研究者。
1.1.2 排除标准
既往接受过药物治疗的IM患者;合并有严重心、脑、肺、恶性肿瘤等原发性疾病者;法律规定的残疾者(盲、聋、哑、智力障碍、精神障碍等);不愿参与本研究者。
1.2 样本收集
根据《中国临床样本使用国家规定》,正确获取人体组织并进行合法使用。使用Olympus CV-290胃镜检查系统对所有参与者进行胃镜检查,并使用一次性内窥镜取样钳(Micro-Tech)获取样本。从受试者的胃组织中获取相关样本,并储存在-80℃的冰箱中以备使用。
1.3 RNA提取及测序
分别收集IM患者与健康受试者的胃组织,经研磨与均质化后,按照制造商的说明,使用RNA提取试剂盒(碧云天)获取组织总RNA。提取完成后,使用安捷伦2100生物分析仪对获取的RNA进行质量分析,使用Illumina HiSeqTM 4000平台进行转录组学测序以获得所有mRNA的原始数据。
1.4 实时荧光定量PCR
按照制造商说明,使用RNA提取试剂盒(碧云天公司)从组织样本中提取总RNA,合成对应cDNA后,使用StepOne Plus Real-Time PCR检测系统(Thermo Fisher Scientific)上进行PCR检测(‑△△CT法)。cDNA合成以及PCR过程中所需的逆转录试剂盒、SYBR Green、Taq酶等试剂来源为诺唯赞公司。关键基因的PCR引物如
表1所示,引物序列由通用生物有限公司合成。
1.5 IM发病相关基因数据的筛选
使用Genecards数据库(
https://www.genecards.org)和DisGeNET数据库(
http://www.disgenet.org)两大通用数据库获取IM发病的相关基因数据。GeneCards是一个全面、权威的人类基因信息数据库,已经被广泛使用了近15年。数据库中包含了73 000多个人类基因
[8]。DisGeNET数据库整合和标准化多个来源的疾病相关基因和变异数据,涵盖了超过24 000种疾病及其特征、17 000个基因和117 000个基因组变异
[9]。我们以“肠上皮化生”为关键词,筛选相关基因,同时删除重复的基因。
1.6 生物信息学分析
采用DESeq差异表达分析法对基因的表达进行差异分析。筛选条件为:表达差异倍数|FoldChange|>1,显著性P<0.05。使用R语言ggplots2软件包绘制差异表达基因的相关图表。使用Circlize软件包根据基因组信息和RNA差异表达分析结果,在基因组中筛选差异基因并分析相互关系。使用Phatmap软件包对所有差异基因进行聚类分析并进行可视化。同时,为了研究差异基因编码蛋白之间的相互关系,使用STRING网络数据库分别进行了蛋白质互作分析、GO富集分析和KEGG通路富集分析。
1.7 统计学分析
采用SPSS 26.0统计学软件对数据进行分析。定量资料用均数±标准差表示,组间比较采用t检验或秩和检验;定性资料用n(%)表示,组间比较采用χ2检验。以P<0.05为差异有统计学意义。
2 结果
2.1 受试者临床信息分析结果
本研究对所有受试者的临床数据(如年龄、性别、个人病史、疾病史、家族史等)进行了统计分析(
表2)。
2.2 IM的差异表达基因
转录组学测序结果显示,1373个mRNA在IM中呈现差异表达,其中包括827个上调的mRNA和546个下调的mRNA。根据平均表达量和
P值的大小对测序结果进行排序,选取了排名前20的上调基因和下调基因(表
3、
4)。使用火山图对差异基因的分布与差异进行可视化。使用基因组圆图来了解基因组数据的总体信息与特征。使用热图对两组间差异基因的表达情况进行可视化处理。同时结合生物信息学方法筛选出了与疾病发生、发展相关的差异基因,共计102个,其中包括AGMAT、CCL25、FABP1、CDX1、SPINK4和MUC2。所有结果通过Venn图展示(
图1)。
2.3 差异表达基因的功能富集分析
根据GO分析和KEGG分析的结果,发现差异表达基因的主要生物过程(BP)包含离子转运、消化、阴离子转运、对刺激的反应和对外部刺激的反应等;主要细胞组分(CC)包含细胞外区域、细胞外空间、质膜、顶端质膜等;主要分子功能(MF)包含跨膜转运体活性、无机分子实体跨膜转运体活性、转运蛋白活性、阴离子跨膜转运蛋白活性和离子跨膜转转运蛋白活性等(
图2)。差异表达基因的KEGG途径包括脂肪消化吸收途径、细胞因子-细胞因子受体相互作用途径、PPAR信号通路、胃酸分泌途径和胆汁分泌途径等(
图3)。
2.4 蛋白质网络互作分析
基于STRING在线数据库和Cytoscape软件,获得了差异表达基因编码蛋白的相关信息,并构建了PPI网络图(
图4)。同时使用Cytoscape软件中的cytohubber插件,根据差异表达蛋白的显著性对其进行排序,筛选差异显著的相关蛋白。其中,排名靠前的上调蛋白包括:LYN基因(LYN)、载脂蛋白D(APOD)、细胞分裂周期20(CDC20)、嘌呤核苷酸磷酸化酶(PNP)、精氨酰琥珀酸合酶1(ASS1)、细胞色素P450家族3亚家族A成员4(CYP3A4)。排名靠前的下调蛋白包括:PPARG辅激活因子1α(PPARGC1A)、AMPA离子能谷氨酸受体2(GRIA2)和岩藻糖基转移酶1(FUT1)。LYN是节点度最高的基因。
2.5 关键基因的mRNA表达水平
采用RT-PCR法对关键基因的mRNA水平进行验证。结果显示,IM组中关键基因(AGMAT、FABP1、CDX1、CCL25、SPINK4和MUC2)的mRNA表达水平显著升高(
P<0.05),这与转录组学测序结果一致(
图5)。
3 讨论
IM是胃黏膜上皮细胞及周围腺体转化为肠上皮细胞及周围腺体的一种现象
[10]。与食道中的肠化生一样,胃黏膜肠化生也可发展为低度不典型增生和高度不典型增生,最终导致胃腺癌的发生
[11]。胃癌在我国的总体发病率较高,且相关研究表明IM患者发生GC的风险是非肠化患者的10倍以上
[12]。虽然IM的发病机制尚未完全明确,但目前国内外大多数学者普遍接受由Correa所提出肠型胃癌发展模式
[13],认为IM是胃癌发病的中心环节。
IM的诊断方法有很多。近年来,多种血清标志物在IM的诊断中发挥了重要作用,包括胃蛋白酶原I(PGI)、胃蛋白酶原II(PGII)和胃泌素17(G-17)等
[14]。PGI和PGII是胃黏膜细胞分泌的保一种蛋白,当IM发生时,PGI和PGII的表达水平则会降低,且两者的表达水平与IM的严重程度相关
[15]。G-17是胃窦G细胞分泌的一种胃肠激素,能有效反映胃黏膜萎缩的程度,与IM密切相关
[16]。然而,仅通过血清标志物进行IM诊断的特异性和准确性还不够高,如果将组织中的疾病相关标志物与血清标志物结合进行联合诊断,则可大大提高IM诊断的特异性和准确性。
在本研究中,通过转录组学测序最终获得了827个上调的mRNA和546个下调的mRNA。根据发现的差异基因的显著性与平均表达量对其进行了排序,从中选取了6个显著上调基因进行验证。发现AGMAT、CCL25、FABP1、CDX1、SPINK4和MUC2对疾病的预测及诊断具有一定的潜在价值。
胍丁胺酶(AGMAT)是氨基酸代谢的关键酶,来源于线粒体,主要分布在肝脏和肾脏细胞中
[17]。尽管AGMAT具有广泛的生物学功能,但其在疾病中的作用很少报道。已有研究发现AGMAT在肺腺癌中高度表达,并且与肿瘤分期和预后相关。AGMAT被发现可通过激活MAPK和PI3K/Akt信号通路,诱导NO释放,促进一氧化氮合酶的表达,从而增强癌症细胞的侵袭和转移
[18]。此外,AGMAT也是导致结肠癌发生、发展的重要致病分子。研究发现,miR-151a-5p可靶向AGMAT,促进结肠癌的增殖和侵袭
[19]。Liu等
[20]发现,敲低AGMAT的表达水平可有效抑制结肠炎相关性结肠癌的发生、发展。目前,关于AGMAT在胃癌和胃癌前病变中的作用尚未报道。而在本研究中,我们首次发现其在IM组织中高表达,这对疾病的诊断具有重要意义。
C-C趋化因子配体25(CCL25)是一种在胸腺和肠上皮中高度表达的趋化因子,在各种炎症性疾病和恶性肿瘤中发挥着重要作用
[21]。Wu等
[22]发现,CCL25在炎症性肠病患者的结肠组织中呈高表达,且与疾病的严重程度呈正相关。Liu等
[23]发现,CCL25在胃癌组织中的表达水平明显升高。此外,Lin等
[24]发现,CCL25能够通过CCR9依赖性方式促进非小细胞肺癌的侵袭和迁移,导致疾病的发生、发展。然而,CCL25与IM之间的关系目前尚未得到证实,我们的发现对疾病的诊断与治疗提供了新的思路和方向。
脂肪酸结合蛋白1(FABP1)是一种广泛分布于肝细胞中的可溶性蛋白,在胃肠道中也同样存在表达
[25]。Liu等
[26]研究发现FABP1在胃癌和胃癌前病变中呈高度表达,且与疾病的预后有关。与上述结果不同的是,早期Hashimoto等
[27]研究发现,虽然FABP1在IM和胃腺癌中高度表达,但它与疾病的进展、预后或脂肪酸合成酶状态无关。因此,进一步探究FABP1与IM的严重程度及预后的相关性具有重要意义。
血清丝氨酸肽酶抑制剂Kazal 4型(SPINK4)是SPINK蛋白酶抑制剂家族的重要成员。研究发现,结直肠癌组织中SPINK4表达下调与患者生存率低有关
[28]。然而,也有相反的观点认为SPINK4高表达与直肠癌患者预后不良有关
[29]。此外,多项研究证实,SPINK4与溃疡性结肠炎和Barrett食管的发病密切相关
[30-32]。但有关SPINK4与胃癌及癌前病变的研究很少。在本研究中,我们首次发现SPINK4在IM患者组织中高表达,对疾病的诊断有一定的潜在价值。
黏蛋白2(MUC2)是一种在人体肠道中发现的重要分泌蛋白,在保护肠道屏障、调节微生物组稳态和预防疾病等方面发挥着重要作用
[33],其破坏与多种疾病和癌症有关。已有研究证实,其参与了结直肠癌、乳腺癌、胰腺癌、胃癌等多种癌症的发生发展
[34-37]。MUC2在正常胃黏膜中呈低表达或不表达,而在胃肠化生和GC中,表达水平显著升高,这可能是因为
H. pylori感染后细胞表达的促炎细胞因子过度激活,导致MUC2过表达
[38]。虽然MUC2表达与肿瘤分化和浸润深度显著相关
[39],但其与IM之间的相关性仍尚不明确,需要进一步临床实验及分子实验来加以验证。
CDX1是肠道分化的重要转录因子,其异常表达是胃炎-IM-胃癌转化过程中的重要信号
[40]。虽然CDX1在正常胃黏膜中不表达,但在动物和人类的IM组织中可发现CDX1的异常表达
[41, 42]。研究表明,CDX1的异常表达会促进胃上皮细胞的增殖、侵袭、迁移和肠化生,从而导致恶性肿瘤的发生。NF-κB通路在激活CDX1的表达中起着关键作用
[43]。NF-κB通路可直接与CDX1未甲基化的启动子结合,从而激活 CDX1 的表达。在正常胃粘膜中,由于没有炎症刺激和 CDX1启动子的高度甲基化,CDX1不会表达。与此相反,在IM组织中,CDX1启动子的甲基化水平降低,表达异常
[44]。
综上所述,我们发现IM发生的机制可能与AGMAT、CCL25、FABP1、SPINK4、CDX1和MUC2的异常表达有关。本研究未能深入探究相关差异基因在疾病病程中的具体作用机制,后续,将进一步通过动物、细胞实验等来完善本研究的发现,为IM的诊断和临床治疗提供更丰富的理论基础。