阿尔茨海默病(Alzheimer's disease,AD)是一种常见的临床退行性疾病,可严重影响老年人生活质量
[1]。至今,AD发生发展的确切机制尚未明确,且现有治疗手段疗效不佳,而早期诊断和干预有望延缓或阻止AD发生
[2]。目前AD诊断的生物标志物研究多集中在基于脑组织和脑脊液检测的生物标志物
[2]。由于海马组织的病理改变与细胞外淀粉样蛋白(β-amyloid protein,Aβ)沉积、tua蛋白磷酸化、衰老等目前公认的AD病理进程密切相关
[3],已有部分研究探讨海马组织的异常表达基因在AD中的关键作用
[4]。基于海马组织检测的生物标志物虽有较高的诊断价值,但由于样本的高侵入性收集过程和检测的高成本,大众更容易接受微创且成本低廉的外周血生物标志物检测。因此,本研究利用基因表达综合数据库(Gene Expression Omnibus,GEO)数据库中的人类基因表达数据进行生物信息学分析,试图在外周血和海马组织中找到有共同表达趋势的差异基因,为AD的诊断提供新思路。
1 资料与方法
1.1 资料来源
本研究使用的资料来自GEO(
http://www.ncbi.nlm.nih.gov/geo)。选取2组AD相关数据集:GSE97760(GPL16699),获取19个外周血样本,包含9例AD患者和10例健康对照;GSE5281(GPL570),选取其中23个海马组织样本,包含10例AD患者和13例健康对照。
1.2 数据预处理和差异基因分析
利用GEO2R在线工具(
http://www.ncbi.nlm.nih.gov/geo/geo2r/)分别对GSE97760、GSE5281数据集进行基因的差异表达分析
[5],采用R(版本4.3.1)的ggplot包绘制2个数据集的差异表达基因(differentially expressed genes,DEGs)火山图。以log
2FC绝对值≥1(FC: fold change)和调整后的
P<0.05为筛选条件筛选DEGs。利用Venn图绘制工具(
https://bioinfogp.cnb.csic.es/tools/venny/index.html)分别对2个数据集上调及下调的DEGs取交集,确定2个数据集中有共同表达趋势的DEGs。
1.3 GO富集与KEGG通路富集分析
为了在功能层面上分析共表达DEGs,利用DAVID在线生物信息库(
https://david.ncifcrf.gov/)对共表达DEGs进行基因本体论(Gene Ontology,GO)富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析
[6],得到富集的生物过程及通路,筛选标准为
P<0.05。
1.4 PPI网络构建及关键基因筛选
利用STRING数据库
[7](
http://www.string-db.org/),以互作评分>0.7为条件对共表达DEGs构建蛋白互作(protein-protein interaction,PPI)网络,使用Cytoscape(版本3.10.0)软件对共表达DEGs所编码蛋白质的相互作用进行可视化展示,并利用Cytoscape的MCODE插件筛选核心模块。通过Cytoscape的插件CytoHubba计算参数来评价网络中每个节点在功能上的重要性,筛选参数为度中心性(degree centrality,DC)。利用degree算法计算PPI网络中的基因得分,取排名前10的基因作为本研究的关键基因
[8]。
1.5 关键基因的验证
采用GSE48350(GPL570)数据集的62例海马样本进行验证,分析筛选出的关键基因在AD患者(19例)及健康对照(43例)中的表达量是否有差异。使用GEO2R在线工具进行分析。检验水准α=0.05。
2 结果
2.1 共表达DEGs的筛选
分别对GSE97760、GSE5281进行基因的差异表达分析,用R绘制火山图(
图1A、B)。在GSE97760数据集中筛选出8 293个DEGs,上调3 683个,下调4 610个;在GSE5281数据集中筛选出3 678个DEGs,上调1 331个,下调2 347个。分别对2个数据集上调及下调的DEGs作Venn图取交集,得到669个有共同表达趋势的DEGs,包括64个上调DEGs、605个下调DEGs(
图1C、D)。
2.2 共表达DEGs的富集分析
对669个共表达DEGs进行GO富集和KEGG通路富集分析,得到
P<0.05的GO条目共174个,生物过程(biological process,BP)条目78个,细胞组成(cell component,CC)条目46个,分子功能(molecular function,MF)条目50个。GO富集分析提示,DEGs主要富集在调节RNA聚合酶Ⅱ启动子的转录及转录调控等生物过程;细胞组成层面DEGs主要参与细胞核、细胞质、核质等功能族;分子功能层面DEGs主要富集在蛋白质结合、金属离子结合和RNA结合等功能族(
图2)。KEGG通路富集分析结果显示,
P<0.05的条目40个,DEGs在神经胶质瘤、mTOR信号通路、长寿调节途径、神经营养素信号通路以及Wnt信号转导途径等与AD相关的通路上显著富集(
表1)。
2.3 DEGs所编码蛋白质的PPI网络分析
将筛选获得的669个共表达DEGs信息导入STRING数据库,除去孤立的节点,以互作评分>0.7为条件对共表达DEGs构建PPI网络,包括286个节点和1 042条边(
图3A)。用Cytoscape的MCODE插件对PPI网络进行聚类分析,得到评分前3且具有显著性的核心模块。核心模块1评分8.600,包括11个基因:
SRSF11、PRPF40A、TCERG1、SF3B1、SREK1、RBM39、RBM25、RBM7、LUC7L3、PNISR、SRRM2,主要生物学功能富集在RNA剪接;核心模块2评分5.455,包括12个基因:
DDX3X、FXR1、CREB1、DDX6、TIA1、TP53、G3BP1、PTEN、AKT3、CAPRIN1、EIF4G1、JUN,主要生物学功能富集在翻译负调控、凋亡过程;核心模块3评分4.000,包括4个基因:
SMC5、ESCO1、STAG1、STAG2,主要生物学功能富集在姐妹染色单体结合。
2.4 筛选PPI网络中的关键基因
采用degree算法计算PPI网络的基因得分,排名前10的基因作为本研究的关键基因,按照degree算法得分排序分别为
TP53、PTEN、HNRNPC、EIF4G1、SF3B1、SRSF11、PIK3R1、RBM39、LUC7L3、RBM25(
图3B),除了EIF4G1为上调基因,其余均为下调基因。关键基因中,
SF3B1、SRSF11、RBM39、
LUC7L3、RBM25是核心模块1的基因,
TP53、PTEN、EIF4G1是核心模块2的基因。关键基因在
GSE5281、GSE97760两个数据集中的详细表达情况见
表2。
2.5 关键基因的验证
结果显示,在验证集GSE48350中
TP53、EIF4G1、SRSF11在AD中为上调,
PTEN、HNRNPC、SF3B1、PIK3R1、RBM39、LUC7L3、RBM25在AD中均为下调。除了
TP53、SRSF11的表达趋势与本研究得出的结果相反,其余8个关键基因的表达趋势均与本研究得出的结果相同,且其中
PTEN、HNRNPC、SF3B1、PIK3R1、LUC7L3的差异具有统计学意义(
表3)。
3 讨论
本研究对GEO数据库中的19例外周血样本(GSE97760)和23例海马组织样本(GSE5281)进行生物信息学分析,筛选出外周血和海马组织中有共同表达趋势的669个DEGs,并进一步分析得到5个值得进一步研究的关键基因(PTEN、HNRNPC、SF3B1、PIK3R1、LUC7L3),以尝试在没有脑部组织的情况下,通过外周血检测诊断AD。目前关于外周血和海马组织共表达DEGs的研究较少,关键基因与AD相关的证据也较少,本研究筛选的关键基因可能是潜在的外周血和海马组织共同的AD生物标志物,可为AD的诊断和治疗靶点的探索提供新思路。
磷酸酶和张力蛋白同系物(phosphatase and tensin homolog,PTEN)是于1997年被发现的肿瘤抑制基因,属蛋白酪氨酸磷酸酶,是细胞信号转导的关键调控分子之一,其酶活性受氧化还原调节、磷酸化与去磷酸化调节等多种因素调节
[9]。KEGG富集分析中,PTEN在mTOR信号通路、PI3K-Akt信号通路、长寿调节通路、细胞衰老以及轴突再生等AD相关的通路中发挥重要作用。mTOR的上游存活PI3K-Akt通路调节mTOR活性,在AD的进程中发挥重要作用
[10]。PTEN还参与脑缺血、帕金森病等神经损伤的相关疾病进程
[11],表明其与中枢神经系统的正常功能维持和发育密切相关
[12]。有研究证实,海马神经元中PTEN的异常表达促进了神经元的死亡,并提出PTEN可能是涉及细胞凋亡和兴奋毒性的神经退行性疾病的潜在治疗靶点
[13]。PTEN可改变神经元对谷氨酸的敏感性,这也表明PTEN在调节突触可塑性方面发挥作用,而AD的预后与突触可塑性密切相关
[13]。研究表明在AD患者死后,PTEN免疫阳性反应的神经元细胞数显著减少
[14-15],海马、大脑皮层还可检测到PTEN水平的显著下降
[15],这与本研究得出的结果一致。
异质性核糖核蛋白C(heterogeneous nuclear ribonucleoprotein C,HNRNPC)是参与剪接调控的重要蛋白,属于异质性核糖核蛋白亚家族。KEGG富集分析中,HNRNPC主要参与遗传信息处理、转录、剪切体等通路。HNRNPC能够通过剪接体调控下游mRNA的可变剪接,研究表明,AD发生发展过程中有多种mRNA剪接发生异常调控,HNRNPC在其中起重要调控作用
[16]。在AD进程中,HNRNPC蛋白表达量的异常可致Aβ的前体样蛋白翻译量增加,从而导致Aβ沉积增多
[17],促进AD的发展;HNRNPC表达异常还可导致细胞的新陈代谢障碍以及应激反应,促进细胞凋亡
[18],提示HNRNPC与AD进程的密切关联。
剪接因子3b亚基1(splicing factor 3b subunit 1,SF3B1)是一种蛋白质编码基因。KEGG富集分析中,与HNRNPC类似,SF3B1主要参与遗传信息处理、转录、剪切体等通路。SF3B1突变已在多种骨髓恶性肿瘤中发现,目前研究主要关注SF3B1在骨髓增生异常综合征等血液恶性肿瘤、乳腺癌和葡萄膜黑色素瘤中的作用
[19]。目前SF3B1与AD相关的证据仍较少,SF3B1在AD中的作用值得进一步研究。
磷酸肌醇-3-激酶调节亚基1(phosphoinositide-3-kinase regulatory subunit 1,PIK3R1)是磷酸肌醇-3-激酶(phosphoinositide-3-kinase,PI3K)的异构体之一。KEGG富集分析中,PIK3R1参与了mTOR信号通路、PI3K-Akt信号通路、细胞凋亡、长寿调节途径、细胞衰老、轴突引导、Toll样受体信号通路以及阿尔茨海默病通路等多个AD相关的通路。Vanhaesebroeck B等
[20]提出PI3K通路在正常细胞和恶性细胞的增殖、凋亡和新陈代谢中都扮演着重要角色。有动物研究表明,PIK3R1变异会损害PI3K/Akt/GSK-3β信号通路,而这一途径对AD具有保护作用
[21]。另外,研究证实在槲皮素治疗后AD患者的PIK3R1水平显著增加,这表明PIK3R1可能是AD的诊断生物标志物以及槲皮素治疗的靶点
[22],说明进一步研究PIK3R1在AD患者诊断和治疗中的作用是非常有必要的。
类LUC7-3前核糖核酸剪接因子(LUC7 like 3 pre-mRNA splicing factor,LUC7L3)是一种蛋白质编码基因,目前研究主要关注LUC7L3与肾细胞癌、乳腺癌的关联
[23]。有研究提出LUC7L3与神经胶质瘤细胞凋亡相关
[24],Tang RH等
[25]提供了LUC7L3可能介导轻度认知功能受损病理变化的证据,Bishof I等
[26]提出LUC7L3可与AD大脑中的tau相互作用,介导与病理性AD特异性tau异构体的共聚集。目前LUC7L3与AD关联的证据仍较少,进一步探索LUC7L3在AD中的价值具有重要意义。
本研究存在一定的不足之处。一方面是样本量较小,这可能也是TP53、SRSF11在验证集中得出相反结果的原因,接下来还需扩大样本量进行探索;另一方面是未能通过实验进一步验证这些关键DEGs在AD发生发展过程中的表达变化,还需更多的实验研究加以验证。
综上所述,本研究基于生物信息学方法筛选的外周血与海马组织有共同表达趋势的关键基因(PTEN、HNRNPC、SF3B1、PIK3R1、LUC7L3),可为基于海马组织样本或外周血样本诊断AD提供证据,为进一步揭示AD进程的分子机制以及诊断、治疗靶点的探索提供新思路。