α-氨基-3-羟基-5-甲基-4-异恶唑丙酸受体(α-amino-3-hydroxy-5-methyl-4-isoxazole-propionic acid receptor,AMPARs)是由2个二聚体组成的四聚体,由4个亚基(GluA1~GluA4)组成。既往研究表明
[1-2],AMPA受体转运对神经精神疾病和神经退行性疾病的突触可塑性有重大意义,控制这种转运的信号传导来自AMPA受体的细胞内蛋白相互作用
[2]。已有文献表明,AMPA型谷氨酸受体亚基1(glutamate A1,GluA1)在海马体许多类型的细胞上都有表达,比如神经元和胶质细胞。神经元受体GluA1通常介导最快速的兴奋性突触传递,其数量可通过内吞作用、胞吐作用和内吞体分类来调节,这导致其可循环回到质膜或在溶酶体中降解。这种动态行为通常由蛋白质与蛋白质的相互作用调节。故在以往研究中提出了一种策略,以GluA1为例的细胞表面受体中,来研究神经细胞表面受体的细胞内蛋白质的相互作用,从而得到GluA1相互作用蛋白
[3]。其相互作用蛋白参与了蛋白质、RNA、蛋白质复合物、核苷酸和环化合物的结合以及酶活性的过程,在KEGG通路富集过程中,可以观察到所鉴定的蛋白参与了多种生物学通路,其中细胞的迁移侵袭、信号传导等相关通路均对肿瘤的发生发展存在一定的影响。
肝癌是全球第六大最常见恶性肿瘤疾病,同时也是肿瘤相关死亡的四大因素之一
[4-5]。在我国及一些发展中国家,肝病发病率较高且呈上升趋势
[6-7]。多数患者在病情晚期时才就诊,只有约20%的患者可获得手术治疗的机会,并且患者在术后5年复发率达60%以上。早期就诊的肝癌患者仅5%~15%适合手术切除治疗。除此之外,肝癌易广泛转移,仍没有治疗肝癌转移的有效方法。目前,在临床治疗肝癌的方法中,仅手术、微创治疗具有较佳的效果。临床上常用的治疗肝细胞癌的分子靶向药物主要有多靶点酪氨酸激酶抑制剂,如Regorafenib、Sorafenib等
[8]。长期使用Sorafenib会导致毒性和或药物无效的情况。其中Regorafeni是一种多激酶抑制剂,后者与其靶标特征部分重叠,但Regorafeni可更有效的治疗肝癌
[9],并延长生存期,降低死亡率。2017年FDA批准该药用于治疗先前接受索拉非尼治疗的晚期肝细胞癌患者、既往接受过伊马替尼及舒尼替尼治疗的局部晚期的、不能手术切除的或转移性胃肠道间质肿瘤病人,或者既往进行了氟尿嘧啶、奥沙利铂和伊立替康等为基础的化疗,又或者既往进行了或不适宜进行抗VEGF诊断、抗EGFR诊断(RAS野生型)或转移性结直肠癌患者。所以,要确定有效的治疗靶点和制定合理的护理方针,需要更好地了解肝癌发生、发展和转移的分子机制。
既往文献表明,在正常大脑功能发展过程中,谷氨酸神经元可以通过与不同干细胞群(包括神经元和少突胶质前体细胞)之间形成的功能性突触引起电路特异性反应
[10]。突触AMPARs的数量可通过内吞作用、胞吐作用和内吞体分类来调节,其动态行为通常由蛋白质与蛋白质的相互作用调节。其转运对神经精神系统的病理生理有重大意义,并有利于新药的研究,可通过操纵此过程来治疗相关疾病
[11]。调节肝功能、再生和疾病的交感神经及副交感神经系统支配其自主神经和感觉纤维,从而释放神经递质发挥作用
[12]。自主神经和感觉神经纤维可调节肝功能、修复和再生的多个方面,包括脂质和葡萄糖代谢、胆汁分泌和损伤后细胞增殖等
[13]。流行病学、实验动物研究表明,心理社会因素可通过诱导神经递质和或激素的释放来调节某些肿瘤的生长和进展,特别是在慢性应激中。由于现可从神经学的方向重新展示肝癌发生的神经-免疫学机制。当交感神经系统过度兴奋时,可能会影响多种系统的功能。肝脏的慢性炎症反应可通过交感神经系统释放多种神经递质调控,从而促进癌变的发生
[14]。肝脏疾病的病理生理过程中,神经系统的调控效率高且作用显著。
神经系统在肝脏疾病的发生发展过程中具有重大意义,但该方面的研究国内报道较少。在以往研究中,课题组通过蛋白质组学方法获得了GluA1相互作用蛋白273个
[3],现未见这些蛋白与肝癌药物的作用靶点及预后关系的报道,故在本研究中探讨GluA1相互作用蛋白对其药物相关靶点、预后指标及诊断模型的作用和影响。
1 资料与方法
1.1 肝癌数据来源及数据处理
从Xena数据库(
https://xenabrowser.net/)中获取肝癌(LIHC)转录组数据以及对应的临床数据,Xena中获得的表达数据为log
2(count+1),通过expr2-1将表达数据转换成原始count值。保留75%样本中表达的基因以及原发肿瘤和癌旁组织样本用于后续的差异表达分析。利用R语言的limma 包标准流程对样本进行差异分析,采用voom方法进行数据标化,并通过|log
2fc|>0.585以及
P<0.05鉴定差异表达基因。
1.2 肝癌预后相关基因鉴定
对鉴定到的差异基因以及GluA1相关基因取交集,并通过箱线图展示交集基因的表达量情况。随后对交集基因进行单因素COX分析,以确定其对患者生存预后的影响。另外,以基因表达量的中位值为阈值,将肿瘤样本划分为高风险组和低风险组,展示在2组中的生存曲线,以P<0.05筛选具有显著生存差异的基因。最终将单因素COX分析和生存曲线分析的结果交集作为候选基因。并针对候选基因HPA数据库(The Human Protein Atlas)在肝癌组织及正常组织中蛋白表达水平的差异。
1.3 分子对接
将1.2中所筛选出的候选基因(蛋白)作为配体与GluA1进行蛋白分子对接检测。由于通过RSCB pdb网页(
https://www.rcsb.org/)未检索到该6个蛋白相应的X-ray蛋白分子结构。通过alphafold网页(
https://alphafold.ebi.ac.uk/)获取其对应的预测蛋白分子结构。受体和配体的pdb文件通过gramm-x网页工具(
https://gramm.compbio.ku.edu/gramm)进行提交并计算其可能对接的相对空间方位,下载为复合体的蛋白分子结构。随后将其导入pymol软件进行可视化后,再利用PDBePISA数据库(
https://www.ebi.ac.uk/pdbe/pisa/)进行复合体结合面的对接情况分析。
1.4 药物靶点分析
根据各种类型肝癌检索词筛选出药物,进一步检索该药物在临床上是否应用于肝癌的治疗,以及是否具有FDA label从而筛选符合的药物。随后在Drugbank中检索每个药物的作用靶点(包括Targets、enzymes、TRANSPORTERS),将作用靶点与目的蛋白汇总,导入string数据库中构建网络互作关系。利用cytoscape软件进行总网络分析,包括:Betweenness Centrality Closeness Centrality Clustering Coefficient、Degree的计算。最后针对总网络中Degree排名前10的蛋白绘制关键蛋白和药物靶点的网络互作图。
1.5 预后及诊断模型构建
对1.4筛查出的候选蛋白进行进一步多因素COX分析,并基于目的蛋白表达量构建了肝癌患者的诊断模型,将肝癌患者样本以及正常样本作为训练集用于二分类logistic回归模型的构建,使用受试者工作特征(receiver operating characteristic,ROC)曲线评估其模型性能。
1.6 统计学方法
数据清理部分中Xena数据为log2(count+1),通过expr2-1将表达数据转换成原始count值,并只保留在75%样本中表达的基因用于后续分析。利用R语言的limma包标准流程对样本进行差异分析,采用voom方法进行数据标化,并通过|log2fc|>0.585以及P<0.05进行差异基因鉴定。单因素COX分析和多因素COX分析时HR<1为预后有利因素,HR>1为预后不利因素。生存曲线分析以基因表达量的中位值为阈值将肿瘤样本划分成高风险组和低风险组,以P<0.05为阈值进行筛选。基于2个基因表达量构建了肝细胞癌患者的诊断模型,且使用ROC曲线评估其模型性能。
2 结 果
2.1 肝癌数据库处理结果
从Xena数据库(
https://xenabrowser.net/)中共获取424例肝癌转录组数据,通过expr2-1将转换成原始count值后保留75%样本中表达的基因,同时424例样本中仅保留371例原发肿瘤和50例癌旁组织样本的数据结果,用于后续分析。利用R语言的limma包标准流程对样本进行差异分析,采用voom方法数据标化后进行差异基因鉴定,最终鉴定到共3 028个差异基因,其中表达上调的基因有1 487个,表达下调的基因有1 541个(
图1)。
2.2 预后及生存曲线分析筛查结果
针对前期已获得的GluA1相互作用蛋白以及2.1鉴定到的差异蛋白(基因)取交集得到31个蛋白(
图2A),为PRKAR2B、CAMK2B、EIF4E、RAP2B、ACTR1A、RPL27A、LDHB、MARCKS、ALDH1B1、KIF1A、ALDH7A1、TKT、GNAI2、AHCY、ADH5、RPL3、GANAB、DNAJB11、NCAM1、ARPC1A、RPL7、KIF5B、EIF3H、SF3B3、PRKAR2A、NAPB、SYT1、TXNRD1、EIF3F、SRSF10、HMGCS2。其表达量情况如
图2B所示,结果显示31个交集蛋白的表达量在肿瘤患者与正常人中存在差异。
对31个交集基因进行单因素COX分析,
HR<1为预后有利因素,
HR>1为预后不利因素,其中
P<0.05的基因共9个,为ARPC1A、ALDH1B1、DNAJB11、EIF3H、GNAI2、KIF1A、RPL3、RPL7、SRSF10(
图3)。针对该31个基因进一步生存曲线分析,以
P<0.05为阈值进行筛选后发现在高、低风险组中存在12个显著的生存差异蛋白,为ARPC1A、EIF3H、GNAI2、KIF1A、LDHB、SRSF10、SYT1、RAP2B、RPL27A、RPL3、KIF5B、TXNRD1(
图4)。具体结果见于
表1。随后最终以单因素COX和生存曲线分析结果的交集获得6个候选蛋白,为ARPC1A、EIF3H、GNAI2、KIF1A、SRSF10、RPL3。
针对以上6个候选蛋白进行蛋白水平在肝癌组织和正常组织切片的对照,结果显示GNAI2、RPL3、ARPC1A、EIF3H、SRSF10在肝癌患者切片中表达量明显高于正常组织水平,如
图5所示。KIF1A未检索到相关结果。
2.3 分子对接结果
将2.2中所筛选出的6个GluA1相互作用蛋白KIF1A、GNAI2、RPL3、ARPC1A、EIF3H、SRSF10作为配体,GluA1作为受体,通过gramm-x网页工具(
https://gramm.compbio.ku.edu/gramm)得到复合体的蛋白分子结构,将其导入pymol软件进行可视化(
图6A)。再通过PDBePISA数据库(
https://www.ebi.ac.uk/pdbe/pisa/)分析复合体结合面的对接情况,得到GluA1的4个亚基与6个相互作用蛋白的结合面积、结合能、化学键及
P值。
P值是界面特异性的度量,显示了界面在能量方面的程度。结果显示结合能热图如
图6B所示,其揭示了GluA1的4个亚基与6个互作蛋白具有结合能稳定性。以上结果说明KIF1A、GNAI2、RPL3、ARPC1A、EIF3H、SRSF10与GluA1具有很强的亲和力。
2.4 药物分析
根据检索词liver cancer、hepatocellular cancer、cancer of liver、cancer of the liver、gastrointestinal cancers-liver、cancer liver、heptocellular cancer、hepatic cancer、hepatic tumour malignant、hepatocellular carcinoma、primary hepatocellular carcinoma、combined hepatocellular carcinoma、cholangiocarcinoma、Intraheptic cholangiocarcinoma,筛选出16个肝癌相关药物,为cabozantinib、capecitabine、ipilimumab、nivolumab、pembrolizumab、ramucirumab、regorafenib、atezolizumab、durvalumab、lenvatinib、sorafenib、tremelimumab、ivosidenib、futibatinib、uracil。随后针对16个肝癌相关药物进行检索,发现其在临床上是否应用于肝癌的治疗以及具有FDA label的药物共8个,为cabozantinib、ramucirumab、regorafenib、lenvatinib、nivolumab、atezolizumab、durvalumab、tremelimumab。最终在Drugbank中检索每个药物的药物靶点,汇总去重复后总计41个药物靶点,并将其与6个候选蛋白导入string数据库后发现KIF1A、ARPC1A与药物靶点不存在互作关系,故不纳入后续分析。随后进一步使用cytoscape软件绘制其余4个目的基因与肝癌的总网络图(
图7),在总网络中根据Degree排名筛选得到肝癌药物靶点中最核心的10个药物靶点,并绘制其网络互作图(
图7)。结果显示仅GNAI2、SRSF10作为药物的二级靶点分别与MAPK11、ABL1一级药物靶点相互作用,从而有利于提高Regorafenib药物在临床上治疗肝癌的疗效。
2.5 预后及诊断模型建立
针对2个目的蛋白GNAI2、SRSF10进一步分析,发现其同时在单因素以及多因素COX分析中对患者的生存有明显影响(
P<0.05),具体结果见
表2。这提示GNAI2、SRSF10是独立于其他因素(如:年龄、Grade分期、性别、人种)的预后指标。在多因素COX分析下
HR分别为GNAI2:2.38,SRSF10:1.18,均>1。结果表明高表达的GNAI2、SRSF10可能不利于肝癌患者的预后,为不利预后因素(
图8)。
鉴于GNAI2、SRSF10在肝癌患者中的显著作用,本研究基于其表达量构建了肝癌患者的诊断模型,将356例肝癌患者样本(其中355例为HCC患者)以及50例正常样本作为训练集用于二分类logistic回归模型的构建,经过模型拟合,得到两基因系数分别为GNAI2:11.845 5,SRSF10:-0.203 7,并得到诊断模型
prob =
。最终使用ROC曲线评估该模型的性能,其在训练集上的曲线下面积(area under the curve,AUC)为0.971。这表明该诊断模型具备较高的准确性且性能优异,对肝癌的诊断存在重大意义(
图9)。
3 讨 论
AMPAR通过同源性筛选确定有4个亚基(GluA1~GluA4),每个亚基的分子量为95~105 kD
[15]。在哺乳动物的中枢神经系统传递过程中,AMPAR介导的兴奋性突触传递最为快速,其长时间激活具有强烈的神经毒性。除此之外,突触表达的发育和活动也受到了严格的细胞调节
[3,15]。以往研究表明,大多数抗AMPAR脑炎患者并发多种肿瘤,如胸腺瘤、小细胞肺癌、乳腺癌和卵巢癌等
[16],故推测GluA1与肿瘤可能密切相关。
肝癌的发生非常复杂,可能与多个肝癌相关基因表达异常以及其他因素有关。临床上肝细胞癌最常发生在肝硬化的情况下,并且大多数患者在肝癌晚期才被诊断出来,因此预后通常较差。目前,临床获益的治疗方案选择有限。全身治疗,特别是常规细胞毒性药物通常无效。近年来,肿瘤分子靶向治疗的基础研究和临床试验越来越多,其原理是通过调控肿瘤相关基因的表达来抑制肿瘤细胞的生长。分子靶向治疗的特异性较强,能够更好地应用于患者的个体化治疗。迄今为止,HCC的临床试验已经评估了单靶点治疗,或2种及2种以上靶点的治疗方案
[17]。以往研究中表明,Regorafenib是一种多靶点受体酪氨酸激酶抑制剂,其控制的激酶包括与血管(淋巴管)生成相关的血管内皮生长因子,与肿瘤微环境相关的血小板衍生生长因子受体-β、成纤维细胞生长因子受体,与肿瘤细胞增殖相关的3种原癌激酶。这些激酶与肿瘤细胞血管生成、细胞增殖和微环境相关。在Ⅲ期RESOUCE研究中,Regorafenib降低了37%的死亡率,相比安慰剂客观缓解率分别为11%、4%
[18]。结果表明Regorafenib改善了Sorafenib一线治疗期间疾病进展的肝细胞癌患者的总生存率,虽然靶点特征与Sorafenib部分重叠,但Regorafenib更为有效
[9,18]。在本研究中,结果显示GNAI2、SRSF10作为药物二级靶点分别与ABL1、MAPK11一级药物靶点相互作用,从而提高Regorafenib在临床上治疗肝细胞癌的疗效。其中ABL1是一种非受体酪氨酸激酶,调节多种细胞过程,控制细胞生长、存活、侵袭、黏附和迁移。以往研究显示Regorafenib可靶向ABL1抑制其活性从而治疗癌症患者
[19]。丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPKs)在信号转导途径中发挥重要作用,并能够通过底物蛋白丝氨酸/苏氨酸激酶蛋白级联的顺序磷酸化来控制细胞内过程,如细胞存活、分化、增殖和凋亡。其中p38MAPK蛋白与许多癌症病理有关,p38β(MAPK11)和p38α,以及下游MAPKs MK2/3/5是基因表达和细胞周期进程的关键调控因子,在应激和许多病理过程(包括炎症和癌症)中被激活
[20]。以往研究显示circ_0001955通过抑制miR-516a-5p释放TRAF6和MAPK11的表达促进HCC的发生
[21]。Regorafenib可靶向MAPK11抑制肿瘤的生长从而治疗HCC患者。除此之外,DrugBank数据库仅有关于药品及其靶点、相关的生物或生理结果定量分析和分子量的数据,但缺乏关于药物时间与肝癌疗效的临床详尽数据,因此本研究没有进行药物敏感性研究。
疾病的预后对于癌症管理至关重要,并且由于临床病理参数的局限性,对于许多恶性肿瘤来说仍然是一个挑战。由于基因组、转录组和大数据技术的发展,现在能够详细探索肿瘤的分子机制并确定其临床相关性。通过将肿瘤分组,预后基因表达的各项表征有益于患者的治疗,并为患者提供了个性化治疗方案的指导
[22]。在以往研究中,为了构建预后模型,应用并验证了COX比例风险回归分析,最终确定了目的基因作为基于准确性和可行性诊断HCC的特异性生物标志物,并使用诊断模型的曲线下面积评估有效性
[23]。GNAI2是一种信号调节剂及换能器,参与多种跨膜信号传导系统
[24-25]、细胞损伤和炎症反应
[26]、肿瘤发生
[24]、肝缺血再灌注损伤
[27]等。除此之外GNAI2主要在免疫细胞中表达,对调节细胞活力和迁移中也起着重要作用
[28]。肝癌局部组织及不同人肝癌细胞中GNAI2在转录和翻译水平表达均升高。在患者原发性HCC细胞和细胞株HepG2中,沉默GNAI2基因的表达能够诱导细胞周期阻滞和激活caspase依赖性细胞凋亡途径,最终显著抑制肿瘤细胞的增殖和迁移
[29]。一些信号通路的异常也与HCC的发生发展密切相关。SR蛋白作为剪接激活因子,参与RNA的剪切过程。SRSF10复合物作为SREK1L的剪接调节因子,其表达水平的上调能够促进肝癌的发生。组织芯片和基因敲出实验证明了SRSF10/SREK1L/B-T信号环路的激活能够促进肝癌的发生
[30]。然而,中枢神经系统中高表达的SRSF10对维持大脑正常功能具有重要作用,这是因为在大脑发育过程中前体mRNA的选择性剪接起着关键作用
[31]。以往研究发现,在多基因表达图谱分析和TCGA数据集中,HCC中SRSF10的含量高于正常组织,并且与低总生存率相关。在以往蛋白组学分析中也显示SRSF10在sirt1介导的HCC肿瘤发展中含量丰富。除此之外,多项临床病理参数显示HCC组织SRSF10(
n=74)与肿瘤分级和大小高度相关。此外,SRSF10的高表达能够刺激HCC细胞的生长和侵袭,导致了HCC的恶性表型,其发生机制是因为5个参与增殖和代谢的关键基因与SRSF10表达呈正相关
[32]。本研究通过单因素以及多因素COX分析后发现GNAI2和SRSF10对肝癌患者的生存均存在显著影响,均为不利预后因素。肝癌患者的诊断模型中,GNAI2和SRSF10的
HR系数分别为11.845 5、-0.203 7,且该模型在训练集上的AUC指标为0.971,性能优异(其纳入对象基本为HCC患者)。
综上所述,本研究结果结合以往文献证明了GluA1相互作用蛋白GNAI2和SRSF10分别与MAPK11、ABL1一级药物靶点相互作用,从而有利于提高Regorafenib药物在临床上治疗肝细胞癌的疗效,其高表达一定程度上抑制肝癌细胞的生长、迁移和侵袭。除此之外,GNAI2、SRSF10可作为独立于其他因素(如年龄、等级分期、性别、人种)的不利肝细胞癌预后指标,构建的诊断模型在一定程度上具备较高的准确性。本研究提供的数据可能在未来为肝细胞癌的预后和诊断提供一种新方法。