结直肠癌(colorectal cancer,CRC)是常见的消化道恶性肿瘤之一,据Siegel RL等
[1]的报道和2020年我国癌症统计报告
[2]显示,结直肠癌的发病率和死亡率均呈上升趋势,并且有年轻化表现,其恶性程度在世界排名第三位,死亡率高居第二位。虽然目前结直肠癌的诊断技术和治疗方式均在不断发展改善,但晚期结直肠癌患者预后极差,5年生存率不到12%
[3]。因此,有必要深入挖掘结直肠癌的发生发展机制,为临床结直肠癌的诊断治疗提供新的思路。根据最新研究发现,双硫死亡是由细胞内的双硫化合物积累,引发双硫应激/胁迫,最终导致的细胞死亡
[4]。而结直肠癌与双硫死亡的相关性,还未有文献报道。
本研究基于TCGA数据库和已报道的双硫死亡相关基因,识别结直肠癌中的双硫死亡相关基因。并在GEO数据库和人类蛋白图谱(human protein atlas,HPA)数据库上进一步验证得到目的基因。分别使用ROC曲线下面积(area under the curve,AUC)和K-M生存曲线图分析目的基因对结直肠癌鉴别诊断价值和对患者总体生存率的影响,最后利用TIMER数据库分析目的基因表达与免疫细胞浸润的相关性。本课题组为结直肠癌提供潜在的治疗靶点。技术路线见
图1。
1 材料与方法
1.1 从TCGA数据库中鉴定双硫死亡相关基因
从TCGA数据库
[5](
https://portal.gdc.cancer.gov) 下载并整理TCGA-COAD和TCGA-READ项目STAR流程的RNAseq数据并提取Counts格式的数据以及临床数据,去除没有临床数据的样本,最终得到包括647个肿瘤组织和51个癌旁组织。双硫死亡相关基因从文献[
4]中收集。将双硫死亡相关基因与TCGA数据集中的DEGs取交集,得到目标基因。
1.2 基因表达数据库和蛋白质图谱(HPA)数据库中<italic>SLC7A11</italic>、<italic>SLC3A2</italic>转录和翻译水平验证
GEO数据库
[6](
http://www.ncbi.nlm.nih.gov/geo)选取GSE134834和GSE6988数据集,全部来源为人类。通过GSE134834数据集中正常结直肠组织5例,结直肠癌组织5例验证结直肠肿瘤组织和正常组织中
SLC7A11和
SLC3A2表达水平。通过GSE6988数据集验证结直肠肿瘤组织和正常组织
SLC3A2的表达水平,GSE6988数据集中正常结直肠组织28例,结直肠癌组织82例。HPA是1个开放的数据库,允许学术界和工业界的研究人员免费访问来探索人类蛋白质组。在本研究中,使用HPA数据库
[7](
http:// www.proteinatlas.org),通过免疫组化方法验证了从正常细胞和肿瘤细胞中
SLC3A2的蛋白表达。
1.3 基因<italic>SLC7A11 </italic>qPCR实验验证
使用结肠癌cDNA芯片(上海芯超),包括结直肠癌和癌旁各15例标本,检测
SLC7A11基因和内参基因b-Actin。
SLC7A11基因引物序列
[8](Forward:5'-ATACGCTGAGTGTGGTTTGC-3',Reverse:5'-GTTCCACCCAGACTCGTA-3'),b-Actin基因引物序列(Forward:5'-GAAGAGCTACGAGCTGCCTGA-3',Reverse:5'-CAGACAGCACTGTGTTGGCG-3'),按照荧光定量PCR试剂的试剂盒说明书进行操作,按以下扩增程序进行荧光定量PCR扩增检测:预变性95℃ 5 min;循环:变性95℃ 15 S,退火60℃ 30 S,延伸72℃ 30 S,循环40 次。实验结束后按照相对定量方法计算
SLC7A11基因表达。
1.4 <italic>SLC7A11</italic>和<italic>SLC3A2</italic>对结直肠癌鉴别的诊断价值
在本研究中,SLC7A11和SLC3A2对结直肠癌鉴别诊断价值,通过GSE184093数据集进行分类分析,其中正常结直肠组织和肿瘤组织各9例样本,使用SLC7A11和SLC3A2的表达量作为基因标记物,并统计分类结果的特异性和敏感度,结果用ROC曲线展示,并计算AUC量化预测效果。在AUC>0.5的情况下,AUC越接近于1,说明该变量在预测结局上诊断效果越好。0.5<AUC≤0.7时有较低准确性,0.7<AUC≤0.9时有一定准确性,AUC>0.9时有较高准确性。AUC=0.5时,说明该变量不起作用,无诊断价值。
1.5 结直肠癌患者<italic>SLC7A11</italic>和<italic>SLC3A2</italic>生存分析
使用Kaplan-Meier Plotter数据库
[9](
http://kmplot. com/analysis/)中记录的基因表达和患者生存时间数据,对基因
SLC7A11和
SLC3A2对结直肠癌的影响进行生存分析。
1.6 结直肠癌中肿瘤浸润免疫细胞与<italic>SLC7A11</italic>和<italic>SLC3A2</italic>表达相关性分析
TIMER数据库
[10](
https://cistrome.shinyapps.io/timer/)可用于系统评价各种类型肿瘤的免疫细胞浸润。该数据库用于分析树突状细胞(dendritic Cell)、中性粒细胞(neutrophil)、巨噬细胞(macrophage)、CD4
+T细胞(CD4
+ T cell)、CD8
+T细胞(CD8
+ T cell)和B细胞(B cell)的肿瘤浸润情况。
1.7 统计学方法
所有统计分析均采用R(4.2.1)版本进行。使用pROC包对进行分类效果评估的ROC分析。正态计量资料采用均数±标准差形式表达,非正态计量资料用中位数(四分位数)[Md (P25,P75)]表示,计数资料用率、构成比等形式表达。肿瘤样本和正常样本之间SLC7A11和SLC3A2的差异表达水平采用Mann-Whitney U检验和独立样本t检验。所有结果均使用ggplot2进行可视化。高表达和低表达均是与非肿瘤细胞相比较。检验水准α=0.05。
2 结果
2.1 从TCGA数据库中鉴定双硫死亡相关基因
TCGA数据库中满足
p.adj<0.05且|log
2FC|≥1阈值的gene symbol有15768个,与文献查询到的6个双硫死亡相关基因(包括:
SLC7A11、
SLC3A2、
GLUT1、
NCKAP1、
WAVE2、
Rac1)取交集后得到2个双硫死亡相关结直肠癌基因,分别是
SLC7A11和
SLC3A2。具体见
图2A。
SLC7A11和
SLC3A2在肿瘤中均为高表达,差异均有统计学意义(
P<0.001)。具体见
图2B。
2.2 不同数据库和人类蛋白质图谱(HPA)对<italic>SLC7A11</italic>和<italic>SLC3A2</italic>转录水平的验证
通过GSE134834数据库验证,
SLC7A11和
SLC3A2在肿瘤组织中均高表达,差异有统计学意义(
P<0.05);通过GSE6988数据库验证,
SLC3A2在肿瘤组织中高表达,差异有统计学意义(
P<0.001)。具体见
图3。通过HPA也验证了结直肠癌肿瘤组织中
SLC3A2的蛋白高表达,图中红色方框为放大区域。具体见
图4。综上所述,这些结果提示
SLC7A11和
SLC3A2在结直肠癌患者中表达上调,与TCGA数据库表达一致。
2.3 基因<italic>SLC7A11 </italic>qPCR实验验证
通过qPCR实验验证,基因
SLC7A11在结直肠癌组织中高表达,差异有统计学意义(
P<0.05)。具体见
图5。
2.4 <italic>SLC7A11</italic>和<italic>SLC3A2</italic>对结直肠癌鉴别的诊断价值
利用
SLC7A11和
SLC3A2 2个基因作为标记物,使用不同的阈值对样本进行分类,并评估分类的准确性。通过ROC曲线图可以发现,
SLC7A11对结直肠癌鉴别诊断AUC=0.840,95%CI=0.663~1.000,
SLC3A2对结直肠癌鉴别诊断AUC=0.667,95%CI=0.395~0.938,
SLC7A11对结直肠癌鉴别诊断具有一定的准确性。
SLC3A2对结直肠癌的诊断价值相对较低。具体见
图6。
2.5 结直肠癌患者<italic>SLC7A11</italic>和<italic>SLC3A2</italic>的生存分析
通过K-M生存曲线分析
SLC7A11和
SLC3A2基因对患者总体生存率的影响,可以发现,
SLC7A11高表达,结直肠癌患者预后较好,差异有统计学意义(
P<0.05);
SLC3A2高表达,结直肠癌患者预后较差,但是差异无统计学意义(
P=0.061)。具体见
图7。
2.6 结直肠癌肿瘤浸润免疫细胞与<italic>SLC7A11</italic>和<italic>SLC3A2</italic>表达相关分析
在本研究中,进一步利用TIMER数据库来分别评估结直肠癌中免疫浸润水平与
SLC7A11和
SLC3A2表达之间的相关性。
SLC7A11表达与结肠腺癌中的CD8
+ T细胞(
r=0.358)、中性粒细胞(
r=0.267)、树突状细胞(
r=0.171)浸润水平呈正相关(
P<0.001),
SLC7A11表达与直肠癌的CD8
+ T细胞(
r=0.365)、中性粒细胞(
r=0.336)浸润水平呈正相关(
P<0.001),具体见
图8。
SLC3A2表达与结肠腺癌的CD8
+ T细胞(
r=-0.184)、B细胞(
r=-0.158)浸润水平呈负相关(
P<0.01),与结肠腺癌的CD4
+ T细胞(
r=0.11)呈正相关(
P<0.05),具体见
图9。
3 讨 论
大量研究报道了多种其他基因也与结直肠癌相关
[11-13],然而其发病机制仍不明确,患者的5年生存率尚待提高。因此,为提高结直肠癌的预防、早期诊断、个体化治疗及预后的评估,非常有必要进一步识别潜在的分子生物标志物和治疗靶点。近期一项研究表明
[4],当肿瘤细胞高表达SLC7A11蛋白时,在葡萄糖饥饿的条件下,细胞胞内的胱氨酸等二硫化物会发生异常积累,后者会诱导二硫化物应激/胁迫,导致肌动蛋白细胞骨架之间的异常二硫键交联,最终引起肌动蛋白网络崩溃,从而形成肿瘤细胞死亡。这种因葡萄糖缺乏而诱导的高表达
SLC7A11癌细胞死亡不属于任何一种已知的细胞死亡类型,不但不能被一般细胞死亡抑制剂或敲除铁死亡/细胞凋亡关键基因所阻止,且硫醇氧化剂(如二酰胺和马来酸二乙酯)则可以显著增强这种细胞死亡,因而该死亡方式被命名为双硫死亡。研究还发现
[4],高表达
SLC7A11的癌细胞在葡萄糖转运体(glucose transporter,GLUT)抑制剂的诱导下可发生双硫死亡,进而抑制肿瘤生长,且对正常组织无明显毒性,有望成为肿瘤治疗的新策略。因此,本研究旨在基于生物信息学方法识别双硫死亡相关基因与结直肠癌的关系,并评估结直肠癌免疫细胞浸润情况。
在本研究中,通过生物信息学分析识别出了2个双硫死亡相关基因与结直肠癌密切相关,包括基因
SLC7A11和
SLC3A2,它们均在结直肠癌中高表达。通过K-M生存曲线分析发现,
SLC7A11高表达,与预后良好相关。
SLC7A11基因可能被认为是一种潜在的预后标志物。
SLC7A11和
SLC3A2基因均为溶质载体家族(solute carrier family,SLC)中的成员,后者是人类基因组中仅次于G蛋白偶联受体的第二大基因家族,参与介导代谢物和溶质跨细胞膜的转运
[14]。
SLC7A11是一种重要的跨膜蛋白,其参与氨基酸代谢来维持胞内氧化还原的稳态,与
SLC3A2共同组成System Xc
-。
SLC7A11作为System Xc
-的功能亚基发挥主要生物学功能和转运活性,而
SLC3A2作为伴侣蛋白参与维持
SLC7A11的稳定性,它们以1∶1的比例摄入胞外的Cys2并排出胞内的谷氨酸(glutamate,Glu)
[15]。进入细胞质的Cys2迅速还原为Cys用于合成GSH
[16]。如前所述,
SLC7A11促进葡萄糖依赖性,导致具有高
SLC7A11表达的癌细胞对葡萄糖缺乏具有更高的敏感性
[17]。
双硫死亡相关基因一方面与结直肠癌的发生发展或有密切关系,另一方面又在结直肠癌的免疫浸润中起着重要的作用。进一步利用TIMER数据库来分别评估结直肠癌免疫浸润水平与
SLC7A11和
SLC3A2表达之间的相关性中,发现
SLC7A11的表达与结肠腺癌中的CD8
+ T细胞、中性粒细胞、树突状细胞浸润水平呈正相关,与直肠癌的CD8
+ T细胞、中性粒细胞浸润水平呈正相关。
SLC3A2的表达与结肠腺癌的CD8
+ T细胞、B细胞浸润水平呈负相关,与结肠腺癌的CD4
+ T细胞呈正相关。有研究表明
[18],CD4
+T细胞具有较高的免疫抑制作用,通过抑制有效地抗肿瘤免疫,促进肿瘤进展。B细胞也被证明在调节与肿瘤、自身免疫和炎症相关的免疫反应中发挥重要作用
[19]。CD8
+ T细胞可以分化为细胞毒性T淋巴细胞,后者具有抗肿瘤作用。有研究报道,中性粒细胞是肿瘤微环境中重要的炎症性浸润细胞,与肿瘤的发生发展密切相关,肿瘤相关中性粒细胞可以极化为抗肿瘤表型(N1型)和促肿瘤表型(N2型)
[20]。综上所述,免疫浸润与结直肠癌发生发展密切相关,但机制复杂。CD8
+T细胞和中性粒细胞(N1型)均具有抗肿瘤作用,这些免疫细胞的升高,可能也与
SLC7A11高表达,结直肠癌患者总体生存期反而较长这一结果有一定的联系。
人类
SLC7A11-SLC3A2复合物的结构和Erastin结合该复合物的高分辨率结构已经有相关研究报告和解析
[21-22],这可能为合理设计有效的双硫死亡诱导剂提供结构基础,从而产生更有效的治疗策略。目前,针对
SLC7A11的疫苗已经研制成功,但要达到抑制
SLC7A11的效果可能需要大剂量疫苗,而后者的安全性仍有待探索,还有其毒副作用也需要进一步评估
[23]。因此,开发靶向
SLC7A11和或者
SLC3A2的新型高效小分子药物可能是未来治疗结直肠癌疾病的发展方向之一。本研究发现,
SLC7A11和
SLC3A2这2个双硫死亡相关基因均在结直肠癌患者中高表达,并与结直肠癌免疫浸润密切相关,且
SLC7A11对结直肠癌鉴别诊断具有一定的准确性,本课题组的发现为结直肠癌提供了可靠和潜在的治疗靶点。