乳腺癌是全球女性发病率最高的恶性肿瘤之一,每年新增病例约230万,死亡人数超68万
[1-2]。该疾病具有高度异质性,表现为组织学特征、分子分型(如luminal型、HER2阳性型、三阴性型)及临床预后的显著个体差异
[3]。当前乳腺癌治疗以手术切除联合化疗(紫杉类/蒽环类)和靶向治疗为主,但约30%患者面临局部复发或远处转移,其中化疗耐药是导致治疗失败的核心因素
[4]。
细胞凋亡作为程序性死亡的核心机制,通过多级基因调控网络维持组织稳态,其异常与肿瘤发生发展密切相关
[5]。研究表明,凋亡相关基因(如Bcl-2家族、caspase家族)的表达失调可通过以下途径诱导乳腺癌耐药:(1) 靶分子突变(如TP53失活突变削弱化疗诱导的DNA损伤应答);(2) 上下游信号蛋白异常(如survivin过表达抑制凋亡执行阶段);(3) 旁路通路激活(如PI3K/Akt通路活化拮抗凋亡信号)
[6-7]。然而,目前尚缺乏基于凋亡与化疗相关基因特征的系统性研究,以解析其在乳腺癌预后分层和耐药中的协同作用。
在乳腺癌的发生与治疗抵抗中,凋亡和化疗相关基因的调控失衡是核心机制之一。促凋亡基因(如
BIM、
BAX)通过响应化疗药物诱导的DNA损伤或微管稳定性改变,激活线粒体凋亡通路,但其表达下调或表达沉默(如启动子甲基化)可显著削弱紫杉类药物的疗效
[8]。抗凋亡基因(如
Bcl-2、
survivin)则通过抑制caspase级联反应或稳定线粒体膜电位,阻断凋亡执行阶段,导致蒽环类药物耐药。此外,化疗代谢相关基因(如
ABCB1编码的P-糖蛋白)通过主动外排药物降低细胞内浓度
[9],而代谢重编程基因通过脂质合成重塑细胞膜结构并激活PI3K/Akt存活通路,进一步促进肿瘤细胞在化疗压力下的适应性生存。这些基因的协同作用不仅驱动化疗耐药,还与乳腺癌分子分型(如三阴性乳腺癌中FASN高表达)及不良预后密切相关
[10],但目前尚未建立基于多基因交互网络的预后预测模型。本研究旨在解析此类基因的协同调控特征,为乳腺癌精准治疗提供新策略。
本研究基于TCGA乳腺癌队列的RNA测序数据与临床信息,筛选出10个凋亡和化疗相关关键基因,构建多基因预后风险模型。该模型可精准预测患者总生存期(overall survival,OS),并通过体外实验证实PCDHB2通过肿瘤细胞干性介导化学治疗抵抗。这一发现为乳腺癌个体化治疗和耐药逆转策略提供了新靶点。
1 资料与方法
1.1 数据来源与处理
从TCGA数据库(
https://portal.gdc.cancer.gov)下载1 222例乳腺癌组织样本的RNA-seq转录组数据及对应的临床信息(包括年龄、种族、TNM分期等)。纳入标准:(1) 有完整的转录组数据;(2) 有临床随访信息。排除标准:(1) 临床信息缺失(如无生存时间或状态);(2) 低质量样本(基因表达FPKM<1在80%样本中未表达)。最终1 083例患者具有完整临床随访资料,用于后续预后模型构建(单因素/LASSO/多因素Cox回归)。此外,在风险评分计算后,进一步排除风险值缺失的样本,得到909例用于生存分析(基于风险评分中位数分组)。数据清洗及预处理均使用R语言(v4.1.2)完成。
1.2 差异表达基因筛选与功能分析
采用DESeq2包比较乳腺癌组织与正常组织的基因表达差异,以|log2FC|>1且FDR<0.05为筛选阈值,从GeneCards数据库(
https://www.genecards.org)中获取了1 416个与细胞凋亡和化疗相关的基因信息
[11]。利用clusterProfiler包进行GO功能注释(生物过程、分子功能、细胞组分)及KEGG通路富集分析,筛选显著性条目(
P<0.05)。通过pheatmap包绘制差异基因热图,ggplot2包绘制火山图。
1.3 预后风险模型构建
首先,对于单因素Cox回归分析,将差异基因与患者OS进行关联分析,筛选出与预后显著相关基因(
P<0.05);随后通过LASSO回归分析,采用glmnet包对上述基因进行10折交叉验证
[12],通过最小化偏似然偏差(lambda.min)筛选关键基因,避免模型过拟合;最后,采用多因素Cox回归分析对基于关键基因构建比例风险模型,最终确定独立预后基因(
P<0.01),建立风险评分公式:
。其中,
Exp:模型中凋亡和化疗基因的表达值;
β:多因素Cox回归分析后凋亡和化疗基因的回归分析系数(coefficient值)
1.4 模型验证与临床应用评估
首先进行生存分析,根据风险评分中位数将909例患者分为高风险组(
n=454)与低风险组(
n=455),通过survminer包绘制Kaplan-Meier生存曲线,Log-rank检验比较组间差异;随后进行预测效能评估,使用timeROC包计算3、5、7年OS率的AUC值,评价模型预测准确率;随后采用列线图方法进行构建与校准
[13],结合风险评分及临床参数(TNM分期、年龄)建立列线图预测模型,通过校准曲线(500次Bootstrap重采样)验证预测结果与实际生存率的一致性;最后进行独立预后分析,对纳入的1 083例患者进行单因素及多因素Cox回归,以期证实风险评分是乳腺癌患者的独立预后因素。
1.5 临床特征与机制探索
采用Wilcoxon检验比较不同TNM分期、年龄分组的风险评分差异,通过ggpubr包可视化箱线图;基于ssGSEA算法
[14]计算:14种免疫细胞浸润评分,Spearman相关性分析揭示风险评分与免疫微环境的关系;最后,对药物敏感性进行预测:从GDSC数据库(
https://www.cancerrxgene.org)获取药物IC
50值,比较高低风险组对NU7441、氟达拉滨等药物的敏感性差异。
1.6 外部数据集验证
从GEO数据库(GSE109710数据集)获取134例乳腺癌患者的表达谱数据,使用相同模型计算风险评分并进行生存分析,验证模型泛化能力。
1.7 试剂和仪器
胎牛血清(海克隆Hyclone新西兰胎牛血清);L-15培养基(上海源叶生物科技公司);RIPA细胞裂解液(上海碧云天生物技术有限公司);Transwell小室(北京索莱宝生物科技有限公司);riboFECT™ CP Reagent(广州市锐博生物科技有限公司);青霉素双抗(上海泽叶生物公司);PCDHB2小干扰RNA(si-PCDHB2)及其阴性对照(si-NC)(广州市锐博生物科技有限公司);SOX2单克隆抗体(美国Proteintech公司);OCT4单克隆抗体(美国Proteintech公司);GAPDH(美国Santa Cruz公司)。倒置荧光显微镜(日本尼康公司);蛋白免疫印迹实验电泳仪(美国BIO-RAD公司);凝胶系统成像仪(上海天能科技有限公司);恒温摇床(常州金坛良友仪器有限公司);无CO2细胞培养箱(美国赛默飞)。
1.8 实验方法
1.8.1 人三阴性乳腺癌MDA-MB-231细胞培养
MDA-MB-231在L-15培养基中培养,将细胞培养至培养皿底部的80%~90%的密度后,将MDA-MB-231细胞随机分为两组:si-NC组和si-PCDHB2组。通过转染试剂转染入对应的细胞组24 h后,更换培养基。
1.8.2 Transwell实验分析MDA-MB-231细胞侵袭能力
将转染完成的乳腺癌MDA-MB-231细胞按每组1×105的数量培养于上层Transwell室,该室涂有基质胶,培养基中不含胎牛血清。含有5%胎牛血清的完全培养基被添加到下腔体中作为化学吸引剂。孵化24 h后,用预冷福尔马林固定MDA-MB-231细胞,并用1%的结晶紫染色。从每个孔中数出下腔的迁移细胞,并在显微镜下拍照。
1.8.3 细胞划痕实验分析MDA-MB-231细胞迁移能力
细胞转染完成后在6孔培养皿的盖面用记号笔勾画2条整齐直线并接MDA-MB-231细胞,在显微镜下使用200 μL移液枪的枪头将标记部位直线内细胞划除,然后弃掉漂浮的MDA-MB-231细胞,更换新鲜培养基,并分别在划痕24 h后拍照并计算细胞迁移距离,细胞迁移率=原始距离-现阶段细胞间距离/原始距离。
1.8.4 Western blot分析蛋白表达水平
收集转染完成的乳腺癌MDA-MB-231细胞,RIPA试剂裂解细胞30 min,离心并吸取细胞上清后对总蛋白定量,通过聚丙烯酰胺凝胶电泳分离不同分子量大小的目的蛋白,截取目的蛋白区域的凝胶与聚偏二氟乙烯膜贴合后进行电转。用5%的脱脂牛奶封闭,用TBST缓冲液清洗,然后用一抗孵育,在4 ℃下过夜。次日用TBST清洗3次经一抗处理的膜,并在室温下与二抗孵育1 h。将聚偏二氟乙烯膜暴露于增强化学发光试剂以观察蛋白表达情况。
1.9 统计学处理
所有分析均通过R语言完成。正态分布数据采用t检验或单因素方差分析,非正态数据采用Mann-Whitney U检验或Kruskal-Wallis检验。组间连续变量的比较(药物IC50值)采用非参数Mann-Whitney U检验,数据以中位值表示。生存分析采用Kaplan-Meier法,Cox回归计算风险比(HR)。P<0.05为差异有统计学意义。
2 结 果
2.1 差异表达基因筛选及功能注释
从TCGA数据库筛选出989个凋亡和化疗相关差异基因,其中上调基因493个,下调基因496个。热图显示差异基因在乳腺癌与正常组织中的表达模式存在显著差异(
图1A),火山图进一步验证差异基因分布(
图1B)。GO富集分析表明,差异基因在生物学过程中显著富集于骨化、分枝结构形态发生及白细胞迁移(
P<0.05);分子功能主要涉及细胞外基质结构成分、生长因子结合及肽酶活性;细胞组分集中于内质网腔及分泌颗粒腔(
图1C)。KEGG通路分析显示,PI3K/Akt信号通路、细胞因子-细胞因子受体相互作用及人乳头瘤病毒感染通路为关键调控途径(
图1D)。
2.2 预后风险模型构建及性能验证
单因素Cox回归分析:对1 083例患者生存数据与989个差异基因进行关联分析,筛选出103个预后相关基因。GO与KEGG富集显示这些基因与免疫调节及细胞周期通路相关(
图2A-B)。随后进行LASSO回归筛选:通过10折交叉验证(lambda.min=0.023),从103个基因中提取30个关键基因(
图2C-D)。将LASSO回归分析中系数不为0的基因纳入多因素Cox回归分析,最终筛选出10个基因,以这10个基因为基础构建预后风险模型随后,通过多因素Cox回归模型最终构建包含10个独立预后基因的评分模型(
图2E-F),如上所述,最终选择10个基因建立预后风险模型,计算公式如下:
=0.402 524 847×(ZNF443)+0.017 657 135×(ZNF750)+0.069 447 928×(CD24)+0.196 846 65×(EPB41L4B)+0.187 101 327×(PCDHB2)+0.122 269 472×(IVL)+0.127 091 526×(MAL2)+0.130 181 034×(NANOS1)+0.112 130 759×(PITPNM3)+0.065 384 069×(PSCA)。根据中位风险值将909例患者分为高低风险组,高风险组OS率显著低于低风险组(
HR=0.41,95%
CI=0.29~0.60,
P<0.001)(
图2G)。随后进行预测效能评估,时间依赖性ROC曲线显示,模型对3、5、7年OS率的AUC值分别为0.705、0.650、0.657(
图2H)。
2.3 预后模型的可视化与评估
基于风险评分将患者分为高低风险组(
图3A),生存状态散点图表明高风险组死亡事件密度显著增加,风险热图进一步揭示10个关键基因(如
PCDHB2、
ZNF443)在高风险组中普遍上调。通过列线图预测模型构建,整合风险评分、年龄及TNM分期构建列线图模型(
图3B),用于个体化生存概率预测。模型一致性指数(C-index)为0.708(95%
CI=0.683~0.733),可以看到绘图得到的线条较好地拟合到了对角线上,证明该模型的预测效果较好,提示其具有较高的预测准确率。例如,总评分为220分的患者,其3、5、7年OS率分别为80%、76%、50%。校准曲线显示(
图3C),模型预测的3、5年OS率与实际观察值高度吻合(3年:平均绝对误差=1.8%;5年:平均绝对误差=2.3%),拟合曲线与理想对角线接近(Bootstrap重采样500次,
P>0.05),表明模型预测结果无显著偏倚。
2.4 关键基因与临床特征、免疫细胞及敏感性的关系
首先通过单因素和多因素Cox分析结果进行独立预后分析,多因素Cox回归证实,风险评分是乳腺癌患者的独立预后因素(
HR=2.31,95%
CI=1.86~2.88,
P<0.001),且与年龄(
P<0.001)、N分期(
P<0.001)明显有关(
图4A-B)。临床相关性方面,PCDHB2及PSCA在病理分期Ⅲ和Ⅳ期中表达上调(
图4C-D);基因
IVL、
NANOS1及
ZNF443在老年患者中高表达(
P<0.05)(
图4E-G),PCDHB2及PSCA分别在T分期和N分期中表达上调(
图4H-I)。随后,分析了预后风险模型的10个关键基因与T细胞,中性粒细胞,树突状细胞,CD8
+ T细胞,B细胞,抗原呈递树突状细胞,肥大细胞,NK细胞,浆细胞样树突状细胞,Tgd细胞,Th1细胞,巨噬细胞,Treg细胞,效应记忆T细胞等14种免疫细胞之间的相关性。其中EPB41L4B、IVL、PSCA、ZNF443和MAL2与T细胞,中性粒细胞和CD8
+ T细胞密切相关,CD24、PCDHB2和ZNF750与B细胞、肥大细胞和Treg细胞密切相关(
图5A-J),同时绘制了10个关键基因与免疫微环境相关性热图(
图5K),发现风险评分与T细胞(
r=-0.23,
P<0.001)、CD8
+ T细胞(
r=-0.18,
P=0.002)浸润呈负相关,与中性粒细胞(
r=0.31,
P<0.001)及巨噬细胞(
r=0.27,
P<0.001)浸润呈正相关。药物敏感性分析显示,基于GDSC数据库的预测模型提示,高风险组的预测IC
50标准化评分显著高于低风险组。对于NU7441,高风险组的中位评分(0.39)显著高于低风险组的中位评分(0.31)(
P<0.001)。对于氟达拉滨,高风险组的中位评分(0.38)同样显著高于低风险组(0.29)(
P<0.001)。该结果表明,基于计算模型预测,高风险组对这两种药物可能更具耐药性(
图5L-M)。
2.5 外部数据集验证
基于GSE109710数据集(
n=134),风险模型将患者分为高、低风险组(
n=67/组)。高风险组OS率显著降低(
HR=1.89,95%
CI=1.12~3.20,
P=0.025)(图
6A),
3、
5、
7年AUC值分别为0.741、0.660、0.719(
图6B),验证了模型泛化能力。
2.6 细胞实验验证
在本研究构建的乳腺癌凋亡和化疗相关多基因预后模型中,
PCDHB2被确定为10个独立预后相关关键基因之一,其在高风险组患者中显著高表达。进一步分析表明,PCDHB2的表达水平与多项临床不良特征密切相关:其在晚期病理分期(Ⅲ~Ⅳ期)、肿瘤更大T分期(T3~T4)和淋巴结转移N分期(N1~N3)患者中显著上调,提示其可能参与肿瘤的侵袭与转移过程。此外,免疫微环境分析显示,PCDHB2与多种免疫抑制相关细胞(如Treg细胞、B细胞、肥大细胞)呈正相关,进一步暗示其可能通过影响肿瘤免疫逃逸与微环境重塑促进乳腺癌耐药,同时PCDHB2与乳腺癌的关系尚不明确,因此对PCDHB2进行细胞生物学实验验证。细胞划痕实验结果显示,与si-NC组比较,si-PCDHB2组的MDA-MB-231细胞的迁移能力降低(
P<0.05)(
图7A);Transwell实验结果显示,与si-NC组比较,si-PCDHB2组的MDA-MB-231细胞的侵袭能力降低(
P<0.05)(
图7B);Western blot结果显示,与si-NC组比较,si-PCDHB2组的MDA-MB-231细胞的SOX2蛋白表达降低(
P<0.05),而OCT4蛋白表达两组无明显差异(
P>0.05)(
图7C)。
3 讨 论
乳腺癌是一种具有高度异质性的恶性肿瘤,尽管当前以手术为基础的综合治疗取得了显著进展,但化疗耐药仍是临床治疗失败和复发转移的主要原因之一
[2,15]。本研究围绕凋亡和化疗相关基因的协同作用,构建了多基因预后风险模型,并通过生物信息学分析与体外实验相结合的方式,系统揭示了其在乳腺癌中的分子机制及临床应用潜力。
首先,通过TCGA数据库的差异表达与生存分析,本研究筛选出10个与凋亡和化疗密切相关的关键基因(如PCDHB2、CD24、ZNF443等),并构建出可用于乳腺癌OS预测的多因素Cox回归风险评分模型。模型在TCGA队列中的生存分析和时间依赖性ROC分析结果显示,模型具有良好的预测能力(3年AUC=0.705,5年AUC=0.650),列线图校准图与实际生存率高度一致(误差<2.5%),提示该模型在乳腺癌患者预后分层和风险评估中具有广泛应用价值。值得关注的是,模型中多个基因(如PCDHB2、PSCA)在高风险组患者中显著上调,且其表达水平与晚期TNM分期及淋巴结转移密切相关,提示其可能在肿瘤进展过程中发挥驱动作用。
在构建预后风险模型的这10个基因中,已有研究
[16]表明,有的基因与部分癌症有着显著的相关性,如
CD24、
MAL2、
PSCA已有研究证实与乳腺癌显著相关;通过构建CD24敲低及过表达三阴性乳腺癌模型,结合体外实验、体内分析及多组学(基因组、脂质组、代谢组)研究发现,CD24作为转移性TNBC的肿瘤抑制因子,其表达缺失通过激活PPARα介导的脂肪酸β-氧化通路,诱导线粒体氧化磷酸化并驱动代谢重编程,进而抑制肿瘤进展。通过Meta分析
[17]发现,CD24高表达与乳腺癌患者OS率和无病生存率降低及淋巴结侵袭、TNM分期等临床病理因素显著相关,提示CD24可作为乳腺癌的有效预后因子。功能实验
[18]表明,敲低MAL2可通过抑制β-catenin/c-Myc信号轴减少乳腺癌细胞迁移侵袭(与上皮-间充质转化相关)、促进细胞凋亡并降低体内转移能力,而β-catenin激动剂SKL2001可部分逆转上述表型,证实MAL2通过调控β-catenin/c-Myc通路驱动乳腺癌进展。同时,MAL2通过直接结合MHC-I复合体及内体相关RAB蛋白促进肿瘤抗原内吞,从而下调抗原呈递并介导免疫逃逸;临床前模型中敲除MAL2可显著增强肿瘤浸润CD8
+ T细胞毒性并抑制乳腺癌生长,提示靶向MAL2是增强肿瘤免疫治疗应答的潜在策略。笔者的免疫浸润结果也支持这一结论。
此外,本研究还揭示了预后模型与免疫微环境之间的密切关系:高风险评分与CD8+ T细胞浸润呈负相关,而与中性粒细胞和巨噬细胞浸润呈正相关。这一免疫特征提示高风险患者可能处于“冷肿瘤”微环境状态,提示其对免疫治疗反应较差,进一步强调了精准免疫干预的重要性。药物敏感性分析亦显示,高风险组对常见化疗药物NU7441和氟达拉滨的敏感性显著下降,提示上述基因的表达变化可能与多药耐药表型密切相关。
已有研究
[19-20]表明,
PCDHB2在多种实体瘤中表达异常,并可能与细胞迁移、黏附及信号转导相关,但其在乳腺癌中的功能研究尚属空白。目前关于
PCDHB2在乳腺癌中的分子机制报道极为有限,且其已被申请为乳腺癌骨转移相关专利靶点
[21],具备良好的研究前景和临床转化潜力。基于上述分析,本研究选择
PCDHB2作为代表性验证基因,采用体外实验探讨其在乳腺癌细胞迁移、侵袭及干性维持等过程中的作用机制。初步实验结果亦证实,沉默
PCDHB2可显著抑制三阴性乳腺癌细胞(MDA-MB-231)的迁移与侵袭能力,并下调干性相关蛋白SOX2的表达,提示
PCDHB2可能通过维持肿瘤细胞干性介导化疗耐药。这为其作为乳腺癌潜在治疗靶点提供了坚实基础,这一发现为靶向乳腺癌干性细胞以克服化疗耐药提供了新思路。
尽管本研究构建的多基因风险模型经外部GEO队列验证,表现出良好的泛化能力,但仍存在一定局限性。首先,模型的构建与验证主要基于公开数据库,部分样本信息可能存在不完整或异质性;其次,PCDHB2等关键基因的作用机制仍需进一步通过动物模型和临床样本验证;最后,未来应结合单细胞测序技术深入解析不同细胞群在耐药过程中的转录特征。
综上所述,本研究系统揭示了凋亡和化疗相关基因在乳腺癌耐药与预后中的关键作用,构建的多基因预后模型具有良好的预测性能和临床应用潜力,尤其是PCDHB2作为潜在治疗靶点,为乳腺癌个体化治疗提供了理论依据和实践指导。后续研究应进一步探索关键基因在免疫微环境重塑与治疗应答中的作用,以推动乳腺癌精准治疗策略的临床转化。