基于机器学习算法的黑色素瘤免疫治疗预后预测模型构建

董静 ,  汪译函 ,  卜佩 ,  黄晓丹 ,  陈珊 ,  何岚 ,  刘喜武 ,  张月明

华中师范大学学报(自然科学版) ›› 2026, Vol. 60 ›› Issue (02) : 296 -307.

PDF (3150KB)
华中师范大学学报(自然科学版) ›› 2026, Vol. 60 ›› Issue (02) : 296 -307. DOI: 10.19603/j.cnki.1000-1190.2026.02.012
人工智能·智慧医疗

基于机器学习算法的黑色素瘤免疫治疗预后预测模型构建

作者信息 +

Construction of a machine learning-based prognostic model for melanoma immunotherapy

Author information +
文章历史 +
PDF (3225K)

摘要

黑色素瘤免疫治疗耐药与肿瘤微环境动态异质性相关,本文旨在通过生物信息学技术,整合基因表达谱与临床特征参数,提出TME分型策略,开发黑色素瘤预后预测模型(MMPS),实现动态预后分层,为生物标志物联用提供理论依据.本研究依托TCGA-SKCM队列数据,使用ESTIMATE、CIBERSORT等算法量化TME特征,通过无监督聚类与LASSO-Cox回归筛选核心预后基因,构建黑色素瘤微环境预后评分(MMPS)模型.经评估,该模型在5年总生存期预测中表现出显著优势,相较于传统TNM分期,其预测效能提升了28%,差异具有统计学意义.该模型能够为黑色素瘤患者的预后评估提供科学、可靠的量化依据.

Abstract

Immunotherapy resistance in melanoma correlates with dynamic heterogeneity in the tumor microenvironment (TME). This study aims to integrate gene expression profiles with clinical parameters through bioinformatics techniques, propose a TME classification strategy, and develop a melanoma prognosis prediction model (MMPS) to achieve dynamic prognostic stratification, thereby providing a theoretical basis for biomarker combination therapy. Leveraging the TCGA-SKCM cohort, this study quantifies TME features using algorithms such as ESTIMATE and CIBERSORT. Core prognostic genes were identified through unsupervised clustering and LASSO-Cox regression, leading to the construction of the melanoma microenvironment prognostic score (MMPS) model. Evaluation demonstrated the model’s significant advantage in predicting 5-year overall survival, with a statistically significant 28% improvement in predictive performance compared to traditional TNM staging. This model provides a scientifically sound and reliable quantitative basis for assessing prognosis in melanoma patients.

Graphical abstract

关键词

黑色素瘤 / 机器学习 / 预后预测模型 / 肿瘤微环境 / 免疫治疗

Key words

melanoma / machine learning / prognostic prediction model / tumor microenvironment / immunotherapy

引用本文

引用格式 ▾
董静,汪译函,卜佩,黄晓丹,陈珊,何岚,刘喜武,张月明. 基于机器学习算法的黑色素瘤免疫治疗预后预测模型构建[J]. 华中师范大学学报(自然科学版), 2026, 60(02): 296-307 DOI:10.19603/j.cnki.1000-1190.2026.02.012

登录浏览全文

4963

注册一个新账户 忘记密码

黑色素瘤作为恶性程度最高、侵袭性最强的皮肤恶性肿瘤,是导致皮肤癌相关死亡的主要原因,约占死亡病例的73%1.近年来,程序性死亡蛋白-1(programmed death-1, PD-1)和细胞毒性T淋巴细胞相关蛋白-4(cytotoxic T-lymphocyte-associated protein 4, CTLA-4)抑制剂为代表的免疫检查点抑制剂(immune checkpoint inhibitors, ICIs)革命性地改变了晚期黑色素瘤的治疗格局,已成为一线标准治疗方案2.然而在临床实践中,仍有相当一部分患者存在原发性耐药,或在初始响应后出现获得性耐药,这严重制约了免疫治疗的总体疗效3.
肿瘤微环境(tumor microenvironment, TME)是肿瘤细胞赖以生存的复杂生态系统.越来越多的证据表明,TME的组成和功能状态,特别是免疫细胞的浸润程度、亚型比例及其空间分布,是决定免疫治疗成败的核心因素4.例如,富含细胞毒性T细胞的“免疫炎症型”或“热肿瘤”通常对ICI反应良好5;而以髓系来源抑制细胞、调节性T细胞大量浸润为特征的“免疫抑制型”或“冷肿瘤”则往往伴随治疗耐药6.因此,深入解析TME的异质性,并据此对患者进行精准分型,有望为免疫治疗疗效预测开辟新的路径.
基于计算推断的TME特征,研究者们已尝试利用无监督聚类方法(K-means)对患者进行分子分型.然而,将复杂的TME分型结果转化为适用于临床的、简化的预后模型仍是一大挑战,故结合了正则化技术的LASSO-Cox回归模型的机器学习算法,从海量的基因表达数据中自动筛选出最具预后预测价值的核心基因组合,有效避免过拟合,从而构建出简洁、稳健的风险评分系统.
基于以上背景,本研究旨在整合多组学分析框架与机器学习算法,构建基于肿瘤微环境核心基因的黑色素瘤预后预测模型(melanoma microenvironment prognostic score, MMPS),并系统评估其临床价值.

1 资料与方法

1.1 数据集及临床资料获取

本研究在美国国立肿瘤研究机构的TCGA数据库(https://portal.gdc.cancer.gov)中通过黑色素瘤(TCGA-SKCM)过滤癌种,收集了473名黑色素瘤患者的高通量测序数据(fragments per kilobase of transcript per million mapped reads, FPKM格式)及相应临床信息,459例具有完整的年龄、性别、TNM分期(tumor node metastasis classification)等临床资料,作为本次研究的训练集.从美国生物技术信息中心NCBI的子数据库GEO(https://www.ncbi.nlm.nih.gov/gds)中下载GSE162682数据集,收集107名黑色素瘤患者的转录组数据和临床数据,其中,101名患者具有完整的临床数据,纳入本次研究的验证集.

1.2 TME计算方法及免疫细胞浸润程度

本研究使用ESTIMATE算法——基于癌症基因组图谱中基因表达谱来计算肿瘤样本中基质细胞和免疫细胞数量之和,从而预测肿瘤纯度7.该算法基于单样本基因集富集分析原理,生成3个分数:免疫评分(immune score)、基质评分(stromal score)和ESTIMATE综合评分(ESTIMATE score).

基于Illumina平台分析来自TCGA数据库的黑色素瘤转录组测序数据,评估黑色素瘤患者的免疫评分和基质评分,ESTIMATE score等于免疫评分和基质评分之和,ESTIMATE score越高,意味着肿瘤纯度越低.使用CIBERSORT算法8进行免疫细胞浸润的精细分解.为确保结果可靠性,仅保留CIBERSORT输出中p<0.05的样本,并且仅分析在超过一半样本中浸润比例>0的免疫细胞亚群.

1.3 聚类分析与TME亚型识别

为探索TME异质性,基于CIBERSORT计算得到22种免疫细胞浸润比例矩阵.由于K-means算法具有效率高、可解释性强等特点,在无监督学习领域的基因组学数据分型中占据重要地位,故采用K-means聚类(K=3)对435例患者进行无监督聚类分析.

其技术路径可分解为:首先基于预设聚类数KK=3),从N个样本中确定初始聚类中心,该策略通过概率分布优选相距较远的种子点,有效规避传统随机初始化导致的局部最优陷阱;随后基于欧氏距离构建样本与质心的相似性矩阵,将各样本划分至最近邻簇,其中欧氏距离的计算需经Z-score标准化处理以消除特征量纲差异;完成簇分配后,算法重新计算各簇几何中心(即特征空间内所有样本坐标的算术均值),并通过最大迭代次数(300次)或质心偏移阈值(Δ<1×10-4)控制收敛过程.

为确定最优聚类数,本研究实施肘部法则进行模型选择:在K=2~10的参数空间内,系统计算各K值对应的簇内离差平方和(within-cluster sum of squares, WCSS):

WCSS=(样本与所属簇心的欧氏距离²)

绘制WCSS-K曲线并识别其拐点.当K增至3时,曲线斜率显著趋缓,表明继续增加聚类数对模型解释力的提升边际效益递减,据此确立K=3为黑色素瘤患者分子亚型划分的最优解.最终获得的3个患者亚群在基因组变异谱、肿瘤微环境特征等方面展现出显著异质性,为后续精准治疗策略的制定提供了数据驱动的分类框架.

1.4 差异表达基因筛选与功能富集分析

为揭示不同TME亚型间的分子差异,使用Limma R包进行差异表达基因(differentially expressed genes, DEGs)分析,构建三维比较矩阵(TME group1 vs. 2, group1 vs. 3, group2 vs. 3),设定差异阈值为 |log2(Fold Change)| > 1.5,假发现率(false discovery rate, FDR)校正值p< 0.05,系统识别黑色素瘤TME分子亚型间具有统计学意义的差异表达基因.将3组比较得到的差异表达基因分别取交集,通过Venn Diagram分析,筛选出199个TME核心差异基因,包括86个共同上调基因和113个共同下调基因.

1.5 预后模型的构建与验证

1.5.1 预后模型构建

将199个TME核心基因的表达量与患者的总生存期(overall survival, OS)进行单因素Cox比例风险回归分析.以p<0.05为显著性标准,初步筛选出60个与预后显著相关的候选基因.为避免高维数据过拟合,通过绘制LASSO回归的正则化路径,系统展示特征变量系数随惩罚参数λ对数变换log(λ)的动态收缩过程.采用k折(k-fold)交叉验证构建模型误差评估体系,以均方误差(mean square error, MSE)作为评判标准,当log(λ)=12时,模型达到偏差-方差权衡的最优点,此时对应λ=12被确定为最优惩罚参数,故最终保留12个特征性基因.将LASSO筛选出的12个基因纳入多因素Cox比例风险模型进行最终优化.采用逐步回归法(向前选择与向后剔除结合),最终确定5个具有独立预后价值的核心基因,并得到其回归系数,构建黑色素瘤预后模型(MMPS).同时,根据MMPS评分的中位值将样本分为高危(high-Risk)亚组和低危(low-Risk)亚组.

下一步采用Kaplan-Meier法绘制高危组和低危组的生存曲线,并用log-rank检验比较组间生存差异.使用time ROC函数计算模型在3年、5年、10年时间点的曲线下面积(area under curve,AUC)值,评估其在不同时间点的预测准确性.通过单因素及多因素Cox回归分析,检验MMPS评分是否独立于年龄、性别、TNM分期等传统临床因素.比较不同临床亚组(如不同年龄、分期)中MMPS评分的分布差异,以及各亚组内MMPS分层的生存差异以此进行模型效能评估.

1.5.2 列线图构建与临床效用评估

将多因素Cox回归分析中显著的预后因素MMPS评分、年龄、TNM分期等进行整合,构建一个可视化的列线图(nomogram).该图可将每个变量的取值转化为分数,通过总分预测患者1年、3年、5年的生存概率.然后采用Bootstrap法重抽样1 000次,绘制校准曲线,比较列线图预测的生存概率与实际观察到的生存概率(通过Kaplan-Meier法估计)的一致性.理想情况下,校准曲线应接近45°对角线.决策曲线分析(decision curve analysis, DCA)通过计算在不同阈值概率下的“净效益”(net benefit),来评估模型的临床实用性9.

1.6 统计分析方法

计数资料采用例数及百分比表示.服从正态分布的计量资料以均数±标准差(mean ± SD) 表示,不服从正态分布的计量资料以中位数±上下四分位数(median[Q1,Q3]) 表示,两组连续变量的比较用Wilcoxon检验,Kruskal-Wallis检验用于3组以上计量资料的差异比较.不同组别间的计数资料差异比较采用卡方检验,生存资料分析采用乘积极限法描述,不同组别间的生存率差异比较采用log-rank检验,p<0.05被认为具有统计学意义,所有数据用R语言(v4.1.2)及其相关R包进行分析.

2 研究概览与技术路线

为直观呈现本研究的数据与模型之间的构建逻辑,完整的技术路线流程如图1所示.该流程以TCGA-SKCM队列的转录组数据为起点,依次涵盖肿瘤微环境量化、TME分型、差异基因筛选、LASSO-Cox建模、内外部验证及临床转化评估等关键步骤.

本研究的测试集数据来源于癌症基因组图谱数据库,获取472例皮肤黑色素瘤患者的转录组测序数据(RNA-Seq FPKM格式)及对应临床信息.在数据预处理阶段,采用R语言(v4.1.2),使用dplyr包(v1.0.9)对Ensembl ID 重复的基因进行筛选,剔除重复基因.随后,通过genefilter包(v1.24.3)设置过滤阈值,剔除在≥50%样本(即237/472样本)中FPKM为0的基因,过滤后保留29 518个有效基因.为了保证后续分析的数据完整,基于TCGA样本条形码(Barcode)匹配表达矩阵与临床信息,筛选包含完整临床特征(性别、年龄、总生存期、病理分期、TNM分期等)的459例样本.为进一步筛选有效样本,采用无监督聚类设定阈值,剔除轮廓宽度小于0.25的24个离群样本(正常样本轮廓宽度大于0.5).最终纳入分析的样本量为435例,基因量为29 518个(表1).

3 结果与分析

3.1 黑色素瘤肿瘤免疫微环境景观分析

采用ESTIMATE算法评估了整个队列的肿瘤微环境特征,而后根据ESTIMATE Score的中位数值(ESTIMATE Score median 为 204.292 305 066 714),将患者群体划分为ESTIMATE_H(n = 218)和ESTIMATE_L(n = 217),进行了Kaplan-Meier生存曲线分析.如图S1(详情见附录)所示,虽然ESTIMATE_High组显示出略好的生存趋势,但两组间的生存差异未达到统计学显著性水平(p>0.05).这一结果与某些研究中“免疫浸润程度高预示更好预后”的常规认知似乎不完全一致.对这一看似矛盾的结果进行深入分析,认为可能原因包括:第一,ESTIMATE算法提供的是TME组成的整体评估,但不同类型的免疫细胞(如 cytotoxic T细胞与调节性T细胞)对预后的影响可能相反,单纯的“数量”指标可能不足以反映TME的“质量”;第二,样本分布不均衡可能影响统计效能;第三,某些情况下过度的炎症反应可能反而促进肿瘤进展,即所谓“免疫悖论”现象10.这一发现恰恰强调了单纯依靠总体免疫/基质评分进行预后判断的局限性,提示我们需要更精细的TME分型策略.

随后,通过CIBERSORT算法深入解析22种免疫细胞亚群的浸润情况.经过质控过滤后,重点分析在超过50%样本中可检测到的12种主要免疫细胞.如图S2(详情见附录)所示,ESTIMATE_High组与ESTIMATE_Low组在多种免疫细胞浸润上存在显著差异.具体而言,ESTIMATE_H呈现出显著增强的适应性免疫激活特征,而ESTIMATE_L组则表现出组织驻留免疫细胞特征.这种差异化的免疫浸润模式提示我们,ESTIMATE High评分可能代表一种免疫激活但可能受到调控的状态(包含较多的Tregs),而ESTIMATE Low评分可能代表一种不同的免疫监视模式.这为后续的亚型分析提供了理论基础.

3.2 TME亚型识别及其临床意义

基于上述计算,应用K-means聚类算法对435例患者的免疫细胞浸润图谱进行无监督聚类分析,并利用欧氏距离构建相似性度量模型,设定最大迭代次数为300次,完成皮肤黑色素瘤患者的分子分型分类.最佳聚类数的评估采用肘部法则进行模型评估.结果如图S3(详情见附录)显示,当K=3时,WSS下降速率显著趋缓,即3个亚型是最优聚类.因此,选择K=3作为最优值,将患者分为3个TME亚型:TME group1(n=96)、TME group2 (n=101)和TME group3 (n=238).而后使用主成分分析对免疫浸润特征进行降维可视化.结果如图S4所示(详情见附录),3个亚型呈现显著分离趋势,即免疫细胞浸润模式具有显著差异.与此同时,箱线图和热图展示了不同TME亚型的免疫细胞浸润的内在差异(图S5,详情见附录).TME group1呈现显著的免疫激活状态.TME group2表现为先天免疫优势表型.TME group3显示Th1/Th17极化特征.

使用ESTIMATE 算法对3个亚型进行多维评分分析,系统评估TME亚型与肿瘤微环境整体特征的相关性.如图S6所示(详情见附录),TME group2 的 ESTIMATE Score、免疫评分和基质评分均显著低于其他两组.TME group1和TME group3在各类评分中无显著差异,但TME group3有更高的基质评分,所以ESTIMATE Score也表现出更高水平.

基于肿瘤微环境评分的预后关联性分析,结果表明,不同TME亚型分类与患者预后可能存在显著异质性.结果如图2所示,3个亚型的中位OS存在显著差异:TME group3预后最差,其次为TME group1,而TME group2生存最优.这一发现具有重要临床意义:虽然TME group3具有较高的ESTIMATE评分,但其预后反而最差,说明单纯的“免疫浸润程度”指标可能产生误导,而基于细胞组成的精细分型能提供更准确的预后信息.

3.3 TME核心基因的筛选与功能特征

为深入解析不同TME亚型的分子基础,通过三组两两比较(group1 vs 2, group1 vs 3, group2 vs 3)进行差异表达分析,分别鉴定出5 151、4 632和1 743个差异表达基因.使用韦恩图分析取三组比较的交集,获得199个核心TME相关基因,其中86个共同上调,113个共同下调(图3).

基于这199个核心基因的表达谱,再次进行聚类分析,并将患者分为3个基因亚型(Gene group1~3).生存分析显示,Gene group3预后最差,与TME亚型分析结果一致,证明了分子分型的稳健性(图S7,详情见附录).

基于前期筛选获得的199个肿瘤微环境相关差异表达基因,进一步挖掘导致基因亚型出现不同预后的潜在原因和作用机理.通过DAVID(6.8版)选择GO-BP-DIRECT、GO-CC-DIRECT、GO-MF-DIRECT和KEGG PATHWAY分别对GO和KEGG进行功能注释,描述不同基因亚型的通路富集情况.GO和KEGG富集分析结果如图S8(详情见附录)所示,上调基因主要富集于mRNA剪接、核糖体生物发生、氧化磷酸化等通路,提示代谢重编程和蛋白质合成活跃.下调基因则富集于内质网蛋白质加工、内吞作用、溶酶体、铁死亡等通路,表明细胞内稳态和代谢调节异常.Metascape的互作网络分析进一步显示,上调基因模块与RNA代谢、能量代谢密切相关,而下调基因模块主要参与蛋白质加工运输、细胞稳态维持等过程(图S9,详情见附录).这些发现为理解TME不同亚型的生物学行为提供分子机制层面的解释.

使用CIBERSORT算法进行免疫细胞浸润分析显示,不同基因亚型黑色素瘤患者的肿瘤微环境存在显著异质性(图S10,详情见附录).Gene group3表现出显著升高的调节性T细胞浸润水平,而Gene group1和Gene group2则富集了更高比例的CD4+驻留记忆T细胞和CD4+效应记忆T细胞.结合前期生存分析中Gene group3 患者总生存期显著缩短,这一结果可能提示Treg的过度浸润通过抑制抗肿瘤免疫应答(如抑制CD8+ T cell功能)促进免疫耐受微环境,加速疾病进展;而Gene group1和2中CD4+记忆T细胞的优势浸润可能与更强的免疫监视能力和长期生存获益相关.同时,Treg与CD4+记忆T细胞的失衡进一步支持了免疫抑制表型对预后的负面影响.

3.4 黑色素瘤预后模型(MMPS)的构建与验证

采用单因素Cox回归从199个基因中筛选出60个预后相关基因,再经LASSO回归和多因素Cox回归最终确定5个核心基因构成MMPS模型,5个核心基因分别为NMDA受体突触导航因子[neuronal migration factor, NSMF,风险比(hazard ratio, HR)RH = 1.000,p=0.097]会通过激活 MAPK/ERK 信号通路促进肿瘤细胞增殖和侵袭,特别是在神经胶质瘤和黑色素瘤中,其过表达可能增强肿瘤细胞的迁移能力11;长链脂酰辅酶A合成酶4(long-chain acyl-CoA synthetase-4, ACSL4,RH=0.980,p=0.079)通过催化多不饱和脂肪酸(polyunsaturated fatty acid, PUFA)的酯化,促进脂质过氧化和铁死亡(ferroptosis),从而抑制肿瘤生长12;神经突触素(neuroplastin, NPTN,RH=0.980,p = 0.054)通过调控细胞与细胞之间黏附和突触可塑性,抑制上皮-间质转化(epithelial-mesenchymal transition, EMT)13,从而减少肿瘤转移;WD重复及SOCS盒蛋白2(WSB2,RH =1.000,p<0.001)通过参与E3泛素连接酶复合体(如SCF复合体),促进抑癌蛋白(如p53、PTEN)的泛素化降解14,从而驱动肿瘤进展;亮氨酸氨基肽酶3(LAP3,RH = 0.990,p<0.001)通过降解亮氨酸调控mTORC1信号通路活性15,影响肿瘤细胞代谢和T细胞功能.

整合多因素Cox比例风险模型中筛选的5个核心基因权重参数,建立黑色素瘤微环境预后评分(melanoma microenvironment prognostic score, MMPS):

Srisk=(0.00999×SNSMF)+(-0.02344×SACSL4)+(-0.01649×SNPTN)+(0.030093×SWSB2)+(-0.01368×SLAP3).

根据MMPS风险评分的中位值(median=1.05)将453例黑色素瘤患者分为高危组(n=218)和低危组(n=217).主成分分析显示两组在基因表达空间明显分离,两组患者在全局基因表达谱上呈现显著分离趋势,证实MMPS能有效区分不同分子特征的患者群体(图S11,详情见附录).为系统评估MMPS评分的预测效能,在TCGA-SKCM队列435例患者中展开多层次的效能分析.生存分析揭示MMPS评分与患者OS呈现显著负向关联,评分递增伴随OS缩短及生存事件累积比例升高(图S12,详情见附录).

基于前期筛选出的5个核心驱动基因(ACSL4、NPTN、LAP3、NSMF、WSB2)绘制风险亚组分层热图,如图S13(详情见附录)所示,在low-Risk亚组(n=217,按MMPS中位数划分)中,促凋亡基因NSMF和WSB2表达显著下调,而代谢重编程相关基因ACSL4、NPTN 及LAP3呈现上调趋势.而后经生存分析显示低危组预后显著优于高危组.时间依赖性受试者工作特征分析(receiver operating characteristic analysis,ROC)如图S14(详情见附录)所示,MMPS在预测5年生存率的AUC为 0.723(95%CI: 0.664~0.782),这一结果显著优于传统的预后指标——年龄(5年AUC为 0.648)、TNM分期(5年AUC为0.653)和T分期(5年AUC为0.684)(图4).同时,使用多因素Cox回归分析来评估MMPS的独立性,发现在校正年龄、性别、TNM分期、T分期和溃疡状态后,MMPS评分仍然是显著的独立预后因素(RH =1.70, 95%CI为1.50~2.00, p<0.001)(图S15,详情见附录).这表明MMPS提供的预后信息超越了传统临床病理参数,具有独特的预测价值.

根据年龄(≤55岁vs. >55岁)、病理分期(I~IIB vs. IIC~IV)及肿瘤分期(T0~T2b vs. T3~T4b)将队列分为两组,评价不同组别的MMPS评分水平.T3~T4b期患者MMPS评分分布显著高于T0~T2b期(p<0.01),提示肿瘤晚期患者的死亡风险更高;>55岁患者评分分布高于≤55岁亚组(p<0.05),提示晚期及老年患者的肿瘤微环境更具侵袭性(图S16,详情见附录).在全部临床亚组中, MMPS-low患者的中位OS均显著优于MMPS-high 组,这表明模型在不同临床背景下均具有稳定预测能力(图S17,详情见附录).

为评估MMPS模型的泛化能力,下载GEO数据库中GSE162682数据集,基于Illumina 平台进行分析.收集107名黑色素瘤患者的转录组数据和临床数据,数据处理方式与测试集一致,最终将101名具有完整的临床数据的患者纳入本次研究的验证集,其完整临床特征如表S1所示,以便于进一步验证MMPS评分的预测效能.验证集患者的特征与训练集基本一致,确保了验证的有效性.MMPS评分与患者总生存期呈负相关.基于MMPS模型的核心基因,热图显示在low-Risk亚组(n = 50,按MMPS中位数划分)中,NSMFWSB2表达下调,ACSL4、 NPTNLAP3的表达上调,且Kaplan-Meier曲线也显示low-Risk亚组的患者有更长的总生存期(图5).ROC分析显示在验证集中,MMPS评分在预测3年、5年、10年OS的AUC分别是0.573、0.643和0.677.这种在独立队列中保持的预测效能,有力地证明了MMPS模型的稳健性和可推广性,为其在临床实践中的应用提供了支持.

3.5 列线图构建与临床实用性评估

虽然MMPS评分本身具有良好的预后预测能力,但临床决策通常需要综合考虑多个预后因素.为了将MMPS整合到临床实践中,整合MMPS评分、年龄、性别、TNM分期、T分期及ESTIMATE评分,构建列线图(图6).校准曲线显示预测生存期与实际观察值高度一致.决策曲线分析所示,在10%~78%的阈值概率范围内,列线图比“全部治疗”或“全部不治疗”策略具有更高的净获益,这意味着在这一范围内,使用列线图指导临床决策能够为患者带来最大的临床利益(图S18,详情见附录).值得注意的是,在阈值概率30%~60%这一临床最关注的范围内,列线图的优势最为明显.与仅使用MMPS评分相比,列线图在大部分阈值概率范围内显示出更高的净获益,这一发现支持在临床实践中将MMPS评分与传统临床参数结合使用,而不是替代它们.

3.6 MMPS的肿瘤微环境特征解析

为深入理解MMPS评分的生物学基础,系统分析了其与肿瘤微环境各个组分的关系.低危组的Stromal Score、Immune Score和ESTIMATE Score均显著高于高危组(p<0.001)(图S19,详情见附录).这种差异反映出两种截然不同的免疫微环境状态,可能对免疫治疗的反应产生重要影响.这一发现表明,MMPS低危特征与富含基质和免疫细胞的TME相关,而高危特征则与“免疫沙漠”表型相关.免疫检查点分子的表达水平是预测免疫治疗反应的重要指标16.

分析5个关键免疫检查点在MMPS不同风险组中的表达情况,所有检查点的表达在低危组中均显著高于高危组:LAG3(p = 1.3×10-12)、PDCD1(p=2.6×10-11)、CTLA4(p=1.7×10-14)、IDO1(p=1.2×10-15)及CD274(p≤2×10-16)(图S20,详情见附录).

通过CIBERSORT反卷积分析,进一步探究MMPS评分与22种免疫细胞亚型浸润水平的相关性.热图显示,Low-Risk亚组与多种抗肿瘤免疫细胞的浸润相关,包括CD8⁺ 激活T细胞、CD8⁺效应记忆T细胞、巨噬细胞、自然杀伤T细胞、 滤泡辅助T细胞、CD4⁺激活T细胞及CD4⁺效应记忆T细胞等,其浸润丰度显著高于high-Risk亚组(图S21,详情见附录).

为量化这些关联,计算MMPS评分与各免疫细胞类型的Spearman相关系数,并通过棒棒糖图进行可视化(图S22,详情见附录).MMPS评分与淋巴细胞(效应记忆T细胞,辅助T细胞,B细胞, 自然杀伤T细胞)及髓系细胞(树突状细胞, 单核巨噬细胞,粒细胞)的浸润呈显著负相关(Spearman ρ<-0.1,p>0.05).值得注意的是,MMPS评分与CD56弱阳性自然杀伤细胞呈正相关,可能与high-Risk亚组的炎症性微环境促进其募集有关.

通过GSVA分析,评估MMPS评分与16条关键免疫通路的活性关系(图S23~S24,详情见附录).热图显示low-Risk亚组中CTLA4、I型干扰素、干扰素α、I型干扰素-JAK-STAT、IL-35、干扰素γ信号调控及他莫昔芬响应通路的活性显著增强.棒棒糖图进一步证实,MMPS评分与上述通路及B淋巴细胞分化通路、T细胞凋亡通路、II型干扰素-JAK-STAT通路等呈负相关(Spearman ρ<-0.3,p<1×10-5).通过以上结果分析,推测low-Risk亚组的TME可能呈现“热肿瘤”特征,表现为高免疫细胞浸润、激活的干扰素信号及免疫检查点分子表达,对PD-1/CTLA-4抑制剂等免疫治疗更为敏感.

3.7 MMPS与TMB的联合分析

肿瘤突变负荷(tumor mutational burden,TMB)定义为每百万碱基中非同义体细胞突变的总数,是预测免疫检查点抑制剂反应的关键生物标志物.利用来自TCGA-SKCM队列(n=435)的全外显子组测序数据,计算TMB评分并分析其与MMPS的关系.通过瀑布图所示的突变景观,揭示了非同义突变占主导地位,包括错义突变、无义突变和剪接位点变异,并且影响BRAFCDKN2A等基因的“多重打击”事件频繁发生(图S25,详情见附录).

根据MMPS评分中位数将患者分为MMPS-low(n=218) 和MMPS-high (n=217) 亚组后发现MMPS-low组的TMB显著高于MMPS-high组(图S26,详情见附录).这与免疫编辑假说一致,即高TMB产生更多新抗原,会增强T细胞的识别和对PD-1/PD-L1抑制剂的反应17.Kaplan-Meier生存分析显示高TMB患者的总生存期显著优于低TMB患者(图S27,详情见附录).

为评估MMPS和TMB联合的预后价值,构建4层分层模型:A组(MMPS-low/TMB-high)、B组(MMPS-low/TMB-low)、C组(MMPS-high/TMB-high)和D组(MMPS-high/TMB-low).生存曲线如图7所示,A组(MMPS-low/TMB-high)预后最好,其次是B组(MMPS-low/TMB-low).相比之下,D组(MMPS-high/TMB-low)的生存结果最差,而C组(MMPS-high/TMB-high)显示出中等生存期,更接近D组而非MMPS-low组.这些结果表明,MMPS比单独的TMB具有更强的预测权重.

4 讨论

本研究通过整合多组学数据与机器学习算法,系统描绘了黑色素瘤肿瘤微环境的异质性景观,并成功构建基于5个核心基因的预后预测模型MMPS.

4.1 TME异质性:从量化描述到功能分型

传统的TME评估多依赖于单一的免疫细胞浸润程度指标,本研究揭示该方法的局限性.ESTIMATE评分与预后的非显著性关联提示,单纯的“数量”指标可能无法准确反映TME的功能状态.这一发现与近年来的研究趋势相符,即TME的“质”比“量”更为重要18.

通过无监督聚类识别出的3个TME亚型具有截然不同的生物学特征和临床预后.其中,TME group3虽然具有较高的免疫浸润评分,但其预后最差,这一看似矛盾的现象实际上反映了免疫编辑过程中形成的免疫抑制微环境.该亚型中Tregs的显著富集,以及效应T细胞相对不足的格局,可能导致了“免疫豁免”表型的形成.这种特定的免疫细胞组成模式或可解释为何部分患者尽管具有丰富的免疫细胞浸润,却无法从免疫治疗中获益.

值得注意的是,TME group2展现出以组织驻留免疫细胞和先天免疫细胞为主的特征,且预后最佳.这可能暗示一种有效的免疫监视状态,其中组织驻留记忆T细胞和NK细胞在控制肿瘤进展中发挥了关键作用.这一发现与最近的研究相呼应,组织驻留免疫细胞被认为在防止肿瘤复发和转移中具有特殊价值19.

4.2 MMPS与现有生物标志物的比较优势

与目前临床应用的生物标志物相比,MMPS展现出独特的优势.其一,相较于PD-L1表达的高度异质性和动态变化,MMPS基于稳定的基因表达特征,具有更好的可重复性.其二,与TMB主要反映肿瘤抗原性不同,MMPS更直接地刻画TME的功能状态,两者具有互补价值.

经联合分析显示,MMPS能够进一步细化TMB分层的预后判断,特别是在高TMB患者中,MMPS可以区分出真正能够从免疫治疗中获益的群体.通过提供分子水平的预后信息,MMPS能够更精确地识别出传统分期系统中被低估的高危患者.这对于个体化治疗决策的制定具有重要意义.

4.3 MMPS与代表性黑色素瘤免疫相关预后模型的比较优势

为进一步明确MMPS模型在黑色素瘤预后预测中的相对优势,本文梳理了近年来报道的具有代表性的TME或免疫相关预后模型,并从算法设计、特征筛选策略、预测性能、独立验证情况以及是否整合临床参数等多个维度进行了系统对比.结果如表2所示,相较于现有模型,MMPS在保持模型简洁性的同时,具备更高的预测准确性(5年AUC达0.723),且在独立队列中表现出良好的泛化能力.此外,MMPS通过整合肿瘤微环境核心基因表达与临床病理特征,增强了模型的临床适用性与解释性,显示出在精准预后评估中的潜在应用价值.

4.4 MMPS模型的临床转化潜力

列线图的构建使MMPS评分能够与常规临床参数无缝整合,大大增强了其实用性.决策曲线分析显示,在广泛的阈值概率范围内,基于列线图的决策策略能够为患者带来净获益.在临床实践中,医生可以根据患者的个体特征来量化评估其预后风险,从而制定更加个体化的治疗和随访方案.

特别值得注意的是,MMPS低危组显示出更高的免疫检查点分子表达和更活跃的免疫通路,这一特征提示该组患者可能对免疫检查点抑制剂治疗更为敏感.这一假设如能在前瞻性研究中得到验证,MMPS将有望成为指导免疫治疗的重要生物标志物.对于MMPS高危患者,其TME特征提示可能存在固有的免疫抵抗机制.

综上所述,MMPS模型不仅是一个强有力的预后预测工具,更是理解黑色素瘤TEM复杂性的重要窗口.它将复杂的TME特征转化为简洁的量化指标,为黑色素瘤的精准医疗提供了新的可能.随着免疫治疗时代的深入发展,像MMPS这样能够反映TME功能状态的生物标志物将发挥越来越重要的作用.期待在未来通过持续的研究优化,使MMPS能够真正应用于临床实践.帮助医生为每位黑色素瘤患者制定最合适的个体化治疗方案,最终改善患者的生存预后.同时.MMPS所代表的基于TME功能分型的研究思路也为其他肿瘤类型的生物标志物开发提供了有益借鉴.

参考文献

[1]

DAVEY M GMILLER NMCINERNEY N M. A review of epidemiology and cancer biology of malignant melanoma[J/OL]. Cureus202113(5)[2025-11-19].

[2]

COLES C HMULVANEY R MMALLA Set al. TCRs with distinct specificity profiles use different binding modes to engage an identical peptide-HLA complex[J]. Journal of Immunology2020204(7): 1943-1953.

[3]

KNUROWSKI TSEARLE ECLEGG Ket al. Abstract CT136: an open-label phase I/IIa study to evaluate the safety and efficacy of CCS1477 as monotherapy and in combination in patients with advanced hematological malignancies[J/OL]. Cancer Research202383() [2025-11-19].

[4]

GIRALDO N ABECHT EVANO Yet al. Tumor-infiltrating and peripheral blood T-cell immunophenotypes predict early relapse in localized clear cell renal cell carcinoma[J]. Clinical Cancer Research201723(15): 4416-4428.

[5]

MILLS K H G. Innate lymphoid cells recruit T cells to turn up the heat on tumors[J]. Cancer Cell202240(4): 362-364.

[6]

LIU Y TSUN Z J. Turning cold tumors into hot tumors by improving T-cell infiltration[J]. Theranostics202111(11): 5365-5386.

[7]

YOSHIHARA KSHAHMORADGOLI MMARTÍNEZ Eet al. Inferring tumour purity and stromal and immune cell admixture from expression data[J/OL]. Nature Communications20134[2025-11-19].

[8]

NEWMAN A MLIU C LGREEN M Ret al. Robust enumeration of cell subsets from tissue expression profiles[J]. Nature Methods201512(5): 453-457.

[9]

LILJA HULMERT DVICKERS A J. Prostate-specific antigen and prostate cancer: prediction, detection and monitoring[J]. Nature Reviews Cancer20088(4): 268-278.

[10]

COUSSENS L MWERB Z. Inflammation and cancer[J]. Nature2002420(6917): 860-867.

[11]

AKBAY E AKOYAMA SCARRETERO Jet al. Activation of the PD-1 pathway contributes to immune escape in EGFR-driven lung tumors[J]. Cancer Discovery20133(12): 1355-1363.

[12]

WANG W MGREEN MCHOI J Eet al. CD8+ T cells regulate tumour ferroptosis during cancer immunotherapy[J]. Nature2019569(7755): 270-274.

[13]

BAJKOWSKA KSUMARDIKA I WTOMONOBU Net al. Neuroplastin β-mediated upregulation of solute carrier family 22 member 18 antisense (SLC 22A18AS) plays a crucial role in the epithelial-mesenchymal transition, leading to lung cancer cells’ enhanced motility[J/OL]. Biochemistry and Biophysics Reports, 202022[2025-11-19].

[14]

LI XZHANG C CLIN X Tet al. Elevated expression of WSB2 degrades p53 and activates the IGFBP3-AKT-mTOR-dependent pathway to drive hepatocellular carcinoma[J]. Experimental & Molecular Medicine202456(1): 177-191.

[15]

CHANG C HQIU JO’SULLIVAN Det al. Metabolic competition in the tumor microenvironment is a driver of cancer progression[J]. Cell2015162(6): 1229-1241.

[16]

HOLDER A MDEDEILIA ASIERRA-DAVIDSON Ket al. Defining clinically useful biomarkers of immune checkpoint inhibitors in solid tumours[J]. Nature Reviews Cancer202424(7): 498-512.

[17]

CRISTESCU RAURORA-GARG DALBRIGHT Aet al. Tumor mutational burden predicts the efficacy of pembrolizumab monotherapy: a pan-tumor retrospective analysis of participants with advanced solid tumors[J/OL]. Journal for Immunotherapy of Cancer202210(1)[2025-11-19].

[18]

BINNEWIES MROBERTS E WKERSTEN Ket al. Understanding the tumor immune microenvironment (TIME) for effective therapy[J]. Nature Medicine201824(5): 541-550.

[19]

DJENIDI FADAM JGOUBAR Aet al. CD8+CD103+ tumor-infiltrating lymphocytes are tumor-specific tissue-resident memory T cells and a prognostic factor for survival in lung cancer patients[J]. Journal of Immunology2015194(7): 3475-3486.

[20]

JIANG PGU S QPAN Det al. Signatures of T cell dysfunction and exclusion predict cancer immunotherapy response[J]. Nature Medicine201824(10): 1550-1558.

[21]

CHAROENTONG PFINOTELLO FANGELOVA Met al. Pan-cancer immunogenomic analyses reveal genotype-immunophenotype relationships and predictors of response to checkpoint blockade[J]. Cell Reports201718(1): 248-262.

[22]

ZENG Z HLI J LZHANG J Get al. Immune and stromal scoring system associated with tumor microenvironment and prognosis: a gene-based multi-cancer analysis[J/OL]. Journal of Translational Medicine202119(1)[2025-11-19].

基金资助

湖南省卫生健康委员会卫生科研课题(202204083643)

湖南省自然科学基金项目(2023JJ60063)

湖南中医药大学校级科研项目(2022XYLH151)

AI Summary AI Mindmap
PDF (3150KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/