前列腺癌(prostate cancer,PCa)是男性常见恶性肿瘤,近年来发病率和死亡率均呈上升趋势。2015年至2022年,PCa的发病率从10.2例/10万人上升至18.6例/10万人,死亡率从4.36例/10万人上升至6.59例/10万人
[1-3]。高危局限性前列腺癌(high-risk localized prostate cancer,HRLPC)通常在局部治疗后进展为转移性疾病
[4]。关于高危前列腺癌的治疗,目前尚无统一标准,目前主流的治疗是以手术为基础,新辅助内分泌治疗(neoadjuvant hormonal therapy,NHT)为辅助
[5]。根治性前列腺切除术(radical prostatectomy,RP)前的NHT最近被认为可以改善 HRLPC 的早期肿瘤学结局
[6-7]。NHT虽可降低HRLPC的手术难度,但并非所有接受NHT的患者都能从中获益
[8-9]。因此,目前需解决如何预测NHT效果的问题
[10]。
最大雄激素阻断(maximum androgen blocking,MAB)治疗包括了去势治疗和抗雄治疗。1项研究表明,前列腺特异性抗原(prostate-specific antigen,PSA)最低值而非诊断时的PSA值可作为治疗反应的标志物
[11]。本研究从中得到启发,探索MAB治疗后PSA相关参数与治疗反应的相关性。前列腺特异性抗原密度(prostate-specific antigen density,PSAD)是PCa风险预测的重要指标,其诊断价值高于单独PSA
[12-13]。然而,NHT后PSAD分组与治疗反应的相关性研究尚无报道。本研究拟探索MAB治疗3个月后PSAD分组与治疗反应的关系,并通过机器学习构建预测模型,预测HRLPC患者MAB治疗3个月后的PSAD组别及可能的病理或生化获益。
1 资料与方法
1.1 临床资料
本研究对2021年1月1日至2024年6月30日在重庆医科大学附属第一医院泌尿外科经穿刺活检病理诊断并接受RP的HRLPC患者进行了回顾性队列分析,随访时间均为术后6个月。研究收集了这些患者的基线人口学特征、实验室数据、影像学表现、围手术期临床资料及随访资料等。基于MAB治疗3个月后的PSAD,采用中位数的方法将患者分为低PSAD组和高PSAD组。
1.2 病例纳入与排除标准
纳入标准:①年龄<85岁;②东部合作肿瘤组评分(Eastern Cooperative Oncology Group,ECOG)≤1;③RP术前接受了3个月的MAB治疗(亮丙瑞林/戈舍瑞林+比卡鲁胺);④HRLPC;⑤诊疗方案由统一医疗组制定与实施;⑥临床资料及随访信息完整。其中,HRLPC的诊断标准为:i.PSA≥20 ng/mL;和(或)ii.Gleason评分≥8;和(或)iii.基线时的前列腺MRI检查提示临床分期T
3~T
4;和/或iv.淋巴结有转移
[4]。
排除标准:①既往接受放疗或化疗的患者;②存在严重基础疾病,无法耐受手术,或该疾病会对手术及预后产生明显影响;③术前确诊合并其他恶性肿瘤的患者;④具有影响RP的手术史,如盆腔或膀胱颈手术;⑤术后因病情需继续治疗者(如:激素治疗、放射治疗等);⑥患者资料不完整或随访数据缺失。
1.3 治疗方法与定义
所有的患者在RP术前均完成了3个月的MAB治疗方案。具体为:促黄体激素释放激素类似物戈舍瑞林3.6 mg或亮丙瑞林3.75 mg,皮下注射,每28天1次;联合雄激素受体拮抗剂比卡鲁胺50 mg,口服,每天1次。研究表明,戈舍瑞林和亮丙瑞林对患者的PSA和睾酮的下降在3个月内并没有明显差异,且不会影响肿瘤学结局
[14-15]。RP均在标准全身麻醉下经腹进行,包括机器人辅助腹腔镜下前列腺癌根治术和腹腔镜下前列腺癌根治术。病理降级定义为:①RP术后病理的国际泌尿病理学会(International Society of Urological Pathology,ISUP)分组较前列腺穿刺术低;或②ISUP分组相同,但Gleason评分降低;或③ISUP分组相同,Gleason评分相同,但主要分级区域评分降低
[16]。RP术后检测不到的PSA水平定义为RP术后6周时复查PSA<0.2 ng/mL。PSAD [ng/(mL∙cm
3)]=PSA(ng/mL)/前列腺体积(cm
3),前列腺体积=0.52×上下径(cm)×左右径(cm)×前后径(cm),三径线长度由前列腺MRI评估。
1.4 研究结局
本研究的结局分为2个部分:MAB治疗效果在不同PSAD组别中的差异和预测模型的构建。首先,前者包括:①比较2组患者在前列腺癌根治术的术中情况(手术方式、手术时间、术中出血量)、术后结果(住院时间、拔管时间)和肿瘤学结果(切缘情况、病理降级)上的差异;②比较2组在随访结果(RP术后检测不到的PSA率、RP术后6周/3个月/6个月的尿失禁情况、RP术后6周/3个月/6个月的血清PSA情况)上的差异。接下来,本研究将采用机器学习方法,利用MAB治疗前的各种参数构建模型,以预测患者通过MAB治疗后可能达到的PSAD组别,从而潜在选择适合MAB治疗的PCa患者。
1.5 统计学方法
使用SPSS 26.0和R 4.2.1进行数据分析。数据描述中,对于定量资料,正态分布以均数±标准差(x±s)表示,组间差异比较使用t检验;偏态分布以中位数(四分位间距)即[M d(P 25,P 75)]表示,组间差异比较使用Mann-Whitney U检验;分类变量表示为例数(百分比),组间差异比较使用卡方检验(Chi-square检验)和Fisher’s 确切概率法进行检验。检验水准α=0.05。
在预测模型的构建部分,本研究首先使用了10种机器学习方法,具体包括逻辑回归(logistic regression,LR)、K最近邻(K-nearest neighbors,KNN)、支持向量机(support vector machine,SVM)、高斯朴素贝叶斯(Gaussian Naïve Bayes,GNB)、AdaBoost(Adaptive boosting)、LightGBM、极端梯度提升(eXtreme gradient boosting,XGBoost)、决策树(decision tree,DT)、梯度提升(gradient boosting,GB)、随机森林(random forest,RF)。通过构建受试者工作特征曲线(receiver operating characteristic curve,ROC)并比较曲线下面积(area under the curve,AUC)来选出最优模型,并基于该最优模型的SHAP(SHapley additive exPlanations)值筛选重要特征用于最终预测模型的构建。
AUC用于评估预测模型的可靠性。通过自举重采样1 000次并绘制校准曲线,以检查实际概率与预测概率之间的一致性。随后,使用决策曲线分析评估该预测模型的临床适用性。
2 结果
自2021年1月1日至2024年6月30日期间收集了96例HRLPC患者。
表1展示了MAB治疗前患者的基线人口统计学及肿瘤学特征。与常用的PSAD分层阈值0.15 ng/(mL·cm
3)不同
[17],本研究基于MAB治疗3个月后的PSAD中位数,将患者区分为低PSAD组[PSAD<0.17 ng/(mL∙cm
3)]和高PSAD组[PSAD≥0.17 ng/(mL∙cm
3)],以使得2组中的样本量均分。
2.1 RP的围手术期结果在高低PSAD2组中的差异
表2展示了围手术期结果在2组中的差异。手术方式在2组中差异无统计学意义(
P=0.539)。低PSAD组相较于高PSAD组,观察到拔管时间[(3.12±0.49) d vs. (3.41±0.43) d]有明显缩短(
P=0.002),病理降级[15(31.25) vs. 6 (12.50)]方面也表现出显著优势(
P=0.026)。此外,低PSAD组的手术时间、术中出血量、住院时间和切缘阳性率相较于高PSAD组,差异无统计学意义(手术时间:
P=0.069;术中出血量:
P=0.384;住院时间:
P=0.228;切缘阳性率:
P=0.336)。
2.2 随访结果在高低PSAD 2组中的差异
对于尿失禁的随访情况低PSAD组在术后6周(
P=0.008)和术后3个月(
P=0.041)的恢复情况显著优于高PSAD组,而在术后6个月未见明显差异(
P=0.504)。对于血清PSA的随访情况,发现低PSAD组在术后6周(
P=0.011)、术后3个月(
P=0.027)、术后6个月(
P=0.049)的血清PSA都明显低于高PSAD组。RP术后检测不到的PSA率在低PSAD组也表现出明显优势[31(64.58) vs. 21(43.75),
P=0.041]。见
表3。
2.3 预测模型的构建与评估
基于MAB治疗前的各种参数,通过10种机器学习方法,发现LR模型实现了最高的AUC值(AUC=0.742,
图1)。因此,LR模型被用于进一步筛选变量,
图2展示了基于LR模型的前10个重要特征,本研究将系数值的阈值定为±0.2。最终,前7个重要的基线特征被进一步用于最终预测模型的构建,其分别为前列腺体积、低密度脂蛋白胆固醇(low-density lipoprotein cholesterol,LDL-C)、PSAD、吸烟史、总胆固醇(total cholesterol,TC)、PSA、体质指数(body mass index,BMI)。
图3展示了使用上述7个基线特征所构建的预测列线图。此预测列线图的AUC值为0.769(
图4A)。校正曲线的结果表明模型预测患者经过3个月MAB治疗后进入高PSAD组的概率与实际概率具有良好的一致性(
图4B)。决策曲线分析的结果表明构建的列线图预测模型在风险阈值为0.08至0.63时表示出净收益(
图5)。
3 讨论
在这项回顾性队列研究中,本课题组探讨了经过MAB治疗后的PSAD分层在PCa疗效预测中的作用。研究结果表明低PSAD组与HRLPC患者的病理和生化获益密切相关。基于此,本研究进一步借助多种机器学习模型并通过AUC鉴定出逻辑回归模型是最优模型并将其用于后续研究。最后,基线特征中的前列腺体积、LDL-C、PSAD、吸烟史、TC、PSA、BMI这7个参数被认为是最重要的变量。基于上述参数,本研究构建了1个列线图用于预测患者通过MAB治疗后可能达到的PSAD组别,达到潜在选择适合行MAB治疗的患者。该预测模型的效能较好并具有一定的临床适用性。
本研究确定了前列腺体积、LDL-C、PSAD、吸烟史、TC、PSA、BMI是最关键的7个变量用于预测适合行MAB治疗的HRLPC患者。Verit A等
[18]发现,前列腺体积的线性减小与不良病理结果和较差的预后相关。低睾酮水平或环境可能与侵袭性PCa表型相关
[18-19]。此外,在前列腺体积小的患者中,PCa细胞可能很容易通过迁移较短的距离进入包膜外空间,引起肿瘤侵袭和转移,进而影响新辅助治疗疗效。PSA是PCa诊断和监测的重要生物标志物,PSA水平的变化常常被用作评估新辅助治疗疗效的重要标准,但其受到炎症、前列腺体积的影响。PSAD能提供更为精准的肿瘤负担评估。高PSAD密度通常与前列腺癌较高的侵袭性和更差的预后相关。因此,本模型结合了前列腺体积、PSA和PSAD,可以为患者提供更加准确的预测。
LDL-C是心血管疾病的重要风险因素。作为胆固醇的主要载体,LDL-C可能影响细胞膜的结构和功能,促进癌细胞的增殖和迁移
[20]。过度积累的胆固醇在PCa细胞的细胞膜中形成大的脂质筏,这可能促进致癌作用中的细胞信号转导,进而影响患者的治疗反应
[21]。脂肪组织不仅储存能量,还作为内分泌器官分泌多种激素,影响身体的生理功能和病理过程。肥胖男性体内雌二醇水平升高,抑制下丘脑-垂体轴,导致游离睾酮水平降低
[22]。研究表明,低睾酮水平与更高病理分级和晚期肿瘤相关
[23]。此外,肥胖还与高胰岛素水平和胰岛素抵抗相关
[21],这可能会导致患者的对新辅助治疗的反应较差。吸烟不仅可能促进肿瘤的发生,还可能通过改变体内的生物化学环境,影响新辅助治疗的疗效。Shiota M等
[24]的1项研究表明,吸烟会增加雄激素受体活性并促进对抗雄激素治疗的耐药性。
综上所述,本研究通过机器学习的方法构建了1个用于评估HRLPC患者是否适合行RP术前新辅助治疗的预测模型。然而,本研究也存在一些局限性。本研究为单中心的回顾性队列分析,受限于样本量以及可能存在偏倚,未来需要进一步在更大的队列研究中去探索。此外,本研究为初步探索PSAD分层(基于中位数)与预后的关联,需要更进一步地研究去确定PSAD的分层阈值。最后,由于随访时间较短(6个月),总体生存率(overall survival,OS)和生化无复发生存期(biochemical recurrence-free survival,bRFS)等远期预后无法评估,这也需要在今后的研究中进一步阐明。
4 结语
本研究中,低PSAD组患者具有更好的病理和生化获益。前列腺体积、LDL-C、PSAD、吸烟史、TC、PSA、BMI是最关键的7个变量被用于模型的构建来预测适合行新辅助治疗的HRLPC患者。结果表明该预测模型的效能较好并具有一定的临床适用性。