肾细胞癌(renal cell carcinoma,RCC)是起源于肾实质泌尿上皮系统的恶性肿瘤,占所有新发癌症的2%~3%,其主要发病群体为男性。尽管近年来在诊断和管理方面取得了一定进展,RCC仍然是最致命的泌尿系统恶性肿瘤之一
[1]。根治性肾切除术曾是早期肾癌治疗的首选方案,其在肿瘤切除方面疗效良好,但手术创伤巨大,术后并发症发生风险明显升高
[2]。值得注意的是,根治性肾切除术会导致患者只保留1个功能性肾脏,即所谓的“独肾”状态。独肾状态下,患者可能面临肾功能不足、新的肾损伤以及长期发展为慢性肾脏疾病的风险
[3-4]。自1993年腹腔镜下肾部分切除术(laparoscopic partial nephrectomy,LPN)被报道后,其作为1种更为保肾的选择,凭借创伤小、恢复快的优点成为治疗局限性肾肿瘤的首选
[5]。随着微创技术迭代,机器人辅助肾部分切除术(robot-assisted partial nephrectomy,RAPN)凭借其三维视野精准操作、术中出血量优化及术后恢复快等明显优势,逐渐超越传统LPN成为国内临床实践的核心选择
[6]。
尽管RAPN可最大限度保留患者肾单位,减轻其机体创伤并降低术后并发症发生风险,但临床实践显示,若术后管理未能有效控制关键风险因素,部分患者仍会出现进行性肾功能减退、尿瘘或肿瘤局部复发等问题,最终通过二次肾切除术走向独肾结局
[7]。因此,整合术前多维数据、术中缺血损伤生物标志物及术后动态监测指标,建立基于机器学习算法的多维度肾功能预测模型,对于实现精准化肾脏保护管理、延缓肾功能恶化进程具有潜在的临床价值。
近年来,随着数据分析技术的高速发展,机器学习在医疗领域的应用日益受到关注。与传统的统计学方法相比,机器学习能通过挖掘海量的数据进行拟合,从而提高处理效率、发现数据规律,进而提升分析多维数据的能力
[8]。本研究通过整合行RAPN的RCC患者的临床和手术相关变量,探索多种机器学习模型在预测术后肾功能损害方面的能力及其实际应用价值。通过构建1个潜在的预测模型,希望能够为临床提供早期干预的依据,从而改善患者的长期预后。
1 资料与方法
1.1 一般资料
本研究对2019年1月1日至2023年12月31日在重庆医科大学附属第一医院泌尿外科接受RAPN并经过病理学诊断为RCC的733例患者进行了回顾性研究,收集这些患者的人口学特征、实验室检查指标、基础疾病、药物使用情况、围手术期资料。
1.2 病例纳入与排除标准
纳入标准:①通过CT考虑为局限性肾癌并在术后经病理活检确认,且行RAPN的患者;②年龄在18~80岁之间;③术前肾功能指标包括血肌酐水平和肾小球滤过率(glomerular filtration rate,GFR)在正常范围内或轻度受损[GFR≥30 mL/(min·1.73 m²)]。
排除标准:①单肾患者;②一侧或两侧肾脏有2个或2个以上肿瘤的患者;③患者合并严重且未控制的并发疾病,例如心脏病或活动性感染等;④健侧肾脏存在以下任一病变:Bosniak分级≥ⅡF级的复杂性肾囊肿、直径≥5 cm且压迫肾实质的单纯性囊肿、直径>4 cm或伴出血风险的肾错构瘤以及其他影响肾功能的实体占位性病变;⑤慢性肾脏病患者;⑥ 孕期或哺乳期女性。
1.3 治疗方法和定义
手术前的肾功能评估应结合实验室检查和影像学分析,对于接受RAPN的患者,在手术前进行全面的肾脏功能评估。术前由具备丰富经验的外科团队进行手术准备,并在全身麻醉下采用标准的监测方法。术后肾功能减退参考RIFLE标准(risk,injury,failure,loss,end-stage kindey disease,RIFLE)定义为术后血清肌酐水平较术前基线水平增加超过50%,相关患者将纳入肾功能风险组进行后续监测和管理
[9-10]。
1.4 模型开发与解释
预测模型的开发分为3个阶段:①特征选取与数据标准化:通过特征工程筛选预测因子,对连续变量进行Z-score标准化处理;②模型推导与验证:构建7种机器学习模型,包括逻辑回归(logistic regression,LR)、线性判别分析(linear discriminant analysis,LDA)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、K近邻算法(K-nearest neighbors,KNN)、多层感知器(multi-Layer Perceptron,MLP)以及极端梯度提升(EXtreme Gradient Boosting, XGB)。其中RF和XGB采用基于树的集成学习策略,通过Bootstrap重采样构建弱学习器并集成预测结果以降低过拟合风险,其余算法分别属于线性模型、核方法、距离度量及神经网络等不同建模范式;③模型比较:在测试集上通过五重交叉验证评估模型性能,选取受试者工作特征曲线下面积(receiver operating characteristic curve area under the curve,ROC-AUC)最优者进行后续分析。
为了解释最优模型,了解纳入变量对术后肾功能减退的影响,本研究采用Shapley加性解释(Shapley additive explanations,SHAP)算法,其在归因值方面提供了更为一致和局部准确的解释。该算法基于多项式时间复杂度框架,通过系统性追踪所有潜在特征子集与决策树终端节点的关联概率分布,从而实现对计算复杂度的有效优化。其核心机制在于利用动态规划策略,精准计算各特征子集在树结构中的路径权重,并依此推导出终端节点的贡献比例,最终将原本呈指数级增长的计算负担转化为多项式时间内的可控运算。本研究通过采用SHAP框架对最优模型进行分析,量化并可视化风险因素与预测结果之间的复杂关系,从而提升模型的可解释性。
1.5 统计学方法
采用SPSS 26.0和R 4.3.0,机器学习建模基于Python 3.12.4实现。定量资料中,符合正态分布的数据以均数±标准差(x±s)表示,组间比较采用独立样本t检验;偏态分布数据以中位数(四分位间距)[Md (P 25,P 75)]表示,组间比较采用Mann-Whitney U检验。分类变量以频数(百分比)[n(%)]表示,组间比较采用卡方检验或Fisher精确概率法(当理论频数<5时自动切换)。检验水准设为α=0.05。采用五重交叉验证将样本随机分为训练集和内部验证集,并使用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)过采样技术处理训练集中的类别不平衡问题。模型评估指标包括受试者工作特征曲线下面积、准确率、召回率及F1指数,其中AUC为0.84,表明模型具有较高的预测效能。
2 结 果
2.1 人口基线特征表
自2019年1月1日至2023年12月31日,本研究共纳入733例肾细胞癌患者,根据术后肾功能评估结果将其分为肾功能减退组(87例,11.87%)和肾功能正常组(646例,88.13%)。2组患者在肿瘤直径、美国麻醉医师协会(American Society of Anesthesiologists,ASA)评分和病理分级方面差异有统计学意义(
P<0.05);而在体质量、身高、体质指数(body mass index,BMI)、年龄、住院时间、手术持续时间、性别、糖尿病、高血压、心血管事件、腹部手术史、吸烟史、饮酒史、肿瘤侧向、肿瘤位置、术中出血量(>300 mL)及术后并发症方面,差异无统计学意义(
P>0.05)(
表1)。
2.2 预测模型的构建与评估
使用LR、LDA、SVM、RF、KNN、MLP及XGB7种机器学习算法构建预测模型,并绘制验证集的ROC曲线(
图1)。发现RF模型实现了最高的AUC值(AUC=0.84,
图1),表明其综合预测效能最好(
表2)
本文采用SHAP方法对最优模型进行解释性分析。模型的SHAP值借助Python中的SHAP 库进行计算。X轴上的位置即实际的SHAP值,表示该特征对特定样本的模型输出、即对特定样本的相对患病风险的影响。换言之,较高SHAP值的样本相对于较低SHAP值的样本具有较高的肾功能减退风险。此外,各个特征按其重要性沿Y轴排列,其重要性由其绝对SHAP值的平均值给出,特征位置越高,说明重要性越高。
图2展示了通过SHAP值量化不同血液学及临床特征对模型预测结果的贡献方向和强度。中性粒细胞与淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR)、肿瘤直径、凝血酶原时间国际标准化比值、白细胞计数以及术中出血>300ml是影响RAPN术后肾功能减退的重要因素,其中以NLR最为重要。
3 讨 论
RCC是全球范围内最常见的恶性泌尿系统肿瘤之一,其发病率在影像学技术进步与健康体检普及的推动下明显增长
[11]。这一趋势使得早期RCC的检出率明显增加,并促使治疗策略不断优化。RAPN逐渐成为T1期肾癌的治疗标准,其在癌症控制效果上与根治性手术差异无明显统计学意义,同时能够最大限度地保留肾功能,降低术后并发症发生风险
[12]。然而,PN手术方式不可避免地对肾组织造成一定损伤,术中缺血、保留肾实质体积和炎症反应等因素均可能导致术后患者出现肾功能减退的情况
[13]。术后肾功能减退不仅对患者的生理功能构成威胁,还可影响其心理健康和生活质量
[14]。这凸显了术前识别高危患者并提前制定干预策略的必要性。
本研究基于733例接受RAPN的RCC患者,收集并分析了患者的人口统计学、疾病特征及术前、术后资料,通过应用多种机器学习模型预测术后肾功能减退的风险。研究结果显示,RF模型在所有模型中表现最佳,AUC值达0.84,优于其他模型分析结果。进一步结合SHAP方法解析特征重要性,研究识别出若干明显影响术后肾功能的因素,包括NLR、肿瘤直径、国际标准化比值(International normalized ratio,INR)、白细胞计数及术中出血量等,这些参数为术前高危患者的精准识别和术后管理策略制定提供了可靠的参考依据。
术前感染指标(NLR、白细胞计数)异常对RAPN后肾功能减退的临床影响,主要体现在炎症负荷的连锁效应与围手术期决策的复杂性两方面
[15]。系统性感染时,NLR和白细胞计数升高不仅反映炎症活跃,还可通过血流动力学紊乱及微循环修复抑制加重肾损伤。围手术期决策需权衡感染与手术风险:持续白细胞计数升高可能使T1a期肾癌进展风险增加,且感染导致组织脆性可能延长手术热缺血时间
[16]。特别需要指出的是,凝血功能紊乱与炎症反应存在病理级联效应。INR与肾功能减退的关系可能反映凝血平衡的“双刃剑”效应——适度升高的INR可能通过促进血小板聚集促进术中止血,但过度抗凝状态会因微血栓形成和肝素化需求增加导致肾灌注下降、肾髓质缺氧
[17]。肿瘤直径也被确立为术后肾功能减退的重要预测因子。肿瘤直径与肾实质切除范围呈正相关,直径较大的肿瘤因需切除更多功能性肾单位,可能导致残余肾组织低于急性代偿阈值,从而触发术后血清肌酐的急剧升高
[18]。但部分患者在术后5~7 d出现肌酐回落,这与血管新生及健存肾单位代偿性肥大密切相关
[19]。术中出血在RAPN中不仅是技术操作的警示信号,更是残余肾功能损害的独立危险因素。较多失血将导致肾脏灌注压下降,加剧缺血性损伤,即使保留的肾单位也可能因缺氧引发继发性坏死,形成“保留肾单位二次丢失”现象。研究表明,当失血量较多时,机体通过交感神经兴奋触发肾血管持续性收缩,使GFR下降
[18],这种血流动力学紊乱可进一步放大缺血再灌注损伤,导致术后血肌酐升高及远期肾功能减退。
尽管本研究的RF模型在预测性能上具有明显优势,但其应用范围的扩大和泛化能力的提升依赖于更高质量的数据输入和更具代表性样本的纳入。未来研究亟需开展外部数据验证,以确保模型在多中心、多样性患者群体中的适用性。
本研究的结果验证了机器学习技术在肾脏外科领域的应用潜力。在精准医疗和个体化治疗的背景下,RF预测模型为识别高风险患者和优化术后管理策略提供了重要支持。未来研究应进一步优化模型算法,探索更多潜在的关键因素,并在更大范围内验证其临床适用性,以推动机器学习技术在肾癌诊疗中的实际应用。这将有望为RCC患者提供更精确的治疗选择,最终改善其预后和生活质量。
4 结 语
本研究首次利用机器学习系统识别了RAPN后肾功能减退的关键预测因子,包括NLR、肿瘤直径、INR、白细胞计数及术中出血量。RF模型在预测效能上明显优于其他算法(AUC=0.84),为术后肾功能损害的个体化风险评估提供了可靠工具,为提升RAPN手术的长期成功率提供智能决策支持。