肝外胆管癌(extrahepatic cholangiocarcinoma,ECCA)是一种起源于胆管上皮细胞的恶性肿瘤,包括肝门部胆管癌(perihilar cholangiocarcinoma,PCCA)和远端胆管癌(distal cholangiocarcinoma,DCCA)
[1-2]。ECCA的发病率在全球范围内不断增加,常见危险因素包括肥胖、饮酒和吸烟等。此外也有研究
[3-4]表明,2型糖尿病、非酒精性脂肪性肝病和高血压也是ECCA的危险因素。ECCA侵袭性较强,并且起病隐匿,大多患者在进行期才会出现胆道梗阻和黄疸等症状,5年生存率低于20%
[5-6]。根治性手术是目前治疗ECCA的重要方法,但术后复发率依然较高
[7]。有研究
[8]表明,术后以吉西他滨或卡培他滨为基础的辅助放化疗可提高患者总生存率。Mizuno等
[9]发现,对于PCCA伴淋巴结受累的患者,术后接受辅助化疗,5年总生存率可显著提高至32.9%,中位生存时间也提升至37个月。然而,一些患者也可能会受到过度治疗,进而在经济与生活质量上造成不良影响
[10]。因此,开发一个预测ECCA根治术后的预后模型有助于辅助临床决策。随机生存森林模型(random survival forests,RSF)是机器学习中的一种新算法,将机器学习方法和传统生存分析相结合,可为多种临床疾病提供预后信息
[11]。RSF具有较高的灵活性和性能,尤其在应对大样本数据时,表现出更高的临床应用价值
[12]。然而,RSF在预测ECCA术后预后方面研究甚少,有待深入探索。本研究旨在比较RSF模型与传统Cox比例风险模型在根治术后ECCA患者中的表现,以期为临床诊治提供参考。
1 资料与方法
1.1 患者选择
纳入标准如下:(1) 诊断时间为2016—2021年;(2) CS Schema AJCC 6 th Edition定位为Extra Hepatic Ducts;(3) Behavior code ICD-O-3为Malignant;(4) 进行根治性手术;(5) 诊断年龄≥18岁且90岁。排除标准如下:(1) 区域淋巴结活检阳性数不明确;(2) 未进行区域淋巴结活检或活检数不明确;(3) 肿瘤大小100 mm或5 mm或大小不明确;(4) 其他肿瘤诊断;(5) TNM分期不明确;(6) 随访数据不完整;(7) 生存时间1个月。最终纳入515例患者。
1.2 变量
本研究收集了一系列人口统计学信息,包括年龄、性别、人种、居住地点、收入,针对临床特征收集了肿瘤大小、TNM分期、临床分期、淋巴结活检阳性率(淋巴结活检阳性数/淋巴结活检数),此外还包括化疗与放疗情况以及患者的生存状态与生存时间。
1.3 样本量估算
根据Riley等
[13]提出的四步法,计算出临床预测模型所需的最小样本量为242例。该方法考虑了预测因子的参数数量、时间点、阳性事件占比、校正决定系数和平均随访期,以确保其准确性并防止过度拟合。
1.4 模型构建
使用sample函数按照7∶3的比例进行训练集和测试集的划分,训练集(n=361)用于模型构建,测试集(n=154)用于模型评估。采用单因素Cox回归,筛选出可能影响生存期的预后因素,将单因素Cox回归P0.1的变量纳入多因素Cox回归,将多因素Cox回归P0.05的变量纳入Cox比例风险模型。采用VIMP(variable importance)法和最小深度(minimal depth,MD)法进行筛选,将筛选出的变量纳入RSF模型的构建。
1.5 模型的评估和解释
通过一致性指数(C指数)、不同时间点的曲线下面积(AUC)分析评估模型的区分度,通过校准曲线分析评估模型的校准度,通过Brier评分评估模型的整体性能,此外通过决策曲线评估患者的临床获益
[14]。生存分析采用Kaplan-Meier法经Log-rank检验比较不同分组的患者生存时间的差异,并绘制生存曲线。最后,针对选定的模型,从全局层面,借助SurvSHAP(t)与预后因素的生存曲线进行解释;从局部角度,通过SurvLIME图对单例患者展开解释。
1.6 统计学处理
使用R4.4.1进行数据分析。对于患者的基线特征,计量资料若符合正态分布使用均值±标准差(),偏态分布使用中位数(四分位间距)[M(IQR)],组间比较符合正态分布使用t检验或方差分析,偏态分布使用秩和检验;计数资料使用例数(构成比)[n(%)],组间比较采用χ2检验或Fisher精确检验。检验水准α=0.05,P0.05为差异有统计学意义。
2 结 果
2.1 患者临床特征
训练集中患者的中位年龄为68.0岁,男性患者占66.5%;测试集中患者的中位年龄为68.5岁,男性患者占66.9%。训练集和测试集在性别、年龄、人种、收入和肿瘤学资料等方面差异均无统计学意义(均
P0.05)(
表1)。
2.2 Cox比例风险模型
2.2.1 Cox单因素和多因素分析
单因素Cox回归共筛选出11个影响因素(均
P0.1),将以上因素纳入多因素Cox回归,结果显示,年龄、人种、收入、T分期、N分期、化疗和肿瘤大小是影响患者总生存时间的独立预后因素(均
P0.05)(
表2)。
2.2.2 列线图的建立和评估
将年龄、T分期、N分期、人种、收入、肿瘤大小和化疗这7个变量纳入Cox比例风险模型,并绘制列线图(
图1)。结果显示,测试集的C指数为0.711(95%
CI=0.691~0.737),1、2、3年的AUC分别为0.839、0.749、0.743(
图2A),这表明模型具有良好的区分性。测试集Brier评分为0.167(95%
CI=0.149~0.170),这表明模型具有良好的整体性能(0.25)。
图2B展示了测试集高风险组与低风险组随时间变化的生存率趋势。高风险组的生存率呈现出快速下降的态势,而低风险组的生存率下降相对缓慢。Log-rank检验结果显示,高风险组与低风险组之间的总生存期存在明显差异(
P0.000 1)。此外,模型第1年的校准曲线与对角线十分贴合,第2、3年虽有波动但基本符合对角线分布,这表明模型具有良好的校准度(
图2C-E)。第1年的决策曲线表明,风险阈值在8%~68%时患者能获得较高的净收益,第2年的决策曲线表明,风险阈值在28%~89%时能获得较高的净收益,第3年的决策曲线表明患者,风险阈值在39%~91%时能获得较高的净收益,这表明模型能为患者带来良好的临床获益(
图2F-H)。
2.3 RSF模型
2.3.1 RSF模型构建
采用VIMP法和MD法筛选出年龄、化疗、肿瘤大小、区域淋巴结活检阳性率是影响患者总生存时间的独立预后因素(
图3)。对RSF模型进行参数调优,当参数nodesize=5与ntree=1 100时,模型的性能最优。
2.3.2 RSF模型评估
使用RSF模型预测患者生存时间,测试集C指数为0.751(95%
CI=0.701~0.788),1、2、3年的AUC分别为0.843、0.749、0.814(
图4A),表明模型具有良好的区分性。测试集Brier评分为0.156(95%
CI=0.145~0.187),表明模型具有良好的整体性能(0.25)。
图4B展示了测试集高风险组与低风险组随时间变化的生存率趋势。高风险组的生存率呈现出快速下降的态势,而低风险组的生存率(红色曲线)下降相对缓慢。Log-rank检验结果显示,高风险组与低风险组之间的总生存期存在明显差异(
P0.000 1)。此外,第1、2、3年校准曲线与对角线都十分贴合,这表明模型具有良好的校准度(
图4C-E)。第1年的决策曲线表明,风险阈值在8%~69%时患者能获得较高的净收益,第2年的决策曲线表明,风险阈值在22%~86%时能获得较高的净收益,第3年的决策曲线表明,风险阈值在36%~90%时能获得较高的净收益,这表明模型能为患者带来良好的临床获益(
图4F-H)。
2.4 RSF模型与Cox比例风险模型的比较
本研究对RSF模型和Cox比例风险模型进行了全面的性能评估。在区分度方面,从不同时间点的AUC值来看,RSF模型1、2、3年的AUC分别为0.843、0.749和0.814,Cox比例风险模型1、2、3年的AUC分别为0.839、0.749、0.743;从C指数来看,RSF模型的C指数为0.751,而Cox模型的C指数为0.711。在整体性能方面,RSF模型的Brier评分0.156,而Cox模型的Brier评分为0.163。在校准度方面,RSF模型与Cox比例风险模型相比校准曲线更加贴合对角线。综合以上内容,RSF模型的性能更优,因此选择RSF模型作为最终模型。
2.5 RSF模型的解释与应用
2.5.1 全局解释
在针对聚合SurvSHAP(t)值展开对区域淋巴结活检阳性率、化疗、年龄以及肿瘤大小这4个关键变量的深入分析。淋巴结活检阳性率、年龄以及肿瘤大小所对应的点,广泛散布于聚合SurvSHAP(t)值横轴的整个取值范围之内,并且颜色变化丰富多样。这表明,淋巴结活检阳性率、年龄以及肿瘤大小对模型结果的影响并非呈现简单的线性关系,而是呈现出较为复杂的情形。化疗的点高度聚焦于聚合SurvSHAP(t)值约为-0.1的附近区域,且颜色较深,这种现象揭示了接受化疗对患者死亡率产生了显著的负向影响(
图5)。
图6展示了化疗与不化疗,区域淋巴结活检阳性率≤0.1与0.1,年龄≤70岁与70岁,肿瘤大小≤20 mm与20 mm分组随时间变化的生存率趋势,Log-rank检验结果显示,不同组生存率差异均有统计学意义(均
P0.05)。这一发现提示,分组因素对生存率影响重大,其中不化疗组、区域淋巴结活检阳性率0.1组、年龄70岁组和肿瘤大小20 mm组的个体,面临着更高的生存风险。
2.5.2 局部解释
选择2例患者纳入RSF模型。结果显示,年龄、区域淋巴结阳性率、肿瘤大小增加患者病死率,而化疗对病死率没有影响,RSF模型的预测与黑箱模型的预测曲线有一定偏差,这表明预测结果或许并不准确;化疗可降低患者病死率,而年龄增加患者病死率,肿瘤大小与区域淋巴结阳性率影响极小,RSF模型的预测与黑箱模型的预测曲线较为贴近,这表明预测结果相对准确(
图7)。
3 讨 论
胆管癌起病隐匿、检查困难、不易预防,是预后较差的癌症之一,对人类的健康带来了巨大的威胁。目前对胆管癌的研究大多集中于肝内胆管癌,而对ECCA的研究相对较少。有研究表明,对于ECCA,采用手术干预联合辅助治疗或新辅助治疗,能获得更高的治愈机会,但仍只有少数患者能达到治愈效果,多数患者因确诊过晚或是受个体差异、基础疾病等多种因素影响,预后不佳
[15]。影响ECCA患者生存预后的因素众多,主要包括年龄、人种、性别、婚姻状态、组织学类型、肿瘤TNM分期、肿瘤大小、是否接受过手术、放疗和化疗等
[16]。
本研究基于SEER数据库2016—2021年数据,纳入515例接受根治性手术的ECCA患者,首次构建并验证了基于RSF模型的术后总生存率预测模型。相较于传统Cox比例风险模型受限于比例风险假设及线性关系约束,RSF通过集成学习算法自动捕捉变量间复杂交互与非线性效应,为个体化预后评估提供了更优解
[17]。经严格性能验证,RSF模型在区分度、校准度及时间依赖性AUC上均显著优于Cox比例风险模型。
乔新伟等
[18]基于2004—2015年SEER数据库筛选出3 102例ECCA患者,进行单因素和多因素Cox回归分析,以确定预后因素,并利用Cox回归开发预后列线图,研究结果显示,年龄、T分期、淋巴结转移、远处转移、肿瘤大小、手术治疗、辅助化疗以及婚姻状态是独立预后因素。Ma等
[19]收集了2010—2021年间在西安交通大学第一附属医院接受根治性切除的340例PCCA患者的临床资料,并采用LASSO回归、前向逐步Cox回归、Boruta特征选择、随机森林以及XGBoost等多种机器学习方法进行变量筛选,最终确定阳性切缘、淋巴结转移、总淋巴结计数以及肿瘤分化差为显著预后因素。Tang等
[20]纳入了2015—2022年中国6个医疗中心接受了根治性手术的400例DCCA患者。使用单因素Cox回归和
Wald检验筛选出相关的变量。并根据贝叶斯信息准则进行逐步筛选以消除冗余变量,计算风险评分,并利用Cox回归建立列线图,最终确定分化程度、N分期、M分期、癌栓和化疗是其独立预后因素。Hu等
[21]利用2010—2020年SEER数据库并结合来自9家医院的228例DCCA患者数据,进行单因素和多因素Cox回归分析,以确定预后因素,并利用LASSO回归开发预后列线图,其分析表明,临床分期、M分期、手术和化疗是DCCA患者的独立预后因素。从以上研究可知,本研究所确定的独立预后因素,均在以往研究中印证,以往研究的C指数也均低于本研究(0.751
vs. 0.713、0.714、0.601、NA)。目前ECCA相关预后模型主要集中在列线图,但它只能预测确切时间点的生存状况,对风险因素对个体结果的影响缺乏直觉,而RSF模型改善了预测的形式;生存概率曲线,从更精确的角度呈现了患者的术后预后;SHAP图能直观地解释风险因素对个体生存结果的影响。基于此,本研究首次证实RSF在ECCA预后预测中的临床转化价值,其生存曲线与SHAP可解释性框架可为制定风险适应性随访策略提供量化依据,有望改善当前依赖AJCC分期的管理模式。与在肿瘤学和医学中广泛用作预后工具的列线图相比,RSF模型提供了一种更灵活的预测方法
[22]。
RSF模型最终筛选出年龄、化疗、肿瘤大小和区域淋巴结阳性率4个变量,与传统Cox比例风险模型在变量选择上存在显著差异。Cox模型基于比例风险和对数线性假设
[23],以解释变量间的独立效应为目标,因此纳入了包括N分期、人种、收入等7个变量。然而,该模型在处理非线性关系与交互作用方面存在局限。相比之下,RSF作为机器学习方法,以预测精度为核心目标,通过集成决策树自动捕捉变量间复杂的非线性及交互效应
[24]。其变量重要性评估更直接反映各变量对预测准确度的贡献。RSF的变量选择体现出更高信息浓度与临床适用性:区域淋巴结阳性率作为连续变量,替代了传统N分期,更精细地量化淋巴结转移负荷,提供更准确的预后信息。其余变量(年龄、化疗、肿瘤大小)则通过非线性和交互效应承载重要预测价值。该模型仅基于4个易获取的临床变量,即实现优越预测性能,具有良好的临床可操作性。研究表明,在ECCA预后评估中,应优先将区域淋巴结阳性率作为连续变量使用,而RSF为整合多变量、生成个体化生存预测提供了高效可靠的工具。
年龄的预后价值与Alvaro等
[25]多中心队列研究一致,可能归因于老年患者免疫衰老及术后并发症发生风险增加
[26]。因此,建议对≥70岁患者采用老年综合评估指导治疗强度调整。辅助化疗的生存获益在本研究中显著,但需强调药物特异性,基于BILCAP Ⅲ期试验
[27],卡培他滨辅助治疗可延长中位总生存期,而吉西他滨方案未显示总生存期获益,这提示化疗方案选择是预后的关键调节变量,需结合分子分型等。肿瘤负荷的预后权重与Coelen等
[28]的发现一致。本研究通过阈值回归分析发现,肿瘤大小20 mm时死亡风险骤增,提示该临界值可作为新辅助治疗适应证的重要参考,尤其适用于临界可切除病例。淋巴结转移的层级影响在RSF模型中尤为突出,区域淋巴结阳性率每增加10%,死亡风险升高32%,与Tella等
[29]基于SEER数据库的结论相印证,这强调了术中系统性淋巴结清扫的必要性。尽管AJCC第8版T分期是ECCA预后评估的基础工具
[30],但RSF模型中TNM分期均不显著。这可能由于某些分期患者占比过高削弱了分层区分能力,或提示TNM分期影响被淋巴结转移及辅助治疗效应所掩盖。未来需结合影像组学特征优化TNM分期评估。
本研究仍存在一些局限性。第一,回顾性研究设计可能导致潜在选择偏倚。尽管通过严格的纳入排除标准减少数据噪声,但SEER数据库未记录患者合并症及手术切缘状态等关键预后因素,可能影响模型预测的全面性。未来需联合多中心前瞻性队列验证模型稳健性。第二,模型的外部泛化性需进一步验证。当前训练集与测试集均来自SEER数据库,虽采用7∶3随机划分,但人群特征与亚洲等区域差异显著。建议后续纳入独立数据库,或开展跨人种队列验证,以评估模型普适性。第三,变量缺失限制模型精准性。SEER未记录化疗具体方案、药物剂量及遗传标记,而上述因素已被证实与胆管癌预后及治疗响应显著相关。整合基因组学数据及治疗细节,可构建“多组学-临床”联合模型提升预测效能。第四,辅助/新辅助治疗交互作用尚未解析。本研究仅将化疗作为二分类变量,未区分治疗时机及联合放疗的协同效应。需结合随机对照试验数据,建立动态预测框架评估不同治疗方案对生存的边际贡献,以指导个体化治疗决策。
本研究基于年龄、化疗、肿瘤大小、区域淋巴结活检阳性率建立RSF模型,并预测根治术后ECCA患者生存率。该模型表现出良好的性能,是预测根治术后ECCA患者预后的可靠工具,有望为后续个性化治疗方案的制定提供可靠的依据,进而在改善患者生存质量、延长患者生存期等方面发挥重要作用。
苏州市科技发展计划基金资助项目(SLJ2021001)