原发性肝淋巴瘤是一种罕见的肝脏恶性肿瘤,约占非霍奇金淋巴瘤的0.016%
[1]。其预后差,中位生存期(overall survival,OS)仅8~16个月
[2-4]。其中,原发性肝脏弥漫大B细胞淋巴瘤(diffuse large B cell lymphoma,DLBCL)是原发肝淋巴瘤中最常见的病理学类型
[5-7],关于原发性肝脏DLBCL的文献,目前是个案报道和小样本系列病例报告
[5,8-9]。例如,Page等
[6]报道24例肝脏淋巴瘤(96%为DLBCL)接受联合化疗后,完全缓解率达83.3%,5年肿瘤特异生存(cancer-specific survival,CSS)为87.1%;Aitelhaj等
[3]报道1例原发性肝脏DLBCL患者接受R-CHOP(包括:利妥昔单抗375 mg/m
2、第1天静脉注射;环磷酰胺750 mg/m²,第1天静脉注射;多柔比星50 mg/m
2,第1天静脉注射;长春新碱1.4 mg/m
2,第1天静脉注射,最大剂量不超过2 mg;泼尼松100 mg/d,口服5 d)治疗后,病灶由110 mm×78 mm缩小至22 mm×13 mm,36个月随访无症状生存。化疗被认为是对于大多数恶性肿瘤的有效治疗手段
[10-12]。然而,由于缺乏大样本临床研究证据,化疗对原发性肝脏DLBCL患者预后的影响,目前仍是不清楚的。SEER(the Surveillance,Epidemiology and End Results,SEER)数据库是美国国家癌症研究所建立的权威肿瘤数据库,记录了包括人口统计学、原发肿瘤部位、肿瘤形态、临床分期、治疗方式和生存结局等详细资料。根据2020年人口普查数据,SEER数据库最新版(SEER 22)已覆盖美国约47.9%的人口。本研究使用SEER 18数据库(覆盖约28%的美国人口),分析2000—2019年间确诊的原发性肝脏DLBCL患者
[10,13-16]。
因此,本研究利用SEER数据库中的大样本量真实世界数据,通过机器学习算法系统性分析评价化疗对原发性肝脏DLBCL预后的影响,旨在为临床制定精准、个体化的治疗决策提供参考。
1 资料与方法
1.1 资料来源
利用 SEER*Stat v8.3.9软件从SEER数据库中提取2000—2019年期间,经过病理学确诊为原发性肝脏DLBCL患者的临床病理及预后资料(随访截止日期为2019年12月31日)。
1.2 纳入和排除标准
纳入标准:(1) 患者初诊时为原发性肝脏DLBCL;(2) 经病理学确诊;(3) 确诊年份为2000—2019年;(4) 病理学类型符合ICD-O-3编码为:“9673/3”“9680/3”“9684/3”“9688/3”“9712/3”。排除标准:(1) 多源性肿瘤;(2) 经过尸检或死亡证明确诊的病例;(3) 研究指标无法获取;(4) 临床或随访信息记录不完整。
1.3 提取数据
参照笔者
[10,17-18]先前的研究,提取患者的诊断年龄、种族、性别、Ann Arbor分期、治疗信息、B细胞症状(指淋巴瘤相关的系统性症状,包括发热>38 ℃、夜间盗汗和6个月内体质量下降>10%)、OS及生存结局等资料。Ann Arbor分期和B细胞症状均为首诊时的临床记录,基于SEER数据库的诊断数据。结合文献
[19]报道,本研究中,年龄界定标准设置为
P25(55岁)和
P75(78岁)。依据原发性肝脏DLBCL患者的年龄、性别、种族、婚姻状况、Ann Arbor分期、是否有B细胞症状、是否接受手术、放疗和化疗,对其临床资料进行分组后用于后续分析。由于SEER数据库的限制,未能获取化疗开始的具体时间点(如确诊后多久接受化疗)。
1.4 统计学处理
本研究的研究终点分别为:CSS和OS。CSS定义:随访期间因原发性肝脏DLBCL死亡的时间,非原发性肝脏DLBCL死亡,随访截止,或失访数据作为删失数据;OS定义:随访期间因任何病因死亡的时间,随访截止或失访数据作为删失数据
[20]。应用 Stata/MP 16.0软件和R(version 4.2.3,
http://www.r-project.org)软件进行统计分析。正态分布计量资料以均数±标准差(
)表示,非正态分布计量资料采用中位数(四分位间距)[
M(
IQR)]进行描述,计数资料采用率表示,组间对比采用
χ2检验;采用Kaplan-Meier法计算OS率,OS率比较采用Log-rank法;采用单因素Cox比例风险模型,筛选OS和CSS的影响因素,根据单因素Cox分析结果并结合临床重要性筛选变量,进行多因素Cox比例风险模型进一步筛选出独立预后因素,并计算风险比(
HR)及对应95%置信区间(
CI)
[21]。在多因素Cox风险比例模型分析中,用方差扩展因子(variance inflation factors,VIF)评估模型多重共线性,如果其取值<10,表明不存在严重的多重共线性问题,可进行后续分析。随机生存森林是一种机器学习算法,具有高鲁棒性(robustness),它不受比例风险假定、对数线性假定等条件的约束,并且能够通过两个随机采样的过程来防止算法的过度拟合问题
[22]。本研究中,用随机生存森林模型进行独立的预后分析,评价变量对OS和CSS重要性。所有检验均为双侧尾。检验水准
α=0.05。
2 结 果
2.1 纳入病例特征
经筛选,594例原发性肝脏DLBCL患者符合条件并纳入分析,中位年龄66(52~77)岁。其中男性368例(62.0%),女性226例(38.0%)。化疗组435例(73.2%),非化疗组159例(26.8%)。除年龄构成比外,化疗组与非化疗组间患者的基线资料均衡可比(均
P>0.05)(
表1)。
2.2 原发性肝脏DLBCL患者的预后情况
中位随访17.5(1~91)个月,化疗组435例中,共死亡278例(63.91%),其中肿瘤相关性死亡196例(45.06%);非化疗组159例中,共死亡136例(85.53%),其中肿瘤相关性死亡108例(67.92%)。化疗组和非化疗组的中位OS分别为:81(7~173)个月和11(2~171)个月。估算的化疗组与非化疗组1年OS率分别为:67.99%和47.77%,Log-rank检验显示两组差异有统计学意义(
χ2=6.73,
P=0.010)。估算的化疗组与非化疗组1年CSS率分别为:71.03%和52.87%,Log-rank检验显示两组差异有统计学意义(
χ2=9.41,
P=0.002)。化疗能明显提高患者的OS和CSS(
图1)。
2.3 单因素Cox比例风险模型分析
单因素Cox分析显示:年龄和化疗与患者的OS有关(均
P< 0.001);年龄、婚姻状况、Ann Arbor分期和化疗与患者的CSS有关(均
P<0.05)(
表2)。
2.4 多因素Cox比例风险模型分析
根据单因素Cox比例风险模型分析结果,将有统计学意义的变量和具有重要临床意义的变量进一步纳入多因素Cox比例风险模型。结果显示:年龄、Ann Arbor分期和化疗是OS的独立影响因素(均
P<0.05);年龄、婚姻状况、Ann Arbor分期和化疗是CSS的独立影响因素(均
P<0.05)(
图2)。
2.5 随机生存森林模型分析
随机生存森林具有高鲁棒性的特点,不受比例风险假定、对数线性假定的约束,在分析过程中,能够通过两个随机采样的过程来防止算法的过度拟合问题。为进一步评价化疗对OS和CSS的影响,通过随机生存森林模型分析显示,化疗对于OS和CSS的重要性评分均最高(
图3)。
2.6 化疗在不同亚组原发性肝脏DLBCL患者中的预后分析
为了减少选择性偏倚的影响,根据患者临床病理特征将病例划分为不同亚组,在每一亚组中,采用多因素Cox比例风险模型评估化疗对CSS和OS的影响。结果表明,在调整了年龄、性别、婚姻状况、Ann Arbor分期、B细胞症状、手术和放疗对预后的影响后,化疗仍能提高原发性肝脏DLBCL患者的OS和CSS(
图4)。
3 讨 论
原发性肝脏DLBCL是一种发病罕见的肝脏恶性肿瘤
[23]。目前,临床上没有专门针对原发性肝脏DLBCL的最佳治疗方案
[5]。目前,CHOP方案(由环磷酰胺、多柔比星/阿霉素、长春新碱和泼尼松组成)被广泛认为是DLBCL的一线标准化疗方案
[24-25]。然而,即使是相同的病理学类型,原发病灶的解剖部位不同,治疗和预后仍可能存在差异
[10,17-18]。由于缺乏高质量的前瞻性临床研究,因此,化疗对原发性肝脏DLBCL预后的影响目前仍是不清楚的。基于此,本研究利用SEER数据库中的大样本真实世界数据,使用机器学习的算法系统性地评价化疗在原发性肝脏DLBCL患者治疗中的价值。
本研究显示,化疗是原发性肝脏DLBCL患者预后的独立影响因素,它能明显提高患者的OS和CSS。在本研究中,化疗组和非化疗组的中位OS分别为:81(7~173)个月和11(2~171)个月。同非化疗组患者相比,化疗组患者的总死亡风险和疾病相关性死亡风险分别降低了61%和63%。进一步通过机器学习算法和亚组分析,在调整了其他因素对预后的影响后,得出了稳健和相同的结论。与本研究类似,Zhang等
[26]在一项对肝淋巴瘤的回顾性分析中也表明,化疗能提高患者的OS(
HR=0.36,95%
CI=0.30~0.44,
P<0.001)和疾病相关性死亡风险(DSS)(
HR=0.35,95%
CI=0.28~0.43,
P<0.001)。类似的还包括Qiu等
[27]的研究。除此之外,Emile等
[28]的研究显示,含蒽环类抗生素的化疗方案,能使结节浸润型肝淋巴瘤患者明显获益。Page等
[6]在一项纳入了24例肝脏淋巴瘤(96%的患者病理学类型为弥漫性大细胞淋巴瘤)的回顾性研究中表明,联合化疗可以使患者获得83.3%的完全缓解率,5年CSS率和5年无失败生存率分别为87.1%和70.1%。Aitelhaj等
[3]报道了1例原发性肝脏DLBCL患者,采用R-CHOP方案,共接受8个周期治疗后,肿瘤病灶由原来的110 mm×78 mm显著缩小至22 mm×13 mm。后续随访36个月内,该患者一直处于无症状生存状态,提示R-CHOP方案可能在部分原发性肝脏DLBCL患者中具有良好的治疗效果。同样,赵骞等
[29]报道了1例肝淋巴瘤切除术后联合化疗的患者,该患者生存时间已超过10年。由此可见,上述研究的结论均支持我们的研究结论。
在笔者检索的范围内,目前国内外尚无关于原发性肝脏DLBCL的大样本真实世界研究的文献报道。本研究主要有以下优势:首先,在分析过程中使用了随机生存森林模型。该模型作为一种机器学习算法,属于集成学习范畴,具有高鲁棒性,且不受比例风险假定、对数线性假定等条件的限制,而且还能够通过两个随机采样的过程来防止算法的过度拟合问题
[22]。因而,该算法得出的结论将更加可靠和稳定。其次,在分析过程中,也同样独立地运用了经典的单因素、多因素Cox比例风险模型,并且利用VIF对模型的多重共线性问题进行了定量的评价与分析。最后,本研究总共纳入了594例患者,其中414例(69.70%)患者发生死亡结局事件,其中304例(51.18%)出现肿瘤特异性死亡,因此,本研究的样本含量和事件结局数,可以为统计分析提供了足够大的检验效能。
然而,本研究仍然存在一定的局限性:首先,作为回顾性研究,虽然在设计时制定了严格的纳入和排除标准,但是选择偏倚仍是不可避免的。其次,SEER数据库是大型肿瘤数据库,容易受编码错误及删失值的影响。再次,由于SEER数据库数据获取权限的限制,部分数据(如:化疗、手术和放疗的具体方案,肿瘤复发信息等等)无法获取,可能影响结果解释。未来研究需纳入化疗时机等详细信息,以进一步明确其对预后的影响。最后,纳入研究的病例数中,部分组别病例数较少、构成比不均衡,可能影响检验效能。
综上所述,我们通过大样本真实世界数据分析显示,化疗是原发性肝脏DLBCL预后的独立影响因素,可能使原发性肝脏DLBCL患者获益,R-CHOP方案,可能是最佳的化疗方案。
四川省绵阳市卫计委2023科研基金资助项目(202309)
四川省绵阳市中医药开发利用重点实验室2025开放基金资助项目(25ZYKF04)
成都中医药大学2024校院联合创新基金资助项目(LH202402010)