肝细胞癌(hepatocellular carcinoma,HCC)是最常见的肝癌,约占所有原发性肝脏恶性肿瘤的80%。发病率全球高居第六位,也是导致癌症死亡的第三大病因
[1]。现阶段,全球一半的肝癌病例来自中国,严重危害着我国人民的健康
[2]。目前,肝部分切除术仍然是HCC的首选治疗方法
[3]。随着时间的推移,手术技术的进步和围术期管理的优化使术后肝功能衰竭(posthepatectomy liver failure,PHLF)的发生率显著下降,但PHLF的发生仍是术后导致患者死亡的首要原因,病死率约为14%
[4]。近年来,各种传统评分模型、影像学评估及现代列线图模型已应用于术前肝脏储备功能评估,例如终末期肝病模型(model for end-stage liver disease,MELD)、白蛋白-胆红素(albumin-bilirubin score,ALBI)分级、吲哚菁绿15 min滞留率(retention rate of indocyanine green at 15 minutes,ICG R15)检测、CT三维(3D)重建等,但各种方法在不同研究中的预测效果相差较大
[5]。多项研究
[6-8]表明,大肝癌(肿瘤直径>5 cm)患者更容易发生PHLF。因此,十分有必要根据大肝癌患者数据建立术前预测模型,以预防PHLF的发生,此举对于改善手术结果、降低医疗成本及患者的远期生存率有重要意义。
1 资料与方法
1.1 一般资料
回顾性分析2018年1月—2023年6月接受根治性肝切除的共927例大肝癌患者的临床资料,其中安徽医科大学第一附属医院721例,安徽医科大学第二附属医院206例。927例患者中,男性786例,女性141例;年龄23~82岁,年龄>60岁550例;肝功能ALBI分级1级患者590例,ALBI分级2~3级288例。将安徽医科大学第一附属医院的患者信息作为训练队列,安徽医科大学第二附属医院的患者信息作为验证队列。
1.2 纳入与排除标准
纳入标准:(1) 排除手术禁忌后行根治性肝切除术;(2) 术前CT或MRI提示肿瘤直径为>5 cm的HCC患者;(3) 围术期临床资料完整及手术记录明确者;(4) 随访资料可获取者。
排除标准:(1) 术后病理非HCC或不明确者;(2) 二次手术患者;(3) 术前接受过经导管动脉化疗栓塞术、靶免治疗或放化疗的患者;(4) 术前接受过门静脉栓塞术或门静脉结扎术的患者;(5) 术前有严重的心、肝、脑、肺、肾或其他脏器基础疾病。
1.3 观察指标
本研究收集的患者临床资料来自医院病案室病历查询系统。收集患者一般信息包括年龄、性别、身高、体质量、体质量指数(BMI)、糖尿病、肝炎病史、美国麻醉医师协会(American Society of Anesthesiologists,ASA)分级;实验室资料包括术前及术后的血常规、生化、凝血指标,同时计算ALBI分级、天门冬氨酸氨基转移酶与血小板比率指数评分(aspartate aminotransferase-to-platelet ratio index,APRI)数值;影像学资料包括肿瘤数目、肿瘤直径、是否有肝硬化、微血管侵犯(microvascular invasion,MVI)及胆管侵犯;手术相关指标包括手术方式、手术时间、肝切除范围、术中出血量、术中是否输血、肝门阻断次数、阻断时间等。肿瘤直径取影像学上的肿瘤最长直径。按照国际肝胆胰协会(International Hepato-PancreatoBiliary Association,IHPBA)制定的肝切除范围标准,肝大部切除指切除肝段数量≥3段
[9]。
PHLF的诊断标准:采用国际肝脏外科研究小组(International Study Group of Liver Surgery,ISGLS)在2011年提出的PHLF判定标准
[10],即在患者无胆道梗阻的前提下,术后第5天或之后出现的血清总胆红素和凝血酶原活动度及国际标准化比值(international normalized ratio,INR)较术前异常升高,即可诊断为PHLF。根据PHLF对患者临床管理的影响进行分级:A级仅出现实验室指标异常,无临床症状,无需处理;B级偏离了正常病程,可能会出现腹水、体质量增加和轻度呼吸功能不全或轻微的肝性脑病,但无需侵入性治疗即可得到控制。无创治疗可能包括给予新鲜冰冻血浆、白蛋白、使用利尿剂和无创通气或转入重症监护病房治疗;C级临床表现可能以大量腹水、全身水肿、感染、血流动力学不稳定、晚期呼吸衰竭和脑病为特征,需要侵入性治疗,包括血液透析、插管和机械通气、体外肝脏支持、循环支持(即血管活性药物)、抢救性肝切除术和移植。
1.4 统计学处理
使用SPSS 27.0和R4.2.2分析数据。当P<0.05时认为差异具有统计学意义。先对连续变量正态性检验,符合正态分布的连续变量组间比较采用t检验,在图表中用均数±标准差()表示;采用Mann-Whitney U检验分析符合偏态分布的变量;计数资料采用频数(百分比)[n(%)]表示,采用卡方检验。使用单因素Logistic回归在训练队列里筛选出大肝癌PHLF危险因素,将有统计学意义的变量纳入多因素Logistic回归,进一步筛选出大肝癌PHLF的独立危险因素。使用nomogram函数构建列线图预测模型,并实施外部验证。此外,通过受试者工作特征(receiver operator characteristic,ROC)曲线、校准曲线和决策曲线(decision curve analisis,DCA)分析验证模型的性能。
2 结 果
2.1 建模人群和验证人群的临床资料比较
建模队列共721例患者,验证队列共206例患者,两组在性别、年龄、ASA分级、肝功能Child-Pugh分级、术前实验室检查、手术方式、术中出血量、手术时间、阻断时间等指标比较,差异均无统计学意义(
P>0.05)(
表1)。927例患者中,共有192例发生了B级以上的PHLF,发生PHLF的概率为20.7%,其中发生C级PHLF患者8例。
2.2 单因素和多因素Logistic回归分析
在训练队列中,使用Logistic回归进行单因素回归分析,其中ASA分级、MVI、AFP、肝功能Child-Pugh分级、术中输血、肿瘤直径、脉管癌栓、ALBI分级、肝硬化、术中出血量等十个变量
P<0.05,将上述十个筛选变量使用逐步回归法进行多因素Logistic回归分析,结果显示,肿瘤直径、肝硬化、AIBL评分、脉管癌栓、术中出血量是大肝癌PHLF发生的独立影响因素(
P<0.05)(
表2)。
2.3 列线图模型构建
将肿瘤直径、肝硬化、AIBL评分、脉管癌栓、术中出血量等五个独立影响因素纳入,建立大肝癌PHLF列线图预测模型。方差膨胀因子分别为1.115、1.103、1.074、1.079、1.019,均<10,说明5个变量之间不存在多重共线性。通过模型上的标尺,可获得5个因素所对应的分值,将各单项分值相加即为总得分,与总分对应的概率即为大肝癌PHLF发生概率。当患者的总分达到185时,PHLF发生概率>50%,当患者的总分达到260时,PHLF发生概率>80%(
图1)。
2.4 列线图预测模型的内部验证和评价
对构建的模型进行评价,如
图2所示,该模型在训练队列和验证队列上的曲线下面积(area under the curve,AUC)分别为0.757(95%
CI=0.703~0.811)和0.779(95%
CI=0.702~0.863),表明该列线图预测模型区分度良好。训练队列和验证队列的预测模型校准图如
图3所示,该模型的校准曲线与理想曲线相对接近,表明预测结果与实际发现一致。训练队列数据与验证队列的预测模型DCA曲线如
图4所示,该曲线揭示了模型在不同风险阈值下提供的净收益,与对所有进行治疗的患者或不进行任何治疗的患者进行了比较。一旦阈值概率超过15%,通过该列线图指导患者进行干预所获得的净获益,相比所有患者要么全部进行干预、要么全部不进行干预的净获益更大,且本模型的临床获益显著大于ALBI分级,这充分表明此预测模型具备出色的临床实用价值。
2.5 本模型与传统预测模型的比较
临床评价模型ROC曲线显示,FIB-4指数AUC=0.626,95%
CI=0.532~0.721;APRI评分AUC=0.610,95
% CI=0.515~0.705;ALBI分级AUC=0.640,95%
CI=0.551~0.730(
图5),提示本模型的预测能力明显优于ALBI分级、FIB-4指数和APRI评分(
Z=-4.678,-3.049,-2.046;
P<0.05)。
3 讨 论
目前,手术治疗仍是治疗HCC的首选,而PHLF严重影响到患者的术后生存
[11-12]。PHLF与患者的个体基础疾病、免疫状态、肝脏储备功能、手术中因素(剩余肝体积、手术时间、术中出血量)等因素密切相关
[13-14]。术前准确评估肝功能和PHLF发生率对大肝癌患者临床治疗的选择有重要意义。目前常用的术前评估肝功能方法包括肝功能Child-Pugh分级、MELD模型、ALBI分级,以及APRI评分等
[15-16]。本研究所构建的模型纳入五个独立危险因素,包括术前因素(肿瘤直径、ALBI分级、肝硬化、脉管癌栓)和术中因素(术中出血量),AUC达到0.757,对PHLF的发生预测能力良好,且无创、易于获取和计算,对预测PHLF和改善预后有重要意义。
研究
[17]表明,大肝癌手术意味着切除范围更大,术中出血量增多,导致剩余肝体积不足引发PHLF的风险更高。肿瘤直径和术中出血量已被多项研究
[18-19]证实为PHLF独立危险因素。Jeong等
[20]回顾性分析了1 760例HCC患者的临床信息,发现PHLF发生率与肿瘤直径呈正相关,并构建了多因素预测模型,预测效能优异(AUC=0.84)。本研究结果也支持肿瘤直径与PHLF发生的相关性,较大的肿瘤可能增加PHLF的发生风险,强调了肝切除术前评估肿瘤大小的重要性。临床已大规模采用CT/MRI 3D重建技术评估剩余肝体积,明确各血管与肿瘤的解剖位置,如果患者剩余肝体积不足,可暂行门静脉结扎、门静脉栓塞或联合肝脏分隔和门静脉结扎的二步肝切除术,等待肝脏体积增大后再行根治性切除
[21]。
值得注意的是,剩余肝体积测算并不适用于全部患者,3D重建仅能估算肝脏的物理体积,未充分考虑肝硬化及其他基础肝脏疾病对肝功能的潜在影响。国内外研究
[22-23]发现,合并肝硬化的肝癌患者围术期并发症发生率及术后肝癌复发率明显高于无肝硬化组,表明肝硬化不仅影响术后短期恢复,还导致远期生存率下降。本研究结果表明,肝硬化是预测PHLF的独立危险因素之一,应在术前筛查肝硬化及门静脉高压并及时干预。
脉管癌栓是肝癌进展的关键因素,在PHLF的发生中扮演着重要角色。已有研究
[24]证实,脉管癌栓显著增加PHLF风险。癌栓阻塞血管使肝细胞缺血,使代谢功能受损,癌栓使肝脏内血流动力学改变,影响整体的血流灌注,同时,肝癌伴有癌栓手术常需要更大的切除范围、增加手术难度,手术出血增多,间接提高PHLF发生的可能性。本研究同样发现脉管癌栓是预测PHLF的独立危险因素,应结合术前影像学,评估癌栓的数目及位置,提前规划手术方案,提高手术安全性。
ALBI分级是在很多研究中被证实是一种有效的肝功能评估模型,与肝功能Child-Pugh分级相比,排除了易受主观影响的因素,临床不仅常用预测PHLF,还用于肝纤维化分期及肝硬化预后判断
[25-26]。部分研究
[27]显示其预测PHLF的特异性有限,可能与未纳入术中因素及术后指标有关。多项研究
[28-29]证实,ALBI分级是预测PHLF的独立危险因素,且预测效能优于肝功能Child-Pugh分级。潘健团队
[30]将ALBI联合FIB-4指数预测PHLF,发现其效能显著高于使用单一模型预测(AUC=0.867)。本研究将ALBI分级纳入模型,综合了多种因素的影响,提高了本模型的预测能力和准确性。
单个评分模型难以涵盖所以影响PHLF发生的所有因素,越来越多的学者联合术前因素、术中因素、影像学资料建立了综合模型。瞬时弹性成像测量的肝硬度(liver stiffness,LS)是一个反映肝纤维化程度的指标,已被验证是影响PHLF发生的独立危险因素
[31]。有学者
[32]纳入未来剩余肝体积和LS,构建Logistic回归模型,AUC为0.76。部分学者将影像学资料纳入模型,在一项纳入637例患者的单中心研究
[33]中,研究人员分析发现前白蛋白、肝硬化、APRI评分和标准未来剩余肝体积(standardized future liver remnant,sFLR)是发生PHLF的独立危险因素,于是提出了APRI-sFLR联合模型(AUC=0.82),较其他传统模型有优势。但联合模型也存在着一定弊端,在去除术中因素后模型预测效能可能出现显著下滑。
基于机器学习建立预测模型是近年来一个新兴的研究方法。机器学习建立预测模型可以纳入更多的参数,发现数据背后隐藏的规律,较传统模型有更好的预测能力。在一项包含875例患者的多中心队列研究中,Wang等
[34]发现PLT、甲胎蛋白、年龄、肌酐、INR是发生PHLF的危险因素。使用LightGBM算法,将这些因素纳入并建立了机器学习模型。在训练集、验证集、测试集中的AUC分别为0.94、0.87、0.82,预测效能优于传统模型。但是该队列中,94.5%的患者为肝功能Child-Pugh分级A级,需要在多中心数据中验证该模型在肝功能Child-Pugh分级B级和C级中的适用度。当然机器学习的原理至今仍是一个“黑匣子”,仍需要更多地挖掘,促进开发出更优秀的模型。
本研究显示,本模型的预测能量和临床获益高于ALBI分级、APRI评分和FIB-4指数,可能与以下几个因素有关。首先,与传统模型相比,本模型综合了肿瘤直径、ALBI分级、肝硬化、脉管癌栓、术中出血量等多个因素,更全面地评估患者的肝脏储备功能。研究
[34]表明,PHLF的发生与多种因素有关,包括肝功能、免疫状态、手术因素、术后感染等。相比之下,ALBI分级、APRI评分和FIB-4指数仅侧重于术前检验指标,无法提供患者全面的信息。此外,本模型纳入的是肿瘤直径≥5 cm的大肝癌患者数据建模,对目标人群有较好的预测能力,但需要在更多中心、更大样本的队列以及不同类型队列中进行验证,提升预测准确性。
本模型也存在着局限性。首先,模型的准确性依赖数据的质量和完整性,我院的病案系统中缺失ICG R15和剩余肝体积数据,影响了本模型的准确性,部分病例术前肌酐数据缺失,致使无法与MELD模型比较。本研究仅包括两个中心,可能存在信息偏倚和选择偏倚,仍需在更大的样本中进行验证。本研究队列中PHLF B级患者占大多数,分析所得结果偏倚较大,如果能通过优化精准预测B级或C级PHLF,则后续治疗将更有针对性。最后,虽然本研究找到了一些预测PHLF的独立危险因素,但PHLF是一个复杂的多因素联动的过程,还需进一步深入研究来理解其发病机制。
综上所述,本研究纳入肿瘤直径、ALBI分级、肝硬化、脉管癌栓、术中出血量等指标构建了大肝癌PHLF风险预测模型,且预测效能较好,可作为一种简洁、高效的预测模型指导临床治疗。未来,需要在更多中心的队列中验证本模型的准确性和稳定性,不断完善,为临床工作提供指导。