我国肝癌疾病负担沉重,年死亡病例约40万,占全球肝癌总死亡数55%,64%患者初诊即为中晚期,丧失手术切除机会
[1-4]。经导管化疗栓塞(transcatheter arterial chemoembolization,TACE)联合射频消融(radiofrequency ablation,RFA)作为中晚期肝癌核心治疗方案,虽能使5年生存率提升,但1年后复发率仍高达35%~48%,个体疗效差异显著
[5-7]。因此,治疗前精准预测疗效、筛选适宜患者,是优化治疗决策的关键。
目前,增强电子计算机断层扫描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)作为传统肝癌疗效评估手段,在肿瘤微循环动态显示与组织弹性定量方面存在局限性
[8]。CT依赖碘对比剂且有辐射风险,难以实时捕捉微血管血流灌注
[9];MRI检查耗时、费用高,强磁场干扰剪切波传播影响弹性模量测量精度
[10-11]。相较之下,超声技术凭借实时动态成像、无辐射、可床旁操作及多模态融合等优势,在多种疾病诊疗中独具价值
[12]。其中,超微血管成像(superb microvascular imaging,SMI)可显示直径<50 μm的肿瘤微血管网络,与病理状态下微血管密度的表达具有强相关性(
r=0.91),可以反映血管生成与血流动力学特征
[13-14];剪切波弹性成像(shear wave elastography,SWE)则能快速定量测量肿瘤弹性模量,体现基质硬度与纤维化程度
[15-16],二者分别从功能成像与生物力学特性层面提供互补信息。结合机器学习(ML)强大的数据分析与模式识别能力
[17-18],有望挖掘影像学特征潜在关联,构建中晚期肝癌TACE联合RFA术后复发的精准预测体系。本研究旨在探索该联合模型的预测价值,为临床精准诊疗提供依据。
1 资料与方法
1.1 研究人群
回顾性纳入2022年6月—2024年6月宁夏医科大学总医院收治的343例原发性肝癌患者,所有患者均接受SMI与SWE检查。纳入标准:(1) 符合《原发性肝癌诊疗指南(2024年版)》中巴塞罗那临床肝癌(Barcelona Clinic Liver Cancer,BCLC)分期B/C期诊断
[9];(2) 肝功能Child-Pugh分级A/B级;(3) 肿瘤最大径≤10 cm且数目≤3个;(4) 术后未联合其他局部或系统性治疗且随访时间≥6个月。排除标准:(1) 合并其他恶性肿瘤或严重肝外转移;(2) 既往接受肝切除、射频消融或其他介入治疗;(3) 超声图像质量不达标;(4) 失访或临床资料缺失;(5) 妊娠或哺乳期女性。最终入组215例患者,其中无复发组(
n=139)和复发组(
n=76)。纳排标准流程图见
图1。无复发组患者年龄29~78岁,平均(55.48±9.66)岁,男性87例、女性52例;复发组患者年龄31~75岁,平均(55.46±10.15)岁,男性50例、女性26例。本研究经医院伦理委员会批准(批件号:KYLL-2023-0581),遵循《赫尔辛基宣言》原则。
1.2 超声测量及影像评估
采用GE Healthcare LOGIQ E10超声诊断仪,配备C1-6-D凸阵探头(频率范围1~6 MHz,深度调节15~20 cm)及ML6-15-D线阵探头(频率范围6~15 MHz,聚焦区域3~5 cm),由≥5年腹部超声诊断经验的副主任医师操作。患者取仰卧位/左侧卧位,常规灰阶超声定位病灶后,切换SMI模式(帧频≥30 Hz,动态范围50~60 dB)测量肿瘤微血管密度、分支数及迂曲度;SWE模式下(激励频率100~500 Hz,弹性量程0~50 kPa)获取肿瘤及瘤周组织弹性模量。所有影像数据以DICOM格式存储,通过AI-Lab平台提取特征参数,由2名医师独立测量取均值,确保数据标准化及可重复性。
1.3 观察指标
观察指标包括:(1) 基线临床特征记录年龄、性别、吸烟史、饮酒史、乙型肝炎病史、丙型肝炎、术前肿瘤数、术前肿瘤最大径及肝功能Child-Pugh分级。(2) 生化检测于TACE-RFA序贯治疗后3个月采集空腹静脉血,涵盖血常规[白细胞计数(white blood cell count,WBC)、红细胞计数(red blood cell count,RBC)、血红蛋白(hemoglobin,Hb)、血小板计数(platelet count,PLT)]、肝功能[丙氨酸氨基转移酶(alanine transaminase,ALT)、天门冬氨酸氨基转移酶(aspartate transaminase,AST)、总胆红素(total bilirubin,TBIL)、白蛋白(albumin,ALB)]及肿瘤标志物[甲胎蛋白(alpha-fetoprotein,AFP)、癌胚抗原(carcinoembryonic antigen,CEA)、糖类抗原19-9(carbohydrate antigen 19-9,CA19-9)]。(3) 超声参数,SMI评估微血管密度(microvascular density,MVD)分级(低:≤5条/cm2,中:6~10条/cm2,高:>10条/cm2)及血管形态;SWE测量最大弹性模量(maximum elastic modulus,Emax)、平均弹性模量(mean elastic modulus,Emean)及弹性比值(elastic ratio,Eratio)。
1.4 模型构建及可视化
采用随机森林(random forest,RF)、支持向量机(support vector machine,SVM)、极限梯度提升算法(eXtreme Gradient Boosting,XGB)三种ML算法对筛选变量进行重要性排序,各取排名前10的变量取交集后作为输入,经双向逐步Logistic回归确定复发预测因子。将患者按7∶3比例随机分层,分为训练集(共150例,无复发组97例,复发组53例)与测试集(共65例,无复发组42例,复发组23例),Z-score法标准化连续变量后,单因素分析(P<0.1)筛选相关特征构建多模态向量。应用逻辑回归(Logistic regression,LR)、SVM、RF、XGB、朴素贝叶斯法(naive Bayes model,NBM)、决策树(decision tree,DT)和SVM 7种算法建立预测模型,所有模型的超参数均通过在训练集上进行网格搜索结合10折交叉验证进行优化。以XGBoost为例,优化参数包括学习率(范围:0.01,0.05,0.1)、最大树深(范围:3,5,7)、子样本比例(范围:0.7,0.8,0.9)等。以测试集数据计算曲线下面积(area under the curve,AUC)、敏感度、特异度、阳性预测值、阴性预测值、精确度、召回率及F1值筛选最佳模型。采用Tree SHAP框架可视化关键特征贡献度,解析复发影响因素。
1.5 随访方案与终点判定
患者于治疗后均接受规律性随访,标准化方案为术后第1个月进行首次复查,此后每3个月定期随访。研究主要终点—影像学复发的判定,综合参照我国《原发性肝癌诊疗指南(2024年版)》及肝脏影像报告和数据系统治疗反应(LI-RADS-TR)国际标准。复发的影像学定义为:在对比增强CT或MRI(方法学首选)检查中,于肝内出现的直径≥1 cm的新发结节,且需同时满足动脉期呈显著强化、并于门静脉期或延迟期出现“廓清”的典型特征。所有疑似复发病例的影像资料均经由至少2名具有5年以上腹部影像诊断经验的医师进行双盲独立审阅,如遇诊断分歧,则提请第3位资深医师仲裁或提交多学科团队讨论,以确保终点判定的客观性与准确率。
1.6 统计学处理
采用SPSS 26.0与R4.4.0进行数据分析。计量资料以均数±标准差()或中位数(四分位数间距)[M(IQR)]表示,组间比较采用独立样本t检验或Mann-Whitney U检验;计数资料以频数(百分比)[n(%)]表示,组间比较采用χ2检验或Fisher确切概率法。Delong检验比较受试者工作特征(receiver operating characteristic,ROC)曲线AUC差异,Bonferroni法校正多重比较。ML算法在训练集(70%)进行10折交叉验证调参,测试集(30%)验证泛化性能。Tree SHAP值计算采用Tree Explainer算法,通过shapviz包可视化特征贡献度。所有检验均为双侧,P<0.05为差异有统计学意义。
2 结 果
2.1 患者资料
训练集中无复发患者97例,复发患者53例。无复发组与复发组在乙型肝炎比例、术前肿瘤最大径、ALT、TBIL、ALB、AFP、Emax、Emean、Eratio、MVD分级及血管分布方面差异有统计学意义(均
P<0.05)(
表1)。典型无复发与复发患者的超声特征见
图2。
2.2 预测变量筛选
采用三种ML算法(RF、SVM及XGB)对所筛选的变量进行重要性排序,结果显示,RF算法得到排名前10的变量分别为AFP、Eratio、Emean、Emax、ALT、术前肿瘤最大径、MVD分级、ALB、血管形态和乙型肝炎;SVM算法得到排名前10的变量分别为Eratio、Emax、ALB、Emean、血管形态、术前肿瘤最大径、AFP、MVD分级、TBIL和ALT;XGB算法得到排名前10的变量分别为Emax、Eratio、AFP、Emean、TBIL、ALB、术前肿瘤最大径、乙型肝炎、ALT和血管形态(
图3A-C)。利用维恩图对三种ML算法筛选的10变量取交集得到8个模型预测因子(
图3D),包括AFP、Eratio、Emean、Emax、ALT、术前肿瘤最大径、ALB及血管形态。经双向逐步Logistic回归筛选后,术前肿瘤最大径(
OR=1.968,95%
CI=1.135~4.584)、AFP(
OR=1.008,95%
CI=1.001~1.018)、Emax(
OR=1.199,95%
CI=1.055~1.508)、Eratio(
OR=12.559,95%
CI=5.379~32.136)及血管形态(
OR=7.051,95%
CI=1.400~15.080)五个预测因子具有统计学意义(均
P<0.05)(
表2)。
2.3 ML特征
将筛选出的5个预测因子,在训练集和测试集中使用7种ML算法构建预测模型。在建模过程中,重复5轮10折交叉测试和网格搜索参数优化。结果表明,XGB模型在训练集/测试集上均具有最高的AUC(0.989和0.959)(
图4A-B)。此外,其各性能指标在训练集/测试集中优于其他模型(
表3)。决策曲线分析(decision curve analysis,DCA)评估结果显示,XGB分别于训练集/测试集的0.12~1.00和0.06~1.00的阈值范围内具有最高的净收益(
图4C-D)。且其Brier评分值在训练集/测试集中最低(0.034,0.056)(
图4E-F)。综上,XGB为效能最佳模型。
2.4 Tree SHAP模型解释
Tree SHAP蜂窝图显示,XGB模型中每个特征对中晚期肝癌TACE-RFA序贯治疗术后复发的重要性,结果表明,Eratio、Emax、术前肿瘤最大径、AFP及血管形态共五个指标依次与术后复发之间存在高度相关性(
图5A)。术后复发的Tree SHAP Waterfall图结果显示,紫色条降低分类得分,黄色条增加分类评分,起始预测基准值f(x)=-4.46,Eratio、AFP、血管形态不规则、术前肿瘤最大径>5 cm依次施加负向影响,贡献值分别为-1.35、-1.29、-1.26、-0.693,使预测值逐步变化;最终低Emax施加正向影响,贡献值+0.57,最终预测期望E[f(x)]=-0.449。其中高Eratio值贡献最大的负向得分(-1.35),低Emax值贡献正向得分(0.57)(
图5B)。
3 讨 论
中晚期肝癌TACE-RFA序贯治疗术后30%~40%的高复发率是临床难题,传统影像学因聚焦解剖形态、难捕捉肿瘤微环境血管生成与基质力学协同变化,导致复发预测受限。本研究创新整合SMI-SWE多模态超声与ML构建预测模型,为个体化精准治疗提供新路径。
研究发现,无复发组与复发组在乙型肝炎病毒感染状态、肿瘤负荷、肝功能储备、肿瘤生物学标志物及超声形态学参数等维度存在显著差异,为术后复发风险预测提供关键线索。乙型肝炎病毒感染通过重塑肝脏免疫微环境与纤维化进程,促进肿瘤细胞的侵袭与转移,增加术后复发风险
[19];术前肿瘤最大径每增加1 cm,复发风险升高1.968倍(95%
CI=1.135~4.584),表明肿瘤负荷是影响术后复发的基础因素
[20];AFP水平每升高1 ng/mL,复发风险增加1.008倍(95%
CI=1.001~1.018),证实其作为肿瘤活性标志物对复发预测的重要价值
[6];Emax与Eratio反映的肿瘤硬度差异中,Eratio的
OR值高达12.559(95%
CI=5.379~32.136),提示肿瘤与正常肝组织的硬度对比是预测复发的核心参数,这可能与局部治疗时能量传导效率、肿瘤细胞对治疗的耐受性及组织修复过程中的纤维化程度密切相关。研究
[21]表明,高Eratio值不仅反映肿瘤内部的硬度,更可能提示了瘤周组织显著的纤维化(即“硬度屏障”)。这种屏障在物理上会阻碍TACE术中化疗药物在瘤周的充分渗透以及RFA过程中热能的均匀扩散,从而导致肿瘤消融不彻底,成为术后复发的潜在病灶
[22];“不规则血管形态”(如紊乱分支型、穿入型)不仅是影像学表现,其背后往往与肿瘤VEGF等高表达所驱动的异常血管生成密切相关
[23-25]。本研究中血管形态不规则的
OR=7.051(95%
CI=1.400~15.080),表明异常微血管构型可通过影响TACE栓塞效果与RFA热沉降效应,导致肿瘤残留进而增加复发风险
[26]。通过严格的变量筛选,剔除存在多重共线性的Emean(与Emax强相关,Spearman
r=0.89,VIF>10)及冗余指标(ALT、ALB预测价值被AFP取代,MVD分级信息被血管形态覆盖),最终确定的5个独立预测因子从肿瘤负荷、力学微环境及血管生成三个维度,全面覆盖与术后复发密切相关的关键要素,且均为临床易获取指标,具有较强的实用性与代表性。
中晚期肝癌TACE-RFA术后复发预测中,传统研究依赖单一模态影像、临床指标或病理图像深度学习,存在信息单一、应用受限问题。近期有研究采用基于CT/MRI的深度学习模型结合临床数据,取得了优异的预测性能(AUC=0.994)。与依赖昂贵、非实时、有辐射/造影剂风险的CT/MRI影像的深度学习模型相比,超声具有实时、无创、可床旁重复、成本低廉等优势
[27-28]。此外,本研究创新性整合SMI-SWE多模态超声与ML构建模型,其XGB模型训练集/测试集AUC达0.989/0.959,较既往深度学习分析病理图像
[29](AUC=0.724/0.683)或结合临床数据
[30](AUC=0.87)显著提升,且DCA显示在训练集0.12~1.00、测试集0.06~1.00阈值范围净收益最优,Brier评分值最低,在预测准确率、稳定性及临床实用性上实现突破。该模型通过SMI捕捉肿瘤微血管与血流动力学特征、SWE量化基质硬度与纤维化程度,并结合AFP及肿瘤最大径等临床指标,多维度反映肿瘤微环境与治疗反应机制。Tree SHAP分析进一步量化显示,高Eratio值(-1.35)显著增加复发风险,低Emax值(0.57)则降低复发风险,明确多因素作用权重,弥补单指标研究不足。临床中该模型可辅助术前风险分层,指导高风险患者个性化治疗(如优化RFA参数、联合抗血管生成/抗纤维化治疗),为TACE-RFA精准管理提供支撑,有望降低复发率、改善患者长期预后。
本研究存在一定局限性:单中心样本量有限,可能产生选择偏倚;未纳入长期生存数据,影响模型的预后评估;ML模型缺乏外部验证,普适性待考。未来可通过扩大样本量,与不同地域、不同级别的医院(特别是与东部沿海高发病率地区的医疗中心)合作,开展前瞻性、多中心的外部验证研究,以检验和优化模型的普适性,同时可以结合循环肿瘤DNA、肿瘤来源外泌体等液体活检指标,从分子层面实时监测肿瘤的基因组变异、微小残留病灶及异质性演变。综上,SMI-SWE多模态超声联合机器学习模型对中晚期肝癌TACE-RFA序贯治疗术后复发预测准确率较高,具备临床应用潜力,为个性化诊疗提供新依据。