肝细胞癌(hepatocellular carcinoma,HCC)是全球发病率和病死率均居前列的恶性肿瘤,对全球公共卫生构成重大威胁
[1]。由于HCC起病隐匿,多数患者确诊时已属中晚期,预后极差
[2]。此外,HCC具有高度的肿瘤异质性和侵袭性,即便是接受了根治性切除术,术后复发率依旧很高,严重影响患者的总生存期(overall survival,OS)
[2]。传统的HCC预后评估主要依赖于临床病理特征,如肿瘤TNM分期、血管侵犯、肿瘤分化程度等
[3-4]。这些方法虽有价值,但存在明显局限性。首先,病理活检具有侵入性,且单一部位的组织样本难以完全代表整个肿瘤的异质性;其次,传统模型基于有限参数,无法捕捉数据间复杂的非线性关系;预后评估结果的主观性较强,不同医生之间可能存在差异,影响临床决策的一致性
[5]。
近年来,人工智能(artificial intelligence,AI)技术,特别是深度学习(deep learning,DL)和机器学习(machine learning,ML)方法,在医学领域取得了突破性进展,为HCC的精准诊疗带来了新的机遇
[6-7]。AI的核心优势在于其能从海量、高维度的医疗数据中自动学习和提取隐藏的复杂模式,构建出远超传统统计方法的预测模型
[8-9]。在HCC预后评估中,AI的应用主要体现在以下几个方面:首先,基于医学影像的影像组学(radiomics)技术,从CT、MRI等医学影像中提取高通量、可量化的特征,将肉眼不可见的肿瘤异质性转化为数字信息,为预后预测提供丰富的影像学证据
[6,10];其次,基因组学与生物信息学的应用,利用AI算法分析基因表达谱、突变、甲基化等数据,从分子层面揭示与预后相关的生物学标志物;另外,多模态数据融合,整合影像、临床、病理、基因组等多维度数据,构建更全面、更鲁棒的预后预测模型,显著提升预测的准确率和可靠性
[11]。AI模型能够实现预后评估的自动化和智能化,减少主观性,提高效率,为临床决策提供客观依据
[7]。从影像组学到多模态融合,AI技术正在推动HCC预后评估从经验医学向精准医学转变,有望显著改善患者的临床结局。
本综述旨在系统总结近年来AI技术在HCC预后评估及治疗指导中的方法学创新和临床应用转化进展,以期为加速AI在HCC临床实践中的应用提供参考。
1 AI技术在HCC预后中的方法学进展
1.1 影像组学与DL的结合
影像组学旨在从医学影像中提取人眼无法识别的高通量特征,以量化肿瘤的表型信息。DL,特别是卷积神经网络(convolutional neural network,CNN),则能自动完成特征提取和模型构建,两者结合极大地提升了HCC预后评估的效能。
大量研究证实了其临床价值。例如,一项基于多中心数据的研究
[12]利用术前增强CT影像构建影像组学模型,预测HCC患者术后早期复发,其验证集曲线下面积(area under the curve,AUC)达到了0.84,显著优于传统的临床模型。另一项基于MRI和DL的研究
[13]开发了一个同时整合影像组学和DL特征的组合模型来预测HCC患者的术后生存情况,在训练和验证队列中,组合模型在早期复发高风险患者的分层方面比单独的影像组学或DL模型表现出更好的性能(AUC分别为0.911和0.840,准确度分别为0.779和0.777,敏感度分别为0.927和0.769,特异度分别为0.720和0.779)。这些研究结果表明,基于AI的影像组学不仅能够捕捉肿瘤的形态、纹理等信息,还能反映其内部的异质性、血管生成和细胞密度等生物学行为,从而实现精准的预后分层。
1.2 基于基因组学和生物信息学的预后模型
除了影像学特征,肿瘤的基因组学信息是决定其恶性行为和预后的根本因素。AI,特别是各类ML算法,在处理高维、复杂的基因组学数据方面具有天然优势,催生了大量基于生物信息学的预后模型。例如,Chaudhary等
[14]利用DL整合了来自癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库的HCC患者的RNA测序、miRNA测序、甲基化数据和临床数据,构建了一个多组学整合模型,该模型分层了两个最佳的患者亚组,其生存差异显著(
P=7.13×10
-6),且模型拟合度良好(C指数=0.68),并在5个独立外部数据集上进行了验证,C指数为0.67~0.82。另一项研究
[15]通过LASSO-Cox回归模型,从mRNA表达谱中筛选出了一个由10个铁死亡相关基因组成的预后特征,该特征能够将患者有效区分为高、低风险组,两组患者的预后存在显著差异(
P<0.001),并经多个独立队列验证。这些基于基因层面的AI模型,不仅能提供独立的预后信息,还能揭示潜在的治疗靶点,为个体化治疗提供分子层面的依据。
1.3 多模态数据融合模型
单一来源的数据往往只能片面地反映肿瘤的某一特征。为了获得对HCC更全面的认知,融合影像组学、基因组学、临床病理等多维度数据的多模态模型成为研究热点。融合策略主要包括早期融合(在输入层整合数据)、中期融合(在特征层融合)和晚期融合(在决策层融合)
[16-17]。
多项研究证实了多模态融合的优越性。Wang等
[18]结合CT、MRI、临床等多模态数据构建融合模型,结果显示融合模型在预测HCC的微血管侵犯(microvascular invasion,MVI)和预后方面的预测能力均优于单模态模型。类似地,Zhang等
[19]结合CT影像组学特征、临床危险因素(如BCLC分期、ALBI分级)和血清学标志物,开发了一个多模态列线图,其预测术后1年和3年OS的AUC分别达到了0.837和0.845,展现出卓越的临床实用性。这些模型通过互补不同数据源的信息,更精准地刻画了肿瘤全貌,从而实现了更稳健、更准确的预后预测。
2 AI在HCC预后评估与治疗指导中的临床应用
2.1 术后复发与生存预测
术后复发和生存预测是HCC预后评估的重要内容,直接关系到患者的治疗策略和长期生存。AI技术在HCC术后复发和生存预测方面展现出巨大的潜力。研究者利用AI模型,结合临床特征和影像组学特征,开发了多种综合预测模型,用于评估HCC患者术后复发和生存风险。
列线图(nomogram)是一种常用的临床预测工具,能够将多个预测因素整合到一个可视化图表中,方便临床医生进行个体化的风险评估
[20-21]。研究者利用ML算法,结合临床特征(如性别、肝硬化、肿瘤大小、甲胎蛋白水平)和影像组学特征(如肿瘤纹理特征、形态特征等),构建了HCC术后复发和生存预测的列线图
[22-24]。这些列线图能够将患者分为不同的风险分层,指导临床医生制定个体化的随访和治疗计划。Yan等
[25]开发的一款基于MRI影像组学特征和DL的列线图,能够有效预测HCC患者的术后早期复发,其在验证集中的AUC为0.909,为高危患者的辅助治疗决策提供了依据。Liu等
[26]则利用CT影像组学特征评分,结合临床病理因素(肿瘤大小、MVI)和血液标志物(甲胎蛋白、血小板与淋巴细胞比值)构建列线图,结果显示在训练队列中具有良好的OS预测准确率(C指数=0.747),并在验证队列中得到证实(C指数=0.777),表明整合影像组学特征的影像组学列线图比临床病理列线图能更准确地评估肝切除术后HCC患者的OS。
MVI是HCC术后复发的关键独立危险因素,但其诊断依赖于术后病理。AI技术,特别是影像组学和DL,为MVI的术前无创预测提供了可能。研究表明,基于CT和MRI影像组学特征构建的AI模型,能够有效预测HCC的MVI状态和分级
[18,27]。例如,一项基于DL的研究
[28],利用术前增强MRI影像预测MVI状态,其DL模型获得了较高的MVI预测准确率,训练集的AUC值为0.918,内部测试集的AUC值为0.800,为术前制定更激进的手术范围或辅助治疗方案提供了重要参考。
2.2 治疗反应评估与决策优化
治疗反应评估是HCC治疗过程中的关键环节,能够及时了解治疗效果,调整治疗方案。AI在评估和预测不同治疗方案的反应方面也显示出巨大潜力。传统的实体瘤疗效评价标准仅测量肿瘤直径变化,难以准确反映经动脉化疗栓塞术(transarterial chemoembolization,TACE)等治疗的真实疗效。Moawad等
[29]开发了一种自动化的AI体积定量工具,能够精确评估TACE术后肿瘤的存活体积,比传统二维测量更准确地预测患者的OS。
对于免疫和靶向治疗,筛选优势人群是关键。Bo等
[30]利用ML分析了接受仑伐替尼治疗的不可切除HCC患者的基线CT影像,构建的影像组学模型能够有效预测治疗反应,其AUC达到了0.97,且在验证队列中相对稳定(AUC=0.93),有助于在治疗早期识别出仑伐替尼治疗可能获益的患者。一项来自中国9个医疗中心的回顾性研究
[31]发现,从治疗前MRI提取的影像组学特征可以预测不可切除或晚期HCC患者对仑伐替尼联合PD-1抑制剂治疗的个体化客观疗效,其预测价值优于临床病理特征,并且与该联合治疗方案后的OS和无进展生存期相关。同样,另一项研究表明
[32],基于治疗前CT影像的ML模型可以有效预测接受介入联合仑伐替尼及PD-1抑制剂治疗的HCC患者的疗效,临床-影像组学模型(AUC=0.912)优于单独的影像组学模型(AUC=0.900)和临床模型(AUC=0.669),为实现联合治疗的个体化提供了新思路。近期,Vithayathil等
[33]利用DL自动分割技术并根据治疗前的CT影像生成全肝图像,再结合7种ML模型和13种特征选择技术,开发并验证了影像组学-临床整合模型,该模型可以根据治疗前的影像数据预测阿替利珠单抗联合贝伐珠单抗治疗的OS和疗效,从而对接受阿替利珠单抗联合贝伐珠单抗治疗的晚期HCC患者进行风险分层。AI在HCC术后预后预测和治疗反应评估的代表性研究详见
表1。
3 挑战与未来方向
3.1 技术瓶颈
尽管AI技术在HCC预后评估中取得了显著进展,但仍面临一些技术瓶颈和挑战。高质量、大规模且经过专家精细标注的数据集是训练稳健AI模型的基础。但医学数据常存在中心间异质性大、信噪比低等问题,且人工标注成本高昂,限制了模型开发
[38]。因此,如何提高医学影像数据的质量,降低标注成本,是未来AI技术发展的重要方向。许多先进的AI模型(尤其是DL)如同“黑箱”,其决策过程不透明,这与临床实践中对因果关系和决策依据的严格要求相悖,阻碍了医生的信任和临床采纳
[39]。因此,开发可解释性AI技术是当前的研究重点。
3.2 临床转化障碍
将AI技术无缝整合到现有医疗流程中也面临挑战。需要建立标准化的数据采集、处理和模型部署流程。目前大多数研究仍局限于单中心或小样本数据,模型在外部多中心、真实世界数据中的表现往往会下降
[40]。前瞻性、多中心的大规模临床验证是AI模型从研究走向临床的必经之路。同时,如何设计高效的人机交互界面,使AI的输出能被医生直观理解并用于辅助决策,而非增加其工作负担,是决定AI技术能否成功落地的关键
[41-42]。因此,需要加强医生和AI工程师之间的合作,共同设计和优化医生-AI协同工作流程,提高AI技术在临床实践中的应用效率。此外,相关的伦理和法规框架仍有待完善。
3.3 未来发展趋势
未来,AI技术在HCC预后评估领域将朝着以下几个方向发展:(1) 生成式AI模型,如生成对抗网络,能够合成高度逼真的医学影像数据,有望在保护患者隐私的前提下,扩充训练数据集,解决小样本问题,提升模型的鲁棒性
[43-44]。(2) 未来的预后评估系统将不再局限于单一任务,而是朝着融合病理、影像、基因组、临床等多学科信息,覆盖从早期筛查、诊断、治疗选择到预后监测的全链条、一体化智能决策支持系统发展
[45]。(3) 联邦学习,为了在不共享原始敏感数据的情况下进行多中心模型训练,联邦学习提供了一种有效的解决方案。各个医疗机构可以在本地数据上训练模型,仅共享模型参数,从而在保护数据隐私的同时,构建出泛化能力更强的全局模型。
综上所述,AI技术通过整合影像组学、基因组学等多维数据,正在深刻地改变HCC预后评估和治疗决策的模式。AI模型在预测术后复发、评估治疗反应和筛选优势治疗人群等方面,已展现出超越传统方法的巨大潜力,有力地推动HCC诊疗从“经验医学”向“精准医学”迈进。然而,其临床转化之路依然面临数据、算法可解释性、外部验证和临床整合等多重挑战。未来,通过技术创新(如生成式AI、联邦学习)和跨学科的紧密协作,攻克现有瓶颈,必将加速AI技术从实验室到临床床旁的转化,最终为广大HCC患者带来切实的生存获益。
湖南省怀化市科学技术局科技计划基金资助项目(2018N2503)