胆道肿瘤(biliary tract cancers,BTC)是一组源于胆道上皮细胞的罕见恶性肿瘤,根据解剖学分类,BTC可分为肝内胆管癌(intrahepatic cholangiocarcinoma,iCCA)、肝外胆管癌(extrahepatic cholangiocarcinoma,eCCA),后者包括肝门部胆管癌(perihilar cholangiocarcinoma,pCCA,又称Klatskin瘤)、远端肝外胆管癌(distal extrahepatic cholangiocarcinoma,dCCA)以及胆囊癌(gallbladder cancer,GBC)
[1],在高收入国家年发病率约为每50 000人1例
[2],尽管罕见,但其发病率和病死率近年来呈稳步上升趋势
[3]。
BTC因晚期表现、非特异性症状的偶然发现、肿瘤的快速进展及向邻近淋巴结转移的能力增加了管理难度
[4]。因尚未发现特异性肿瘤标志物,目前尚无针对BTC的筛查方案。这些挑战促使我们思考如何利用人工智能(artificial intelligence,AI)来管理BTC。AI是指能够模拟人类智能并执行人类任务的机器和算法,涵盖了机器学习(machine learning,ML)、深度学习(deep learning,DL)、自然语言处理、计算机视觉等方面
[5-7]。其在医学领域显示出了巨大的应用前景,尤其在医学影像分析、病理切片识别、分子靶点筛选、液体活检等领域展现出独特的优势,在疾病的诊断、治疗、预后等全过程均可发挥重要作用。
ML在医学领域展现出很大的潜力和进展,DL是ML的一个子集。当前关于DL与BTC的文献主要集中在卷积神经网络(convolutional neural networks,CNN)、人工神经网络(artificial neural networks,ANN)和循环神经网络(recurrent neural networks,RNN)。不同神经网络的核心功能及其在BTC的应用场景见
表1。CNN主要处理图像数据
[8],ANN和RNN主要处理序列数据以及进行数据分类、回归,具有高度灵活性
[9],Transformer用于处理自然语言(包括口头和书面语言)的能力,可用于分析大量文本形式的内容(如电子病历,特别是非结构化的叙述性临床笔记)
[10]。结合不同网络和Transformer的AI模型能够以多种方式处理不同类型的数据,以满足AI在BTC领域的主要任务需求。
1 AI在BTC中的应用
1.1 诊断
BTC具有迟发表现的特点,因此建立高效的诊断模型对改善BTC检出率至关重要。目前美国癌症联合委员会(American Joint Committee on Cancer,AJCC)第8版癌症分期手册的TNM系统
[11]是指导BTC诊断和治疗策略的主要分类标准,血清糖类抗原19-9(CA19-9)(特异度约83%,敏感度约78%)和血清癌胚抗原(CEA)是两种常规用于BTC诊断评估的血清肿瘤标志物
[12],然而尚未发现诊断BTC令人满意的特异性的公认肿瘤标志物。此外,目前专门用于BTC风险分层的AI模型较为稀缺,因为这些模型通常与诊断或预后评估模型联合使用。传统的风险分层模型仅能基于已知风险因素(如胆石症、女性、年龄、吸烟史、胆囊切除和子宫切除史、绝经状态等)进行独立评估
[13]。
Watcharatanyatip等
[14]开发了一种采用转化蛋白质组学方法的模型,可革新胆管癌(cholangiocarcinoma,CCA)新型生物标志物检测方法的发现和验证,从而实现早期检测。Li等
[15]成功构建了一个创新的ML模型,利用病理因素和临床参数建立了个性化评分系统。该评分系统采用3个ML模型和Cox回归评估27个不同的临床独立变量,结果显示其C指数[0.693(95%
CI=0.663~0.723)]显著高于AJCC第8版和日本肝癌研究小组(LCSGJ)分期系统[0.671(95%
CI=0.602~0.740)]。加权长短期记忆网络深度学习模型(weighted long short-term memory network,SW-LSTM)对BTC风险因素及其相关趋势进行了研究,结果发现,该模型相较于传统模型具有更高的准确率,而且在年龄标准化死亡率与高体质量指数(bady mass index,BMI)的关系上,显示显著的性别差异,高BMI对女性的影响约为男性的1.98倍
[16]。
BTC的确诊仍需结合医学影像学和组织病理学取样
[17]。怀疑BTC时首选CT检查。多期增强CT扫描可观察肿瘤情况,并准确评估血管侵犯;PET扫描可更明显地评估淋巴结转移
[18]。MRI能更精细地显示胆道树解剖结构,为手术切除和重建提供重要信息。磁共振胆胰管成像(magnetic resonance cholangiopancreatography,MRCP)的优势在于鉴别良恶性病变,具有较高的特异度和敏感度
[19]。超声内镜可提供安全微创的诊断成像,而更具侵入性的内镜逆行胰胆管造影兼具诊断和治疗双重功能。这些影像学检查的放射组学特征分割数据使得AI模型能够对BTC进行分类、分期和诊断。
从全切片图像(whole slide images,WSI)2D图像和高光谱图像(hyperspectral images,HSI)3D信息中提取的组织病理学数据已被证明有效,其中后者显示出分类精度高和应用前景好
[20]。HSI可在像素和不同波段水平提取显微数据,从而通过分析像素模式区分癌组织和非癌组织
[21]。Chaiteerakij等
[22]研究发现,采用ML区分局灶性肝脏病变(focal liver lesions,FLL)时,胆管癌检测准确率达92.2%。Marya等
[23]通过胆管刷状细胞学结合基于网络的计算机辅助检测和诊断系统,发现AI方案在区分良恶性WSI方面比细胞学家更高效且准确率相当。区分肝细胞癌和iCCA是另一个关键诊断步骤。Zhang等
[24]利用血浆游离DNA(cell-free DNA,cfDNA)片段组学,开发了一种成本效益高且敏感(iCCA达100%)的集成堆叠ML模型,用于鉴别iCCA与其他肝脏病变(如原发性肝脏病变和HCC)。Ito等
[25]的ML模型LiquidPlex通过胆汁和cfDNA液体活检这种革命性无创诊断方式,能够对肿瘤衍生变异进行分类。尽管样本量较小导致结论尚不明确,但为液体活检和肿瘤标志物鉴定领域开辟了新途径。这些技术模型的效能对比见
表2。
另一种DL算法—胆囊癌水平-垂直变换器(GBC Horizontal-Vertical Transformer,GBCHV)结合了具有自注意力机制的GBCHV-Trans块,使用来自具有挑战性的胆囊癌超声检查(Gallbladder Cancer Ultrasound,GBCU)数据集的超声图像将GBC准确分类为良性、恶性和正常类别,并通过进行消融研究实现了96.21%的总体诊断准确率
[26]。Kumar等
[20]采用CNN和3D U-Net算法,显示其分类准确率比SegNet、CPFNet和IANet等流行神经网络高4.29%。Xiang等
[27]通过比较放射科医师与DL算法ResNet50对CT图像的判读准确率,发现DL的曲线下面积(AUC)达0.864,显示出超越人类放射科医师的优势。Gupta等
[28]的前瞻性研究也证实,自动DL分类器的诊断能力优于放射科医师。除提高BTC诊断准确性外,AI模型还能减少诊断延迟。Zhou等
[29]开发的空间通道特征融合卷积神经网络(spatial-channel feature fusion convolution neural network,DCFCNN)不仅能对CCA组织病理图像进行分类,且与AlexNet、Vgg19_bn、ResNet152和DesNet161等模型相比,具有最好的综合性能,如与DCFCNN相比,Vgg19_bn花费的测试时间更少(7.82 s
vs. 8.27 s),但训练时间更长(4 187.19 s
vs. 2 975.05 s);AlexNet的训练时间和测试时间都低于DCFCNN,但DCFCNN的分类性能明显好于AlexNet。这些AI诊断模型可改善BTC发现晚,诊断准确率低的现状,从而为BTC患者带来福音。
1.2 预后
术后复发风险、中位生存率、无进展生存期、辅助治疗、微血管侵犯等生存指标可单独或联合评估。将术后参数与术前临床数据结合可构建强大的临床预测模型。Müller等
[30]基于这一思路编成了一个ANN,并将其准确率与已知的预后评分系统复旦评分
[31]进行比较,结果显示ANN优于复旦评分。另一方面,Yin等
[32]采用3D-DenseNet将TNM分期系统与放射组学结合,预测GBC患者的1、3、5年生存率的AUC分别为0.827、0.865、0.926。随着疾病分期的增加,5年生存率呈下降趋势
[33]。另一项研究
[34]利用CT和MRI图像的放射组学特征及临床数据进行术前预后预测,发现其预测准确率与术后预后相当。前文提到BTC缺乏高特异性肿瘤标志物,但Liao等
[35]研究表明,采用差异表达基因的ANN模型对CCA的AUC可达0.980。该研究还发现SPARCL1在肿瘤免疫环境中的疾病特异性生存方面可能发挥保护作用。
1.3 治疗策略
预后评估可用于指导临床医生制定BTC患者的治疗方案。治疗方案取决于BTC的分期和转移情况。此外,提高HCC等其他原发性肝癌与CCA的鉴别能力有助于制定治疗策略。Liu等开发的DL算法能准确区分肿块型iCCA与HCC,准确率约92.26%。术后,Xiang等
[36]、Zhan等
[37]、Gao等
[38]描述的各种DL模型可用于预测微血管侵犯、神经周围侵犯和淋巴结转移(lymph node metastasis,LNM),从而决定是否进行辅助治疗及再次手术。AI在术中的应用最初局限于机器人手术及相关领域,现已进一步发展至常规影像(如CT、MRI、超声)中的识别功能,可辅助外科医生实现R
0切除,获得更好结果。Wolff等
[39]采用光学相干断层扫描实现了这一目标。此外,创新模型MC-GAT利用HSI在术中实时分类CCA的高光谱病理图像,可能对手术结果产生深远影响
[40]。
1.4 复发
由于BTC表现较晚,其转移率约为31%~43%
[41]。BTC转移可分为局部侵犯、LNM、远处转移、神经周围侵犯和血管侵犯(如门静脉侵犯)。一项研究
[42]显示BTC的复发和病死率较高,1、3、5年总生存率分别为75%、37%、22%。
Ji等
[43]CT影像组学方法评估LNM与无复发生存的关系,发现LNM风险越高,无复发生存期越短。Ruan等通过遗传和蛋白质分析(蛋白质组和转录组数据)设计的ML算法(EMLI-Metastasis)在评估蛋白质组数据时准确率达97.1%,评估转录组数据时为85%,可实现BTC转移进展的早期检测。Perez等
[44]开发的LASSO规则化Cox回归模型通过评估淋巴结比率、神经周围侵犯、N分期(TNM分期)、手术根治性和分化等级等参数预测dCCA复发,AUC达92.4%。Song等
[45]利用CA19-9、肿瘤边缘和血管侵犯评估iCCA患者术后早期复发的可预测性,与AJCC TNM分期相比,AUC为0.974。Xu等
[46]进一步采用5折交叉验证技术的DL模型对半肝切除患者的复发预测准确率达89.41%。一项研究
[47]采用极端梯度提升(eXtreme Gradient Boosting,XGBoost)ML模型表明,年龄、术前CA19-9水平、肿瘤分化程度和大小及LNM是早期复发的五个重要预测因素。年龄是复发的影响因素也是影响iCCA手术患者生存率的重要因素,年轻患者的手术预后优于老年患者
[48]。因此,用于复发预测的AI模型能够使外科医生评估患者的复发情况,从而及时干预。
2 AI在BTC临床转化中的挑战与展望
在整理和研究所获文章的过程中,笔者注意到关于AI及其在BTC中应用的文献数量庞大,在PubMed、Scopus和Web of Science数据库的初步搜索结果显示超过3 645篇相关文章。自2021年起,相关主题的文章数量急剧增加,呈现指数级增长,2024年达到顶峰。这表明AI在医学领域的重要性已得到广泛认可。然而,就本综述描述的AI模型的临床应用而言,距离全面整合仍面临重大挑战,但笔者认为这一趋势不可避免。笔者还注意到基于影像组学数据的AI模型非常丰富。这可以追溯到1976年首个用于X射线和MRI图像处理的AI模型CASNET(Convolutional Auxiliary Supervision Network)
[49]。此后,AI迅猛发展,大数据的兴起、计算能力的提升和ML的进步共同推动了AI的发展及其在各种任务中的辅助能力
[50]。
然而,了解AI的缺陷以及研究未来如何最小化这些缺陷至关重要,以便未来开发更强大的AI系统来推进患者护理。在数据领域,必须认识到AI的工作依赖于提供的数据集。因此,任何有偏见、不完整或错误的数据都会反映在结果中。因此联邦学习提升数据多样性,建立经过严格监督和审查,具有全球意义的标准化数据集很有必要,可以减少数据收集的误差。其次,AI模型的数据训练多来自单中心,使得模型的泛化性减弱。此外,本文描述的AI系统处理的数据集具有特定和有限的基本特征(如年龄、性别、国籍、人种等),因此这些AI模型的结果不能在全球范围内解释,限制了其在大规模流行病学中的应用,且阻碍了普适性。由于AI仅限于提供的数据集,如果某项任务没有足够的数据量,结果就会出现偏差。尝试通过生成式AI(如Flamingo-CXR
[51])解决这一问题,该模型基于现有图像生成合成图像。
一个重要的概念源于某些AI算法的“黑箱”性质,即AI完成任务后呈现结果的过程不为人知。这引发了临床医生对输出结果可信度的怀疑,因为无法解释得出结论的过程
[52]。而可解释AI(XAI)工具的使用(如LIME),可用于解释结果并提供其背后过程的合理化,增加结果透明度
[53]。因此,需要AI开发人员和临床医生共同努力,创建更适合医疗保健系统并能提供高效支持的新模型。
在实际临床应用中,AI模型的全面整合仍有难度,需适配现有的影像系统,同时由于跨学科合作不足,AI模型的研发和临床转化目前具有一定的障碍
[54]。因此合作对于推动创新和确保AI安全有效地融入胆道护理至关重要。放射科医师、数据科学家和监管机构之间的跨学科努力有助于建立强有力的指南,并为AI驱动的胆道病理管理进步铺平道路。
在伦理方面,除了要保证所获得的包含患者隐私信息的医疗数据符合伦理规范外,也要明确AI决策责任归属,因为模型的决策可能影响患者的生命健康,如何确保模型的公平性和透明度,也是需要关注的伦理问题
[54-55]。
3 AI赋能BTC管理的前景与意义
技术进步推动AI迅猛发展。自1976年AI应用于医学领域以来,过去10年呈指数级发展,衍生出重要算法,特别是ML和DL。这一进展的重要意义在于AI通过神经网络模仿人脑,具备记忆和处理能力。研究发现,在放射学和生物学诊断评估领域,CNN是最常用的算法。将AI整合到诊断中促进了BTC诊断准确率的革新。此外,AI的预测和预后能力使临床医生能够整合来自放射影像、生物标志物和临床数据的大规模数据集,形成组学数据以提高效用。这反过来又提高了诊断和预后准确性、时间效率,并促进个体化治疗策略,从而改善患者预后和BTC侵袭性的总体生存率。本文综述了不同模型及其与传统方法相比的能力,结论表明,AI技术在促进BTC管理的准确干预、诊断和决策方面具有显著优势。在未来,我们可以着重于发展多模态融合(影像+基因组+临床数据),实时术中AI导航(如增强现实技术结合),同时进行前瞻性临床试验设计,从而促进及完善AI在BTC领域的应用。