胰腺癌恶性程度极高,且起病隐匿,大多数患者在诊断时已经处于局部进展期或者发生远处转移,仅约20%的患者在初诊时具有手术机会
[1]。胰腺癌预后极差,即使是可切除患者,在根治性手术后,约80%的患者会在2年内复发或者出现远处转移,其5年生存率仅有10%左右
[2]。因此,迫切需要更多的资源投入,发展胰腺癌的临床和转化研究,以改善预后。
近年来,人工智能(artificial intelligence,AI)由于强大的数据处理和分析能力,在医学领域显示出了巨大的应用前景,尤其在医学影像分析、病理切片识别、分子靶点筛选等领域展现出独特的优势
[3]。自20世纪50年代首次提出以来,AI的发展也经历了由符号AI及概率模型到机器学习及深度学习,再到现今的基础模型和生成式AI的快速飞跃
[4]。这使AI获得了整合影像病理图像特征、基因组、蛋白质组等组学数据以及临床资料等信息的能力,在疾病的诊断、治疗、预后等全过程均可发挥重要作用。本文就AI在胰腺癌的早期诊断,药物疗效和预后预测以及手术和围手术期管理等方面的研究现状予以综述。
1 早期诊断
早期诊断并提高可切除率是改善胰腺癌预后的重要措施之一。近年来,随着影像及基因测序技术的发展,早期诊断成为AI在胰腺癌领域应用最为热门的方向。
1.1 影像图像分析
胰腺癌无特异性症状,起病隐匿,传统诊断的影像学检查如CT、MRI及超声内镜(endoscopic ultrasound,EUS)等均需要依靠诊断医师肉眼观察,且存在一定误诊概率,特别是直径<2 cm的T1期肿瘤,误诊率高达40%。而AI能够识别肉眼以外的细微病变,相较于放射诊断医师有更高的一致性,显著提升了传统影像检查对胰腺癌诊断的敏感度和特异度。来自美国梅奥中心的研究者
[5]开发了一种基于三维(3D)CT的卷积神经网络模型(convolutional neural network,CNN),利用696例胰腺患者门静脉期CT图像和1 080对照组图像构建模型,在内部和外部测集中,该模型诊断胰腺癌的平均准确率为0.92,敏感度为0.88,特异度为0.91,其中对T1期肿瘤的敏感度为0.8。Chen等
[6]基于549例胰腺增强CT图像,开发了一种包含分割CNN和集成5个CNN的分类器,在真实世界的临床研究中显示对胰腺癌诊断的敏感度和特异度分别为0.90和0.93,对T1期肿瘤的敏感度为0.75。最近一项来自国内多中心研究
[7]报道了一种基于深度学习平扫CT的胰腺癌诊断模型(PANDA),该模型在包含1 431例胰腺癌的和938例正常对照患者的平扫CT图像库中训练建模,在涉及10个中心的6 239例患者的多中心验证中,PANDA的受试者工作曲线下面积(AUC)为0.986~0.996,在包含20 530例患者的真实世界多场景验证中,PANDA的诊断敏感度为92.9%,特异度为99.9%。
除了CT之外,基于MRI和EUS图像的AI模型同样在胰腺癌的诊断中显示出较大的潜力。在生成对抗网络的辅助下,深度学习增强MRI图像建立的模型能够很好地鉴别胰腺癌和胰腺良性疾病
[8]。基于MRI图像的直方图阵列和CNN建立的分类器能够将胰腺癌和胰腺神经内分泌肿瘤及实性假乳头状瘤明显区分开,在训练、验证和测试组中的AUC分别为0.896、0.846和0.839
[9]。日本爱知癌症研究中心
[10]基于EUS图像,使用深度学习架构开发了一种可以区分胰腺癌和非癌性胰腺病变的AI模型,在验证集中诊断胰腺癌的AUC、敏感度和特异度分别为0.90、0.94和0.82。
随着影像组学的兴起,AI与影像组学的组合进一步提升了传统影像检查的诊断效率。影像组学自动从医学图像中提取海量的高维定量图像纹理特征,然后通过机器学习或深度学习等AI方法抽提出最重要的影像组学标签,作为新的生物标记物最终辅助指导临床决策
[11-13]。Mukherjee等
[14]基于临床诊断胰腺癌前3~36个月的CT图像,提取影像组学特征并构建机器学习模型,在4种机器学习模型中支持向量机具有最高的敏感度(95.5%),特异度为90.3%,AUC为0.98。相比之下,放射科医师的诊断一致性较低,其平均AUC为0.66,显著低于4种机器学习模型(AUC=0.95~0.98)。Tong等
[15]开发了基于增强超声图像的深度学习影像组学(deep learning radiomics,DLR)模型,共纳入558例胰腺病变患者,DLR模型在训练、内部验证和外部验证队列1和队列2中的AUC分别为0.986、0.978、0.967和0.953,且在DLR模型的帮助下,放射科医生对胰腺癌的诊断敏感度进一步提高。
1.2 病理切片识别
组织病理检测是胰腺癌诊断的金标准。然而,在目前的临床实践中,病理诊断是一项繁琐而耗时的工作,且一致性低。随着数字成像和AI的发展,基于病理全景图像(whole slide images,WSI)及其病理组学的分析逐渐兴起。Fu等
[16]提出了一种基于CNN模型WSI自动检测胰腺癌模型,将染色后的胰腺癌病理切片图像裁剪后上传至系统,进行数据增强,使用Inception V3和U-Net网络分别进行图像分类和分割任务的模型训练,该模型在外部验证集中的诊断准确率达到90.4%,形成的癌症热图可以帮助病理学家快速注意到可疑区域,这会大幅减少检查时间和成本,并提高病理诊断过程的效率。新辅助治疗时代下术前获取胰腺癌病理诊断至关重要,而EUS引导下的穿刺组织往往受限于标本量少、癌细胞孤立,且血液、炎症和消化道细胞污染严重等问题而导致诊断困难。来自日本的一项多中心研究
[17]开发了基于EUS穿刺样本的WSI深度学习模型用于胰腺癌诊断,其能够准确检测出孤立和小体积癌细胞的疑难病例,AUC达到0.98,敏感度和特异度分别达到0.93和0.97。除了诊断之外,针对多重免疫荧光的WSI机器学习模型还能够识别胰腺癌微环境的基质和细胞成分
[18],这为进一步评估药物治疗敏感性奠定了基础。
1.3 生物标志物
分子生物学技术的进步带来各种新型生物标志物,如循环肿瘤DNA(circulating tumor DNA,ctDNA)
[19]、循环肿瘤细胞(circulating tumor cells,CTC)
[20]、外泌体
[21]、mRNA
[22]及蛋白质
[23]等,均已经被报道可以通过机器学习或深度学习等AI的方法去筛选以及进一步应用于胰腺癌的早期诊断和预后评估。例如,日本的研究者Kawai等
[24]进行了一项研究,通过对胰腺癌患者与健康对照者的血清样本进行miRNA测序,并结合自动机器学习方法,构建了基于高表达miRNA与CA19-9组合的诊断模型,用于胰腺癌的早期检测,该模型在区分胰腺癌患者和健康对照组方面具有高准确率,AUC达到0.99,敏感度为90%,特异度为98%,甚至在无症状的早期胰腺癌患者中也表现出良好的诊断性能,AUC达到0.97;敏感度为67%,特异度为98%。与传统的miRNA测序技术相比,通过机器学习算法,AI可以从海量的miRNA测序数据中识别出与疾病相关的关键miRNA,并构建出具有高敏感度和特异度的诊断模型,从而提高临床诊断的准确性,并有效克服传统方法筛选miRNA生物标志物效率低、耗时长、主观性强等局限性。AI还可以整合多组学数据,辅助生物标志物功能和机制的研究,构建更全面、更精准的诊断模型,为疾病的个体化诊疗提供新的思路和策略。
2 治疗方案筛选和预后预测
高通量测序和医学图像分析技术的发展带来了基因组学,蛋白组学,影像组学,病理组学等一系列组学相关的临床探索,而AI赋能的组学研究则更加高效和精准,为胰腺癌的分子分型,治疗药物筛选,预后预测提供了重要的依据。
2.1 治疗方案筛选
胰腺癌的治疗方案众多,除了已知的BRCA1/2基因突变对含铂类的化疗药物敏感之外,其余化疗方案包括免疫检查点抑制剂的选择目前缺乏更多的临床证据。由于AI对组学信息的整合存在独特优势,其不仅可从基因分子角度筛选药物治疗方案,并且可以为药物增敏的机制研究提供基础。胰腺癌的辅助化疗方法主要包括吉西他滨(GEM)为基础的方案和mFOLFIRINOX方案,一项最新的前瞻性研究
[25]利用AI分析了临床前模型的转录组学特征及药敏信息并结合肿瘤微环境建立了一种“胰腺视图(Pancreas-View)”,该视图能够区分对GEM和mFOLFIRINOX方案敏感的患者。研究结果显示,在对胰腺视图显示为GEM方案敏感和mFOLFIRINOX方案敏感的患者分别应用GEM和mFOLFIRINOX治疗,其中位无进展生存期能够达到50个月和33.7个月,而用其他方案治疗的患者中位无进展生存期仅有10.8个月,这充分说明了AI整合基因信息预测药物敏感性的能力
[25]。美国Valar实验室
[26]利用AI辅助的数字病理学方法定义了一种组织学特征(visual pancreatic gemcitabine,VPG),相较于已经建立的转录组学特征,VPG不仅能够预测胰腺癌对GEM化疗方案的敏感性,而且能够更好地反映远期预后。VPG阳性患者的生存获益明显高于VPG阴性患者,这体现了VPG特征在预测吉西他滨疗效方面的价值,另外,VPG阳性患者接受辅助GEM治疗的获益与接受mFOLFIRINOX治疗的获益相似,但毒性更低,为不适合接受mFOLFIRINOX治疗的患者提供了新的选择。Nicolle等
[27]利用AI开发了一种名为GemPred的RNA特征,可预测辅助GEM在胰腺导管腺癌中的疗效,其Ⅲ期临床试验结果显示,GemPred(+)患者接受GEM治疗后,其无病生存期和癌症特异性生存期明显长于GemPred(-)患者。GemPred(+)患者接受辅助GEM或mFOLFIRINOX治疗后的无病生存期和癌症特异性生存期相似,但吉西他滨组的不良事件较少。这项研究表明AI可用于开发预测吉西他滨疗效的生物标志物,并可能指导辅助治疗的选择,从而实现更精准的个体化治疗。Blise等
[28]利用机器学习分析人类胰腺癌的单细胞空间蛋白质组学数据,通过训练机器学习模型准确预测了抗CD40治疗后胰腺癌微环境特征的改变及预后差异,并且发现抗CD40治疗减少了微环境中T细胞的耗竭,这些模型的预测结果可以帮助临床医生识别哪些患者可能从抗CD40治疗中受益,并可能指导未来的治疗决策,这显示了AI在肿瘤分子免疫学中的应用潜力。
随着包括影像组学、病理组学、基因组学等在内各种组学技术发展,以影像组学为基础的多组学研究逐渐成为热点,如影像基因组学,影像病理组学等,这使得从无创性的影像高维度纹理特征去解析肿瘤深层次的分子病理特点成为可能
[29-31]。Iwatate等
[32]利用CT图像提取的影像组学特征构建了胰腺癌p53突变和PD-L1表达的预测模型,发现这种建立的放射基因组学特征可以预测p53突变,进而预测胰腺癌患者的预后,并且能够为PD-1的治疗选择提供参考。Bian等
[33]同样基于MRI图像的影像组学数据构建了胰腺癌中CD8
+ T淋巴细胞浸润数量的预测模型,为后续的免疫治疗提供了证据。
2.2 预后预测
目前基于AI或者单一影像组学特征建立胰腺癌预后模型已经存在大量相关研究
[34-36],本文在此重点梳理以影像组学为基础的多组学预测模型,一方面利用影像组学高效无创、方便快捷的特点,另一方面应用其他组学特征增强影像组学的可解释性。胰腺癌肿瘤微环境中的基质成分是导致其免疫抑制以及化疗抵抗的重要因素,肿瘤间质也被证明与胰腺癌的预后相关
[37]。Liao等
[38]利用CT影像组学特征建立了胰腺癌肿瘤间质比的深度学习网络模型。Attiyeh等
[39]发现CT提取的影像组学特征与胰腺癌SMAD4基因突变及肿瘤中的间质含量相关,从而影响胰腺癌的预后。恶病质和身体成分已经被证明与多种恶性肿瘤预后相关,一项来自德国的多中心研究
[40]基于CT提取的身体成分指数建立深度学习模型能够预测进展期胰腺癌患者中恶病质发生并且与总体生存独立相关。Tang等
[41]构建了基于影像组学的淋巴结转移预测模型,外部验证的AUC达到0.85,并通过加权基因共表达网络分析构建了影响淋巴转移的影像基因组学特征,进一步发现该组特征与细胞增殖显著相关。除此之外,AI也能够通过学习肠道菌群特点
[42]、单细胞多组学特征
[43]等预测胰腺癌患者预后。
与现有的传统临床预后评估标准相比,AI预测模型可以大幅提高预后评估的准确性和个性化治疗的潜力
[44]。一方面,AI模型的预测结果能够补充传统临床评估标准(如TNM分期、CA19-9水平、肿瘤大小、患者年龄等)的不足。通过将这些不同的临床数据和AI预测结果结合,可以采用加权的方式构建一个综合评分系统,从而形成一个多因子模型,不仅考虑了患者的基础临床特征,还能引入AI对复杂模式的学习能力,这种方法能够在不同患者群体中提供更加精准的预后评估
[45]。另一方面,AI的优势在于能够处理大规模的高维数据,特别是影像数据、基因组数据和其他生物标志物的数据,这些是传统临床评估标准中无法完全覆盖的,通过将AI与这些高维数据相结合,能够进一步提高预后的准确性
[36]。此外,AI还可以实现动态的预后评估,跟踪患者在治疗过程中各项指标的变化,实时更新预测结果,从而为临床决策提供持续的支持。
3 手术和围手术期管理
尽管AI在医疗保健领域取得了长足的发展,但是其在外科手术中的应用仍处于起步阶段。由于腹腔镜手术的广泛应用,AI在术中场景应用最多的是实时决策支持和手术自动化。通过对手术视频的学习和分析,AI可以识别解剖结构,拆分学习手术步骤,评估手术熟练度并提供实时反馈
[46-47]。目前应用最多的是腹腔镜胆囊切除术(laparoscopic cholecystectomy,LC)。2021年,一项来自法国的多中心研究
[48]开发了一个计算机视觉平台,可以自动定位并记录LC手术视频中的关键事件(显露胆囊管及胆囊动脉,解剖胆囊三角,剥离胆囊)。而另一项来自加拿大和美国的多中心研究
[49]建立了LC手术视频的深度学习模型,发现该模型能够准确识别LC术中显示的解剖和手术步骤。随后,AI对于手术视频的识别逐渐扩大到腹腔镜肝脏
[50]、胃
[51]及直肠
[52]手术,但是目前对于胰腺手术视频的识别很少报道。
Miyamoto等
[53]评估了深度学习算法在胰腺手术3D模拟中的应用,结果表明,根据患者术前的胰腺CT图像,AI引擎可以高精度提取胰腺实质、胰管和周围血管的信息,有助于手术模拟和制定手术方案。Al Abbas等
[54]则开发了一种深度学习模型,用于自动分割机器人胰十二指肠切除术中的机器人胰空肠吻合术视频,准确率为88.01%,表明深度学习模型在机器人胰空肠吻合术视频的自动分割方面表现良好,未来将专注于技能评估和结果预测。然而,目前AI在胰腺手术视频识别方面的应用仍处于早期阶段,尚无成熟的应用,仍面临挑战,例如数据获取和标注成本高、算法泛化能力不足以及对实时性和准确率要求高等。AI在胰腺手术视频识别方面的发展方向可能包括细粒度识别和标注,将识别范围从胰腺整体或肿瘤细化到内部结构、血管和神经,为精准手术提供更详细的信息;其次是多模态数据融合,将手术视频与术前CT、MRI等影像数据进行融合,提高AI模型的准确率和鲁棒性;术中实时导航和预警,避免损伤重要血管和神经;在手术机器人控制方面,实现自动化手术操作,提高手术效率和安全性;最后是手术技能评估和培训,为医生提供个性化的培训建议。总而言之,AI在胰腺手术视频识别方面具有广阔的应用前景,未来的研究需要克服现有挑战,并积极探索新的发展方向。
对于围手术期管理,AI通过可穿戴设备实现对生命体征的连续监测,并实时分析患者的异常生命体征
[46]。此外,AI对于术后并发症的预测也发挥重要作用。胰瘘是胰腺手术后最严重的并发症之一,Shi等
[55]发现术前能谱TC的碘浓度和脂肪分数可能反映胰腺纤维化和脂肪变性程度,是术后胰瘘的独立影响因素。Shen等
[56]基于临床特征、术中参数及实验室指标建立了机器学习模型,对术后胰瘘预测的AUC达到0.81,能够识别术后胰瘘高危患者,并进行提前干预。术后胰瘘会导致患者住院时间延长、病死率增加和生活质量下降,AI预测术后胰瘘可以帮助临床医生早期识别高风险患者,并进行个体化的干预治疗,从而改善患者的预后,同时可以帮助临床医生优化医疗资源配置,例如提前预留重症监护病房床位、准备必要的药物和设备等,从而提高医疗效率和降低医疗成本
[57-58]。
在术后营养支持治疗方面,AI可通过整合多模态数据(如代谢组学、影像组学、临床指标)动态优化围手术期营养干预策略。例如,AI可基于机器学习模型分析术前营养评分与术后并发症的关联性,精准识别高风险患者;AI还可以结合可穿戴设备监测的实时代谢数据(如血糖等),生成个性化营养补充方案,实现动态营养调整
[59-60]。此外,AI术后疼痛控制方面具有巨大潜力,主要体现在疼痛风险预测、个体化镇痛方案和非药物干预支持等方面
[61]。可以通过分析手术创伤程度、炎症标志物等信息,构建疼痛敏感度模型,提前识别需要强化镇痛的患者,例如改进版的MySurgeryRisk算法在术后疼痛预测中AUC达0.843
[46]。然而,目前AI在胰腺围术期管理的研究主要集中于胰腺术后常见并发症的诊治,对营养治疗、疼痛管理等研究甚少,可能由于胰腺术后并发症,如胰瘘、出血和感染,是导致患者死亡和术后生活质量下降的主要原因,因此解决这些问题更为迫切,而且胰腺术后并发症通常具有明确的诊断标准和可量化的指标,便于AI模型的训练和评估,而营养治疗和疼痛管理的效果往往难以量化,这增加了AI应用的难度。
4 实际应用现状
AI在医疗领域展现出广阔的应用前景,但在不同医疗环境下,其适用性和推广情况存在显著差异,尤其是在基层医院与大型三甲医院之间,这种差异直接关系到AI技术能否在医疗资源相对有限的地区实现广泛应用。目前AI在国内基层的应用仍较为局限,主要应用在慢病管理方面,如糖尿病的管理等,在胰腺癌方面应用甚少
[62]。基层医院在AI应用方面面临着独特的挑战与机遇
[63]。一方面,技术基础设施不足、医务人员培训欠缺以及数据质量和标准化问题,制约了AI技术在基层的有效部署。许多基层医院缺乏先进的硬件设施和稳定的网络连接,医务人员对AI技术的认知和操作能力也相对有限,需要系统的培训。同时,基层医院的数据收集和管理往往不够规范,影响了AI模型的训练和应用效果。然而,AI恰恰能在基层医疗中发挥独特优势,如通过辅助诊断系统帮助全科医生快速识别疾病,提高诊断效率和准确率,以及协助进行慢性病的远程监测和管理,提升患者的健康管理水平
[64]。
相比之下,大型三甲医院通常拥有更完善的技术基础设施和丰富的医疗资源,AI技术的应用相对成熟。但这并不意味着没有挑战。系统集成复杂性、数据隐私和安全问题是三甲医院在AI应用中需要克服的障碍。将AI技术与现有医疗系统集成可能涉及复杂的技术和流程调整,而处理大量患者数据时,必须严格遵守隐私保护和数据安全法规
[65]。尽管如此,AI在大型三甲医院的应用潜力巨大,不仅能通过分析海量数据提供个性化治疗方案,实现精准医疗,还能加速医学研究,推动新药研发和临床试验的进展。
为了实现AI技术在不同医疗环境中的广泛应用,未来需要多方共同努力。政府应制定相关政策,支持AI技术在基层医疗机构的推广;同时加大对基层医疗机构技术基础设施的投资,提升其承载AI技术的能力;开展针对医务人员的AI技术培训,提高其操作能力和对技术的接受度也至关重要;此外,建立统一的数据标准和管理规范,是确保AI模型训练和应用效果的基础
[66]。只有综合施策,才能让AI技术真正惠及所有医疗环境,特别是医疗资源相对匮乏的地区。
5 AI应用的挑战
5.1 数据质量
高质量的数据是训练有效AI模型的基础。数据中的噪声、缺失值或错误标注可能导致模型学习到错误的模式,从而影响预测准确率。例如,训练数据中存在大量不相关的信息,称为噪声数据,可能导致模型无法准确捕捉到数据中的真实规律
[67]。此外,数据的完整性和一致性也至关重要,缺失值和异常值可能导致模型在训练过程中产生偏差,影响其泛化能力。因此,数据预处理阶段需要对数据进行清洗和修正,以确保其质量
[68]。
5.2 样本量
样本量不足可能导致模型无法充分学习数据的特征,进而影响其泛化能力。即使模型很简单,也很容易在仅包含一两个样本的数据集上发生过拟合。在小样本情况下,模型可能会过拟合训练数据中的噪声和偶然特征,导致在验证数据中的表现不佳。为了解决这一问题,可以采用数据增强、迁移学习和正则化等方法,以提高模型的泛化能力
[69-70]。
5.3 过拟合
过拟合是指模型在训练数据上表现良好,但在验证数据上表现不佳的现象。这通常是由于模型过于复杂,捕捉到了训练数据中的噪声而非真实规律。过拟合的原因包括模型复杂度过高、训练数据不足、特征选择不当和缺乏正则化等,为防止过拟合,可以采用正则化技术、交叉验证和集成学习等方法,以提高模型的泛化能力
[69-70]。
5.4 数据隐私和伦理问题
医疗数据通常包含敏感的个人信息,如何在保护患者隐私的前提下使用这些数据进行模型训练,是一个重要的伦理问题。此外,模型的决策可能影响患者的生命健康,如何确保模型的公平性和透明度,也是需要关注的伦理问题。解决数据隐私和伦理问题的方法包括:数据去标识化:在使用数据前,去除或匿名化患者的个人信息;合规性:遵守相关法律法规;伦理审查:在使用数据前,进行伦理审查,确保研究的道德性。通过这些措施,可以在保护患者隐私的同时,促进AI模型的研究和应用
[71]。
5.5 跨学科合作不足
在胰腺癌的AI应用领域,跨学科合作至关重要。医学、计算机科学和生物学等领域的专家共同参与,能够有效推动AI模型的开发、验证和临床应用。例如,华中科技大学同济医学院附属同济医院
[72]开发的多模态AI模型,结合患者的临床信息与超声内镜图像,准确率达到98%,为胰腺癌的早期诊断提供了有力支持。此外,阿里巴巴达摩院联合全球十多家顶尖医疗机构,将AI用于体检中心、医院等无症状人群的胰腺癌筛查,标志着AI在胰腺癌早期筛查中的突破
[7]。这些成功案例表明,跨学科合作在推动AI在胰腺癌诊疗中的应用方面具有关键意义。成功的跨学科合作需要建立有效的沟通机制和共同的研究目标,定期的团队讨论和共享研究成果有助于促进不同学科之间的理解和信任。此外,培养具有跨学科背景的研究人员,能够在不同领域之间架起桥梁,推动协同创新。通过整合不同领域的专业知识和技术,能够加速AI模型的研发和临床转化,最终改善患者的预后。
6 小结与展望
随着各种组学研究的发展,现阶段AI在胰腺癌诊断,治疗和预后评估中的研究均显示出了巨大潜力。然而,AI在数据、伦理以及可解释性上仍存在一些担忧。因此,整合多维度的数据是目前AI发展的一个方向。现今在医疗服务和健康数据更加数字化的时代,AI在决策支持工具的构建、验证和应用方面会越来越成熟,为包括胰腺癌在内的癌症的诊断治疗提供更多更确切的证据支持。