宫颈癌是全球范围内女性患者最高发的癌症之一。最新全球癌症数据显示,2020年宫颈癌新增病例60.4万例,新增死亡病例34.2万例,2010至2020年间宫颈癌位居女性癌症发病率、死亡率第4位
[1]。在发展中国家宫颈癌新发率占总新发率的85%,死亡率将近90%
[2]。宫颈癌是人乳头瘤病毒(human papilloma virus,HPV)持续感染引起宫颈上皮内瘤变(cervical intraepithelial neoplasia,CIN)的结果,可以通过接种HPV疫苗和接受宫颈癌早期筛查来进行预防。然而,目前HPV疫苗覆盖率很低,尤其是在发展中国家,因此宫颈癌定期常规筛查对适龄女性而言十分重要。随着筛查技术的不断改进,宫颈癌的检出率升高,死亡率降低,但是在一些中低收入国家,由于卫生基础设施薄弱以及病理医师人数短缺,宫颈癌筛查效率低下且准确率不高。另外,临床上通常使用组织活检和成像技术,如核磁共振成像(magnetic resonance imaging,MRI)、电子计算机断层扫描(computed tomography,CT)、正电子发射计算机断层显像(positron emission tomography,PET)等对宫颈癌进行识别和诊断,以此制订临床治疗方案。然而,组织活检的病理切片图像信息量较大,病理学医生难以完全解读,且存在主观性问题;而成像技术价格高、精度低,影像诊断主要依靠放射科医生的形态学解释,不同医生对于同一图像的诊断不尽相同,且非常耗时。但是精准临床诊断对于制定个性化治疗方案和改善患者临床预后尤为重要,因此,需发展科技以提升临床诊断准确率。
近年来,人工智能(artificial intelligence,AI)技术领域不断发展,数字化全切片成像技术(whole slide imaging,WSI)和影像组学技术的出现,为临床诊断提供了新的途径,临床诊断步入数字化时代。本文就AI技术在宫颈癌早期筛查及精准临床诊疗方面的应用相关研究作一系统阐述,以期为患者个性化治疗提供参考,提高患者临床疗效,改善预后。
1 AI概述
1956年,McCarthy等在达特茅斯夏季研讨会上首次提出“人工智能”一词。简单来讲,人工智能是一种编程机器,它在具有代表性的样本中学习和识别输入数据和输出数据之间的模式和关系,并且基于这些知识对未知的输入数据进行分析
[3]。
机器学习(machine learning,ML)是AI的一个重要分支,它需要人为地将原始数据(如图像的像素)转变为相关的判别特征,再通过算法和模型对数据进行学习和分析,从而自主进行预测和决策。其中,深度学习(deep learning,DL)是ML的重要组成部分,DL模仿脑神经结构,自动从原始数据中学习特征和模式,并对数据进行分类、简化和整合。DL的这一特性使得它在人脸识别、图像分类等领域获得巨大的成功,并且逐渐被应用于医学的各个领域
[4]。Park YR等
[5]比较了ML和DL在准确检测宫颈癌方面的能力,它们基于宫颈造影图像,将DL模型ResNet-50和ML模型XGB\SVM和RF进行对比,发现模型ResNet-50检测宫颈癌更加准确,表明DL在临床诊断中应用价值更高。
传统的临床诊断是临床医生依据专业知识和临床经验对病理切片和CT、MRI、PET等医学影像进行分析,耗时较长且具有主观性、局限性。AI的出现打破了这一现状,在图像识别方面,AI客观、高效、迅速,其诊断准确率已经接近或超过临床医生。目前,AI技术已广泛应用于宫颈癌
[6]、乳腺癌
[7]、肺癌
[8]、前列腺癌
[9]等癌症的筛查、诊断、治疗预后等研究。
2 AI在宫颈癌早期筛查中的应用
宫颈癌病程进展相对缓慢,这给宫颈癌诊断和治疗带来了极有利的机会。宫颈癌的成功治疗在很大程度上依赖及时诊断,如果能在早期成功检测到宫颈癌并进行治疗,患者生存概率将大大增加。宫颈癌筛查主要通过“细胞学初筛、阴道镜检查、宫颈活检”三阶梯筛查法检测宫颈中是否存在异常组织或癌细胞
[10]。
2.1 AI在宫颈癌细胞学筛查中的应用
宫颈癌最经典的细胞学筛查是巴氏涂片法。传统的细胞学筛查由细胞病理学家在显微镜下观察患者的细胞涂片中是否存在异常细胞,非常考验病理学家的耐心和眼力,长期单一重复的工作容易引发疲劳,造成漏诊、误诊,使用AI辅助筛查可以避免此类问题,提高筛查率。Sanyal P等
[11]开发了一个卷积神经网络(convolutional neural network,CNN)模型,对1 838份细胞学图像(其中1 301份正常图像,537份异常图像)进行分析,鉴定正常细胞和异常细胞,结果显示准确率为0.946,敏感性为0.943,特异性为0.960,证实了CNN从常规子宫颈涂片中识别病灶的能力。然而在此研究中,病例数仅有18例,可能具有较大的偶然性。ThinPrep细胞学检测(ThinPrep cytologic test,TCT)也是一种常用的细胞学筛查方法,Li X等
[12]构建了一个高精度CNN模型,鉴别了400例患者(其中211例宫颈癌患者,189例正常患者)TCT图像的WSI,该模型对宫颈癌筛查具有较高的敏感性(0.963)、特异性(0.990)和准确率(0.975),避免了漏诊,降低了假阳性病例的随访成本。
CIN是由持续HPV感染引起的宫颈癌癌前病变,主要分为三个等级:CIN1、CIN2和CIN3。病理医生通过区分不同类型的CIN为患者制定治疗方案。Bao H等
[13]收集了2 145例患者188 542幅细胞学图像,以4∶1的比例随机分为训练集和验证集,使用VGG16模型进行分析,结果显示CIN2和CIN3的检出率分别为92.6%和96.1%,显著高于细胞生物学家的检出率。另外,为了避免诊断误差,最新分类将CIN1归为低级别鳞状上皮内病变(low-grade squamous intraepithelial lesion,LSIL),而将CIN2和CIN3归为高级别鳞状上皮内病变(high-grade squamous intraepithelial lesion,HSIL),通常使用p16和Ki-67免疫组化染色鉴别LSIL和HSIL。An H等
[14]利用Swin-B和ResNet-50模型对SIL进行分类,其中Swin-B对HSIL的检测准确度为0.914;ResNet-50对HSIL的检测曲线下面积(area under the curve,AUC)为0.935,准确率为0.845、敏感性为0.922和特异性为0.829,说明其可以准确识别HSIL,协助病理学家解决实际诊断问题。
2.2 AI在宫颈癌阴道镜检查中的应用
阴道镜检查可以将宫颈放大5~40倍,实时、直观地评估宫颈状况,检测CIN、SIL等,指导宫颈活检。然而,阴道镜检查高度依赖操作医师的主观经验,而欠发达地区缺乏经验丰富的阴道镜医师和规范化的阴道镜检查培训课程,导致阴道镜成像和病理结果之间一致性差,容易造成误诊、漏诊。而将AI应用于阴道镜检查可以帮助医师进行阴道镜成像判断,提高宫颈癌筛查性能。Miyagi Y等
[15]开发并训练了一个CNN人工智能分类器,用于阴道镜图像的LSIL/HSIL分类。AI分类器和肿瘤学家诊断HSIL的准确率、敏感性和特异性分别为0.823和0.797,0.800和0.831,以及0.882和0.773,AI分类器表现优于肿瘤科医师。随后,陈林等
[16]又开发了一种基于DL的分类器,从阴道镜图像结合HPV分型对SIL进行分类,AI分类器和肿瘤科医师的准确率分别提高到0.941和0.843,见
表1。
AI技术在宫颈癌早期筛查方面,包括宫颈细胞学筛查、阴道镜检查等,都取得了较好的研究成果,可以大大提高医生和专家的筛查效率和准确率,有助于解决医师经验不足、数量不足、医疗条件不足等造成的漏诊、误诊问题,具有广阔的应用前景,有望进一步提高欠发达地区宫颈癌早期筛查的普及率和诊断准确率。
3 AI在宫颈癌精准临床诊疗中的应用
目前宫颈癌的研究主要集中在2个问题上:一是宫颈癌筛查,用于早期检测疾病;二是临床精准诊断,用于制订个性化治疗方案,改善预后情况,如提高总生存率、无病生存率、生活质量并减少治疗副作用和局部复发等。宫颈癌治疗方案的选择取决于多种因素:肿瘤大小、组织学类型、临床分期、脉管浸润、淋巴结转移及预后等。
3.1 AI在宫颈癌组织学分类中的应用
宫颈癌中最常见的组织学类型是鳞状细胞癌(squamous cell carcinoma,SCC),高达宫颈癌总病例的70%,其次是腺癌(adenocarcinoma,AC)约占10%~25%;最少的是腺鳞癌(adenosquamous carcinoma,ASC)
[17]。虽然美国国家综合癌症网络(national comprehensive cancer network,NCCN)发布的恶性肿瘤临床实践指南中关于鳞癌和腺癌的治疗方案没有区别,但是研究表明,相比于同期鳞状细胞癌,腺癌表现出更高的异质性和更强的侵袭性,对放化疗不敏感,容易发生转移,预后更差,存活率更低
[18-21]。因此,不同组织学类型的宫颈癌预后有显著差异,明确宫颈癌的组织学类型有助于制定临床治疗方案。
Wang W等
[22]运用聚类分析和logistic回归分析方法分析了96例宫颈癌(其中SCC 50例,AC 46例)的5种MR序列 [矢状T2加权成像(T2SAG)、横向T2加权成像(T2TRA)、矢状增强T1加权成像(CESAG)、横向增强T1加权成像(CETRA)和表观扩散系数(ADC)]的105个放射学特征,发现5种MR组合序列鉴别SCC和AC的能力比单独的MR序列都高,其AUC≤0.890、准确率≤0.810、敏感性≤0.670、特异性≤0.940,因此,放射组学分析是一种可行且非侵入性的区分SCC和AC的方法,有助于放射科医生和妇科医生鉴别宫颈癌组织学类型。Li Y等
[23] 将8 496份HE图像(SCC 37例、AC 8例、良性组织184例)分为训练组和验证组,训练AlexNet、VGG19、Xception、RESNet-50四种CNN模型,并经过五重交叉验证。其中Xception模型表现最好,鉴别SCC和良性组织的AUC为0.980(内部验证)、0.974(外部验证),鉴别AC和良性组织的AUC为0.966(内部验证)、0.958(外部验证),鉴别SCC和AC的AUC为0.950(内部验证)、0.944(外部验证)。其准确率介于有经验和无经验的病理学家之间,可以作为病理诊断的辅助工具。目前,AI在宫颈癌组织学类型的应用主要集中于SCC和AC的分类,对于ASC的研究较少。邓力和陈亚军
[24]利用keras搭建的LeNet-5模型对497张(SCC 484张、ASC 13张)CT进行分析,将数据分批输入算法进行训练和测试,在完成一批次的训练后,算法根据结果自动调整权值参数,最终准确率达到0.933,loss值(度量所预估事情错误程度的指标)下降到0.161,见
表2。
由此可见,临床医生可以利用AI技术对患者宫颈癌组织学类型作出准确诊断,给患者带来更佳的治疗效果和更长的生存时间。
3.2 AI在宫颈癌脉管浸润和淋巴结转移评估中的应用
脉管浸润是指肿瘤生长侵犯到脉管里,研究认为脉管浸润(包括血管/微血管浸润和淋巴管浸润)是宫颈癌转移的主要评估指标,早期发现脉管浸润可以“对症下药”,改善患者预后情况
[25]。Jiang X等
[26]通过对167例早期宫颈癌患者的动态T1对比增强(dynamic T1 contrast-enhanced,DCE-T1)和T2加权成像MRI图像进行训练和验证深度学习模型,有效鉴别了宫颈癌血管浸润与非血管浸润,AUC为0.911。此模型具有灵活性和可扩展性,可以通过参数微调用于新的数据集,具有潜在的临床应用前景。
2018年,FIGO指南修订了宫颈癌分期系统,首次将淋巴结转移(lymph node metastasis,LNM)纳入分期标准
[27],LNM是宫颈癌患者预后的重要因素,可能导致宫颈癌5年总生存率和5年无病生存率降低
[28],术前准确预测LNM有助于临床决策。确定宫颈癌患者LNM状态的最佳方法是病理活检,但此方法需要对患者进行盆腔淋巴结清扫术,可能引发术后淋巴囊肿等并发症,给患者带来二次伤害。因此,在患者表现出极低LNM可能性的情况下则无须承担不必要的淋巴结切除及其并发症相关的风险。相反,如果患者被认为具有明显升高的LNM风险,甚至总体上有转移,则根治性放化疗是首选治疗方案
[29]。MRI、CT和超声是预测LNM常用的临床影像学方法,但其均存在一个普遍问题:对小淋巴结转移的敏感度低,存在假阴性的可能。近年来许多研究尝试从医学图像中提取特征,使用ML对这些特征进行分析,以提高诊断和预测的准确性。Li P等
[30]基于MRI和临床信息开发了一个DL模型,预测宫颈癌正常大小的LNM,研究结果显示:RESOLVE-DWI和ADC MRI的多通道CNN组合模型的性能优于单独MRI的单通道CNN模型,基于组合模型和临床信息(年龄、肿瘤大小、FIGO分期等)的DL模型预测能力最强,在训练集和测试集中AUC分别为0.890和0.844。Li P等
[31]采取CNN对418例ⅠB~ⅡB期宫颈癌患者CT病灶进行DL特征提取,建立深度学习特征码(deep learning signature,DLS),结合临床信息建立深度学习诺模图(deep learning nomogram,DLN),进行训练、内部验证和外部验证,得到内部验证AUC为0.771,外部验证AUC为0.790,可以有效预测LNM。Jin X等
[32]以超声图像为基础,探讨了放射学特征预测172例早期宫颈癌患者LNM的可行性,结果显示训练集AUC为0.790,验证集AUC为0.770,表明其可以有效预测LNM。
然而,在放射学图像中选择特征较为耗时费力,WSI技术运用方便且分辨率高。Guo Q等
[33]基于564例患者的1 524张WSI图像构建并训练了一个深度CNN来预测淋巴结状态,探讨预测原发灶LNM的可行性,结果在交叉验证集中AUC达到了0.870,而对于盆腔淋巴结转移阳性的患者,重新训练预测其是否有主动脉旁淋巴结转移,结果AUC达到了0.910,充分证明了CNN直接从组织学预测宫颈癌患者LNM的能力。Liu Q等
[34]开发了一种基于视觉变换器和递归神经网络的DL模型,分析了227例患者术前病理活检WSI图像以预测LNM,并使用来自其他医院的168名患者226张WSI图像进行外部验证,结果在内部测试集中DL模型AUC达到了0.919,敏感性和特异性值分别为0.923和0.905,准确率为0.909;DL模型在外部测试集中的表现仍然良好,其AUC为0.910,准确率为0.895,证明利用活检WSI预测早期可手术宫颈癌的LNM是有效的,这种方法可能帮助医生制订宫颈癌患者的治疗决策。
总之,这些研究表明AI技术通过对宫颈癌组织学类型、脉管浸润、淋巴结转移、周围组织环境的定量定性等方面的预测模型分析,可以为宫颈癌患者预后评估、治疗方式及指导用药提供很好的临床价值。
3.3 AI在宫颈癌治疗预后中的应用
目前,宫颈癌治疗方法主要有手术、化疗和放疗3种。由于宫颈癌患者病理情况复杂,当前临床多采用个性化治疗,有效的临床预后预测有利于制定个性化治疗方案。Zhang K等
[35]通过深度学习分析宫颈癌患者的临床特征(淋巴结转移、肿瘤体积)和HE染色病理图像,预测238例非手术宫颈癌患者5年总体生存率,其中165例被随机划分到训练集,73例被划分到验证集,最终临床-病理模型的AUC达到0.750,使用此模型有助于提高个性化治疗的精准度,优化随访时间,然而其研究样本量相对较小且来源单一,可信度有待提高。
NCCN指南建议早期宫颈癌患者治疗以根治性子宫切除术为主,术前辅助放化疗以提高手术切除率。Liu S等
[36]收集了接受根治性子宫切除术的201例ⅠB~ⅡA期宫颈鳞癌患者的术前PET/CT数据,对肿瘤区域进行手动分割,利用AI提取并选择了6个重要的放射组学特征(5个CT、1个PET)和6个临床病理特征,设计了一个基于决策树的随机生存森林模型,预测早期宫颈鳞癌患者手术后的5年无病生存率,该模型AUC达到了0.970,具有较高的可信度。
对于局部晚期宫颈癌(locally advanced cervical cancer,LACC)患者来说,最有效的方法是放化疗而非手术,手术可以通过对切除的肿瘤组织进行活检预测复发风险,放化疗却无法同样地进行病理评估,因此常采用AI帮助预测预后。Wang J等
[37]纳入104例LACC患者的CT和MRI图像,设计一个多模态transformer网络模型,其中48例用于训练,21例用于验证,35例用于测试,用以预测LACC患者接受同步放化疗治疗方法后的宫颈癌复发风险,并通过活检确定其复发情况,该模型取得了良好的效果:测试集的AUC达到了0.819,高于传统的放射组学方法,证明了其预测LACC复发风险的可行性,有助于LACC患者个性化治疗方案的制定。Shen WC等
[6]基于
18F-FDG PET/CT设计了一个DL模型,对142例接受外放疗和近距离放疗的LACC患者的局部复发和远处转移进行预测,通过40个月的随访了解到21例患者发生了局部复发,26例患者发生了远处转移,结果显示:局部复发准确率0.890、敏感性0.710、特异性0.930;远处复发对应值为0.870、0.770和0.900,表明此模型能够很好地预测宫颈癌治疗效果,在临床医生选取治疗方法前打一剂“预防针”。
在当前提倡精准医学的情况下,根据患者数据进行个性化治疗是当前医疗技术发展的必然趋势。宫颈癌的个性化治疗以FIGO分期为指导,早期宫颈癌常采用根治性子宫切除术或盆腔淋巴结切除术,术前辅助放化疗;而晚期宫颈癌淋巴结转移、局部复发、远处复发的发生率较高,如果选择手术,可能很难切除所有具有正常组织边缘的肿瘤,所以通常采用放化疗进行治疗
[38]。众多研究表明AI技术可以用于预测宫颈癌患者选择不同治疗方法后的治疗效果,如复发风险、5年整体生存率、5年无病生存率、局部复发率、远处转移率等,通过AI预测患者预后可以帮助医生选择适合患者的治疗方法,并且评估治疗方案的可行性,提高患者治疗效果,减少患者复发痛苦。
总体而言,AI技术在宫颈癌的诊断和治疗中得到了广泛研究和应用。在判断宫颈癌组织学类型、评估脉管浸润及淋巴结转移程度,以及预测预后等方面取得了良好的效果,大大提高了临床诊断的准确性和特异性,提高了宫颈癌诊疗效率,有助于临床医生决策,减轻医师工作量,降低误诊率。
4 总结与展望
目前,AI尤其是深度学习的卷积神经网络在图像分析方面表现优异,其准确率甚至超越了病理医生,可以协助医生进行宫颈癌早期筛查和精准临床诊断,有助于医生制定个性化治疗方案,提升治疗疗效。随着AI的快速发展,其在泛癌分子病理学中的研究也有令人瞩目的突破,比如预测基因突变、微卫星不稳定性、免疫检查点基因等,为实现宫颈癌肿瘤新型疗法打下了坚实的基础,给宫颈癌患者带来了福音。
然而,AI技术在应用于宫颈癌临床诊断之前仍然存在较大的问题及挑战:①AI模型的优劣高度依赖其所构建的数据,然而目前的研究中大部分数据集相对较小,且来源单一,缺乏高质量的大型数据集;②AI技术深度学习算法存在标准化难题,由于不同机器扫描、不同算法之间存在差异,研究结果的准确率和可重复性存疑,并且缺乏客观评价的标准;③存在“黑盒”问题,AI模型工作流程不透明,预测结果的可解释性差,缺乏说服力;④图像标注存在质量一致性与规范性问题,需要妇科、病理科、影像科专家及AI工程师进行跨学科合作;⑤利用AI建立的模型尚未在临床实践中得到应用和推广,迫切需要一系列前瞻性的临床研究来验证这些结果;⑥存在法律伦理问题,如何保障患者隐私和数据安全仍是一个需解决的问题。
综上所述,AI技术的发展可以更好地为人类服务,但在疾病诊断领域中AI只能作为一种辅助诊断工具,不可能完全代替医生,只有人机完美和谐互助才是未来发展最健康的模式。