口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)是口腔颌面部最常见的恶性肿瘤,每年约有30万例新发病例,17万例因该疾病而死亡
[1]。尽管治疗手段已经有了显著进展,但OSCC患者的5年生存率仍然维持在50%~60%,没有明显提高
[2-3]。在众多临床和病理危险因素中,颈部淋巴结转移(lymph node metastasis,LNM)是公认的导致预后不良的重要因素
[4]。基于早期舌鳞状细胞癌的回顾性研究
[5]表明:选择性颈淋巴清扫术(selective neck dissection,SND)可以显著降低由颈部淋巴结转移引起的死亡率,并提高5年疾病特异性生存率,尤其在T2期OSCC患者中效果最为明显。然而,临床和影像学检查未发现的颈部淋巴结隐匿性转移(clinical lymph node negative,cN0)患者的治疗方案一直存在较大的争议。统计数据显示:即使在早期OSCC(T1—T2)患者中,隐匿性淋巴结转移率也达到20%~40%。争议的焦点主要在于早期口腔癌有20%~40%的隐匿性转移
[6],如未能在术前检查中发现这种转移,未同期进行SND,这些患者的5年生存率将下降超过一半
[7]。与之相反,虽然SND可以有效地控制隐匿性颈部转移,但对于大部分没有发生隐匿性转移的口腔癌患者而言,SND可能导致一些难以避免的术后并发症,如皮肤伤口瘢痕收缩、术区麻木感、疼痛和肩部功能受损(肩部综合征)等
[8-10]。现有的术前临床检查和影像学检查,包括前哨淋巴结活检等,均不能达到令人满意的准确率,因此提高对可能的隐匿性转移的检测率是非常重要且亟待解决的问题。近年来,随着影像组学及机器学习方法被应用于全身各种肿瘤的诊断,这一难题似乎也有了解决的前景。
2012年,Lambin 等
[11]提出了“影像组学”这一概念,此后影像组学在肿瘤诊断技术中的应用研究得到了突飞猛进的发展。影像组学本质上是对大量成像特征进行高通量提取,从而将医学图像转换为可挖掘的高维数据,这些数据提供了独特的生物信息,可以增强对疾病过程的理解,并提供临床决策支持。本文综述了影像组学特征分析在OSCC颈部淋巴结转移预测方面的研究进展,旨在帮助临床医生在现有临床技术的基础上,更加准确地判断颈部淋巴结状态,尤其是能够有效识别出隐匿性转移,或帮助鉴别炎症淋巴结或转移性淋巴结,从而可以制定更加准确的临床分期,达到精准治疗的目的。
1 传统影像学技术的优缺点
影像学成像工具具有无创性和可操作性,在临床上一直被广泛用于各种疾病的辅助诊断。在协助恶性肿瘤进行临床分期方面,影像学检查是非常重要的手段。目前常用的成像方式包括超声(ultrasonography,US)、计算机体层扫描(computed tomography,CT)、磁共振扫描(magnetic resonance imaging,MRI)和正电子发射断层扫描(positron emission computed tomography,PET-CT)。在口腔颌面部肿瘤诊疗领域,临床上通常将这些影像学检查工具作为了解肿瘤TNM临床分期的重要依据。van den Brekel等
[12]比较了88个cN0患者的超声、CT和MRI的表现,结果发现:超声的敏感性、特异性和准确性分别为58%、75%和68%,CT分别为49%、78%和66%,MRI分别为55%、88%和75%。虽然这种成像方式对区分良性和转移性淋巴结有一定的用处,但炎症和小淋巴结会影响淋巴结状态的评估
[13]。如果只依赖术前标准成像技术,通常认为直径大于10 mm的淋巴结可能存在异常。然而众所周知,其中约20%的淋巴结在病理学检查中并没有发现异常情况。同样令人惊讶的是,直径小于10 mm的淋巴结显示出组织学上的包膜外扩散特征的高达23%。除了大小之外,其他一些特征,如内部坏死或存在边缘不规则的表现,可能提示淋巴结受到癌症的影响,但这些特征的准确性并不一致
[14]。目前无论是影像科还是外科医生,在应用成像工具时主要根据淋巴结的大小和形状来评估临床淋巴结分期。然而,反应性或炎症性淋巴结可以增大,而转移性淋巴结可能不呈现明显的肿大
[15-16]。这是目前临床医生在评估颈部淋巴结状态时遇到的一大难题。
此外有研究
[17]利用MRI在术前测量71名患者的肿瘤浸润深度,以评估患者的颈部淋巴结状态,真阳性率为69.6%,真阴性率为 89.6%,说明术前单纯依靠MRI的浸润深度尚不能很准确地评估颈部淋巴结状态,还需结合其他评估方法来提高准确率。但在OSCC患者临床分期指标中,MRI测量肿瘤浸润深度和肿瘤最大直径已经是准确性较高的方法,临床上作为评估患者临床分期的一种可靠的参考方法而使用。由此可见,部分患者的临床淋巴结分期不准确的风险仍然很高。总的来说,在术前标准成像技术下,判断淋巴结是否异常仍存在一定的限制,因此需要更准确、客观的参数来判断颈部淋巴结的性质。
2 影像组学的概述与特点
2.1 影像组学的概念
影像组学方法可以从医学成像数据中提取可量化的特征,这些特征基于影像的成像特征,包括像素强度、像素排列、像素颜色和纹理
[18-19]。影像组学能够将图像转换为可由软件处理的定量变量,从医学图像中提取许多人眼无法分辨的细微特征。虽然人眼可以利用其中一些特征对图像进行分类,但影像学特征的细微变化通常低于人眼可感知的阈值,因此人类可能无法检测到。与代谢组学、基因组学和蛋白质组学不同,影像组学是基于影像学成像,而不是侵入性活检或分子分析。后两者可能只捕获特定解剖部位或肿瘤内的一小部分疾病,获取成本高、对患者负担大,并且从多个疾病部位或连续时间点采集通常不可行
[20]。影像组学分析是在患者的常规临床护理过程中,从标准成像设备获取图像,在单个或多个时间点进行,因此影像组学最大的效用可能是将其与其他多模态数据集结合使用,不需要额外成像,并且能考虑到病变间的差异或异质性,理想情况下可覆盖疾病的整个范围
[21]。
2.2 影像组学的分类
影像组学可分为两大类。一类是基于手动勾画感兴趣区域的传统影像组学,该类方法提取的特征信息如标准摄取值、强度直方图或相位图像等,这些特征信息通常属于易感和低阶特征,可能无法完全捕捉肿瘤的异质性
[22]。随着人工智能在医学领域的应用不断发展,另一类新的影像组学方法开始在影像学应用。这种方法基于卷积神经网络(convolutional neural network,CNN),通过CNN从输入张量中提取与传统定量方法不同的更高级别的影像组学特征。然而,基于深度学习的影像组学更加抽象化,增加了理解和解释模型结果的复杂性,也由此引发了“黑盒”或“魔盒”思维;此外,CNN 输出结果的方式并不透明。深度影像组学的一个潜在优势在于整个图像被用作输入张量,这意味着可以从整个图像中提取放射学特征而无需进行分割
[23]。然而,深度影像组学面临“黑盒子”挑战,即深度学习系统的工作原理常常难以理解或解释。另外,所提取的特征架构多参数而抽象,不易概念化,因此对算法的“信任”程度需谨慎考虑。
2.3 影像组学的应用
迄今为止,影像组学主要应用于肿瘤学研究领域。影像组学工具已用于筛查、诊断、分期和预后、生物学相关性的探索和预测、对治疗反应的预测,以及深入了解癌症发展过程等
[24]。目前,影像组学的研究主要集中在肝癌
[25]、肺癌
[26]、乳腺癌
[27]、结直肠癌
[28]和食管癌
[29]等领域,对口腔癌的相关研究相对较少。在口腔癌领域,影像组学主要应用于诊断、病理分期、良恶性肿瘤鉴别以及颈部淋巴结转移等方面。影像组学特征通常从CT或MRI图像中提取。影像组学分析主要涉及以下7个关键步骤:1)规划,包括识别临床问题、设计研究和进行文献综述;2)数据管理;3)数据预处理和图像分割;4)放射学特征提取;5)建立放射学模型和评估性能;6)内部验证和测试;7)外部验证数据集
[30]。影像组学在肿瘤学领域的应用已经取得了显著进展,这些关键步骤的执行对于准确评估疾病状态和预测治疗效果至关重要。
3 影像组学在OSCC颈部淋巴结转移预测中的研究进展
3.1 CT影像组学模型在OSCC颈部淋巴结转移预测的应用
CT影像组学已应用于OSCC领域,包括早期筛查
[31]、生存率预测
[32]、良恶性肿瘤鉴别诊断
[33]、良性腮腺肿瘤分类
[34]以及颈部淋巴结转移
[35]等方面。由于颈部淋巴结转移对口腔癌患者的生存至关重要,因此相关研究日益增多。Committeri等
[35]以原发灶为感兴趣区域(region of interest,ROI),建立影像组学特征联合临床病理模型,预测颈部淋巴结隐匿性转移,结果显示:临床病理联合影像组学模型准确度更优。为了提高颈部淋巴结分期的准确性,一些学者开始关注颈部淋巴结的影像组学特征提取。相比于原发性肿瘤本身,颈部淋巴结在影像上可能更容易定位,并且受伪影或较小体积的影响较小
[36],因此绘制颈部淋巴结轮廓可能是一个更标准化的过程,可降低个体之间的差异,从而有助于提高颈部淋巴结分期的准确性。Tomita等
[37]使用颈部淋巴结作为ROI,预测颈部淋巴结转移。在验证队列中,影像组学模型的曲线下面积(area under the curve,AUC)分别为Ⅰ区0.820、Ⅱ区0.930、Ⅰ~Ⅱ区0.820,优于3个影像科医生的结果(分别为0.773~0.798、0.825~0.865和0.798~0.816)。该结果表明:在验证队列中,最佳影像组学模型能够非侵入性地区分良性和转移性颈部淋巴结,并且在各个区域的AUC均优于影像科医生。相比传统CT,影像组学方法在区分良性和转移性颈部淋巴结方面具有更好的诊断性能。Kubo等
[36]基于早期舌鳞状细胞癌患者的颈部淋巴结整体特征和颈部淋巴结分区特征提取信息,发现从每个颈部淋巴结分区提取特征的最佳模型(准确度为0.96,AUC为0.98)比以颈部淋巴结为整体提取特征的最佳模型(准确度为0.85,AUC为0.92)具有更高的预测性能。这表明分析每个颈部淋巴结水平可能比整体分析更有用,并且有可能确定发生隐匿性淋巴结转移的水平。Chen等
[38]采用基于深度学习和影像组学的融合模型,证明了联合使用手动学习特征和自动学习特征的融合模型(AUC:0.950)在诊断性能上优于单独使用这两种特征的模型(分别为0.895和0.912)。该研究还比较了融合模型与临床医生术前诊断颈部淋巴结转移的准确性、灵敏性和特异性差异,发现融合模型的灵敏性更高,但准确性和特异性稍逊;尤其对于内部低密度影和特征不典型的淋巴结,容易被误判为转移性淋巴结。因此,该研究认为融合模型可以作为OSCC术前诊断颈部淋巴结转移的辅助工具,提高临床医生的工作效率。这些研究表明影像组学在预测颈部淋巴结转移方面具有优势,特别是结合不同特征提取方法和模型的综合分析,有望提高诊断性能和预测准确性。但上述研究均是回顾性单中心研究,未来需进行多中心研究及前瞻性研究进一步验证。
3.2 MRI影像组学模型在OSCC颈部淋巴结转移预测的应用
MRI扫描相较于CT具备以下优势:非电离辐射,能更好地表征局部肿瘤范围,能更好地评估骨髓受累,以及更好地检测神经周围扩散
[39],此外,MRI具有出色的软组织分辨率和较低的金属伪影影响(如假牙和植入物),被广泛用于头颈部恶性疾病的分期诊断
[40]。由于上述优势,MRI影像组学已逐渐在OSCC领域得到应用,包括生存预测
[41]、治疗效果评估
[42]、病理分级
[43]、肿瘤分期以及颈部转移预测
[44]等。在预测颈部淋巴结转移方面已有相关研究。Ren 等
[45]利用MRI多参数、多序列的优势,使用表观扩散系数(apparent diffusion coefficient,ADC)和直方图特征的组合模型,展示出更好的预测性能(AUC达到0.87)。这表明扩散加权成像(diffusion-weighted imaging,DWI)和动态对比增强MRI(dynamic contrast enhanced MRI,DCE-MRI)的直方图分析可以提供更多的生物学信息,可能是识别早期舌鳞状细胞癌中隐匿性转移淋巴结状态的更好的替代成像标记。此外,直方图分析也更适合临床需求,医生在没有高水平数学知识的情况下,更容易实施和解释直方图分析。Yuan等
[46]应用机器学习,将传统的MRI纹理分析与T2WI和对比增强T1加权成像(contrast-enhanced T1-weighted imaging,ceT1WI)相结合,构建预测模型,用于预测早期OSCC中隐匿性颈部淋巴结转移,结果显示:与单独使用T2WI和ceT1WI相比,纹理分析与机器学习相结合的方法在预测性能上表现更佳,AUC达到0.80。这项研究提示机器学习在影像组学研究领域具有巨大的应用潜力。Liu 等
[47]探讨了多模态 MRI 影像组学机器学习模型在预测口腔舌鳞状细胞癌LNM中的应用价值。基于不同 MRI 序列组合分为6组,通过最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)和4种机器学习模型构建预测模型,结果显示T1WI、T2加权脂肪抑制序列(T2-weighted imaging fat suppression,T2WI-FS)、T2WI和对比增强磁共振(contrast enhanced MRI,ce-MRI)在预测性能表现较好;有ce-MRI的模型较没有ce-MRI的模型表现更好。但是将各组相互比较时,发现模型的性能并没有随着影像组学特征数量的增加而提高,特别是比较来自常见MRI序列(如T1WI、T2WI-FS、T2WI和ADC)的特征时。这可能是因为与ce-MRI相比,某些序列(如T2WI和T2WI-FS)无法很好地区分肿瘤和肿瘤周围的固有炎症和水肿;另外,T1WI和ADC等序列也不能很好地区分正常组织和病变,尤其是小病变;因此,描述时不可避免地会增加ROI将非肿瘤组织包括在这些常见序列中的混杂因素。综上所述,选择不同MRI序列时,需要考虑其区分肿瘤和固有炎症、水肿以及正常组织和病变的能力。在早期OSCC隐匿性转移领域,MRI多序列、多参数特征尚未得到充分利用。为提高预测模型的准确性和可靠性,有必要进一步探索更多影像学特征和序列组合。
4 总结与展望
影像组学是一个快速发展的研究领域,通过多组学数据分析(包括影像组学、基因组学、蛋白质组学和代谢组学),结合临床病理因素,可以辅助用以预测疾病,进行患者分层和实现精准医疗
[48]。影像组学预测模型有可能成为非侵入性的诊断治疗前口腔癌症和淋巴结状态的有效工具。通过数字化和分析医学图像数据,模型的预测将变得更加客观和标准化,从而减少诊断过程中潜在的主观性和人为性错误。此外,随着可用数据量的增加,模型可以得到验证和修改,进一步提高其准确性和可靠性。目前这些模型还存在一些局限性。首先,模型的性能尚未在大规模、独立的外部数据集上进行验证,这限制了研究结果在广泛人群中的适用性;其次,缺乏结构良好、公开的全球性大数据和用于模型训练的方法;此外,手动勾画感兴趣区域,耗时费力且具有主观性。由此可见,未来的重点是应用人工智能技术构建预测模型,将影像组学与人工智能相结合应用于临床实践。目前需要进一步完善的方面包括:建立基于大规模独立数据集的验证,改进数据共享和处理标准,以及开发更高效的自动化ROI分割算法,这样才能更好地应用影像组学和人工智能,在临床应用领域中取得突破。