口腔癌是全球高发的恶性肿瘤,其侵袭性强、转移率高,且严重影响患者生存质量与预后,因此早期诊断至关重要
[1]。口腔癌的病理分型及颈部淋巴结状态是制定综合诊疗方案的关键依据
[2]。目前颈部淋巴结转移评估主要依赖影像学与组织学检查。增强CT(contrast-enhanced CT,CECT)虽普及率高、成像清晰且经济,但其诊断准确性高度依赖影像科医师经验,且存在主观偏倚
[3]。前哨淋巴结活检作为评估淋巴结转移的重要手段,其准确性受解剖变异、肿瘤浸润深度等因素制约,假阴性率为2.56%~36%
[4-5]。原发灶切取活检是确定病理分型的常规方法,但肿瘤内部坏死、纤维化及异质性,以及周围炎症病灶、取材部位选择和操作误差,均可导致假阴性结果
[6-7]。此外,活检破坏肿瘤完整性,加之病理制片过程中切线方向偏差或切割层数不足,均可能影响对肿瘤性质及浸润深度的准确评估
[8-9]。上述诊断环节的局限性,最终可能影响患者TNM分期的准确性及个体化综合诊疗方案的制定。
人工智能(artificial intelligence,AI)在口腔癌影像诊断中的应用日益广泛
[10]。影像组学作为关键AI技术,通过高通量提取医学图像特征,将其转化为可挖掘的高维数据,旨在提升对肿瘤等病变的量化评估与预测准确性
[11-13]。然而,传统影像组学方法通常聚焦于肿瘤整体特征,难以有效捕捉其内部因血供复杂性、坏死区域及基因表达异质性所形成的微环境表型变异
[14-15]。此外,影像组学模型的稳健性与可推广性易受图像采集、重建及预处理差异的影响。
生境分析基于传统机器学习原理,通过解析肿瘤内体素或像素间的空间关系,客观、无创地构建描绘肿瘤亚区的“生境地图”,以揭示隐含的微尺度信息。该技术不仅有助于阐明肿瘤微环境与宏观影像特征间的关联,也为精准诊疗提供了新视角。初步研究
[16]已证实生境分析在预测肿瘤生物学行为方面具有一定的潜力。
本研究旨在探索基于CECT生境分析模型来预测口腔鳞状细胞癌(oral squamous cell cancer,OSCC)颈部淋巴结转移及病理分型的新方法,评估其效能,并为早期干预及综合诊疗决策提供影像学依据。
1 材料和方法
本研究获得大连医科大学附属第二医院医学伦理委员会批准(KY2025-487-01)。
1.1 研究对象
回顾性收集2014—2025年大连医科大学附属第二医院经病理诊断为OSCC患者的CECT。患者纳入标准:1)接受手术切除原发灶及颈淋巴结清扫术;2)术后经组织病理学检查为鳞状细胞癌;3)术前4周内接受CECT检查;4)接受CECT及手术治疗前,未发现其他实体和/或部位的肿瘤。排除标准:1)存在恶性肿瘤既往史;2)肿瘤边缘存在水肿、炎症病灶等,严重影响阅片;3)因各种原因引起运动伪影和/或图像失真,使图像质量较差,肿瘤范围内的影像不清晰。
1.2 影像数据获取
本研究以术后颈部淋巴结状态(lymph node metastatic,LNM)及病理分型作为研究结局,分别评估临床模型、生境模型、临床+生境组合模型的预测能力。
本研究中,感兴趣区域(regions of interest,ROI)的收集通过ITK-SNAP软件(版本4.2.2,
http://www.itksnap.org/pmwiki/pmwiki.php,美国宾夕法尼亚大学)完成,由2位高年资头颈部放射科医师手动分割患者CECT图像中的病灶区域。为确保数据质量,要求病灶范围占据ROI区域的50%以上,且ROI图像为矩形,边长为1 cm×1 cm。通过双医师双重检查减少提取过程中的偏倚,同时排除原发性肿瘤不可证实或图像因伪影显著退化的病例,最终按照病理分型(每类150个ROI)和淋巴结状态(阳性及阴性,每类150个ROI)分别构建数据集,用于后续模型训练与评估。
由于本实验的建模思想依赖于对原始数据集图像的特征提取和聚类分析,对数据集的质量要求较高,因此为确保模型能够有效学习并增强泛化性,本实验在模型训练前对图像进行了以下预处理操作
[17-18]:1)通过0°~360°的随机旋转、随机缩放、随机裁剪等操作,对数据集进行增强,增加图像的多样性,提高模型的泛化能力,避免过拟合;2)采用去噪、缺失值处理等技术对数据进行清洗,消除图像中的干扰信息,确保数据质量;3)将图像调整为统一尺寸,或通过填充保持原始比例,确保输入数据的一致性,便于批量处理。
1.3 临床模型建立
本研究收集了纳入患者的临床特征,包括年龄、性别、不良习惯、肿瘤部位、临床TNM分期(第8版)、周围神经浸润征象(包括疼痛、麻木或运动障碍)、通过肉眼判断的CECT上的淋巴结状态、肿瘤生长方式、术后淋巴结状态和病理分型。以淋巴结转移(阳性/阴性)和病理分型(高分化、中分化、低分化)作为预测结局,基于上述临床特征分别构建病理分型的临床模型(P-Cli模型)和淋巴结转移的临床模型(LNM-Cli模型),用于评估模型对2种结局的预测能力。
本研究的病理诊断由2名高年资病理医师共同判定,存在分歧时由第3位医师仲裁;淋巴结转移依据组织病理学检查报告确认;高分化者细胞异型性小,可见大量角化珠及清晰细胞间桥,核分裂象少见;中分化呈中等异型性,偶见细胞间桥,核分裂象增多;低分化表现为显著异型性,极少或无角化,细胞间桥缺失,核分裂象活跃且多见病理性分裂。
1.4 生境模型建立
本模型采用上述ITK-SNAP软件中所收集的ROI图像,并对图像进行预处理。预处理后的图像运用Python软件(Python 3.14.2,
https://www.python.org,美国Python软件基金会)进行特征提取和统计分析,该软件符合成像生物标志物标准化倡议建立的基准和认证。通过K-means聚类方法针对ROI进行特征计算,包括熵、灰度共生矩阵(gray-level co-occurrence matrix,GLCM)及其特征、图像像素强度、Sobel边缘特征、直方图特征(分为4个区间)、计算局部二值模式、组合19维特征,并以3×3窗口对ROI图像进行聚类分析,最终划分为3个不同的区域,基于全连接神经网络(fully connected neural network,FCN)对得到的特征进行深度学习,最终生成18个特征向量,构建生境模型(如
图1所示)。本模型的输入层为2个预测结局下的5类ROI图像,输出层为对应的生境模型。研究中将淋巴结转移阴性标记为0,阳性标记为1;将组织病理检查结果为高分化者标记为0,中分化者标记为1,低分化者标记为2。将临床特征及生境分析生成的18个特征向量进行组合,形成临床+生境组合模型(如
图1所示)。
使用Loss曲线、Accuracy曲线及诺莫图对生境模型和临床+生境组合模型进行评估,通过混淆矩阵及受试者工作分析(receiver operating characteristic,ROC)曲线对上述模型进行性能评价(见
图1)。
2 结果
本研究收集了来自大连医科大学附属第二医院口腔颌面外科共计132例患者的CECT,经筛选后共107例患者入组,其中颈部淋巴结阴性72例,阳性35例,病理分型中高分化、中分化、低分化分别为51、41、15例,患者的年龄、性别、不良习惯、肿瘤部位、TNM临床分期、周围神经浸润征象等临床特征见
表1。以8∶2的比例随机将样本分为训练集(86例)与测试集(21例)。通过卡方检验和Fisher精准检验,发现临床T分期、N分期及CECT上通过肉眼判断的淋巴结状态与淋巴结转移有相关性(
P<0.05),N分期和肿瘤生长方式与病理分型有相关性(
P<0.05)。
基于K-means聚类与FCN提取的18个生境特征向量,本研究构建了淋巴结转移生境模型(LNM-H模型)及病理分型生境模型(P-H模型)。模型性能评估指标包括损失曲线、准确率曲线、ROC曲线(
图2)、混淆矩阵及诺莫图。分析结果显示:P-H模型的ROC曲线的曲线下面积(area under the ROC curve,AUC)分别为高分化0.91、中分化0.92、低分化0.83;LNM-H模型的AUC分别为阴性0.73、阳性0.73。P-H模型宏观精度为0.730(
表2);LNM-H模型的宏观精度为0.667,F1分数为0.328,召回率为0.633(
表3)。
为探索将AI与临床医学相结合的新型诊断模式,本研究将生境分析特征与临床特征相结合,组成临床+生境组合模型。分析结果显示:淋巴结转移组合模型(LNM-C模型)的AUC值为0.97,在混淆矩阵中的准确度为0.967,召回率为1.000,F1分数为0.483(
表3);病理分型组合模型(P-C模型)的AUC值分别为高分化1.00、中分化0.94、低分化1.00,宏观精度达到0.940(
表2)。2种结局的诺莫图结果如
图3所示:淋巴结转移模型中,N分期重要性高于其他特征,性别、年龄及部分影像学特征亦占有一定权重;病理分型模型中,N分期依然是最关键的特征,同时生长部位、生长方式等特征也表现出明显权重。组合模型下的决策曲线图见
图4,显示淋巴结转移模型净收益随概率阈值变化呈下降趋势,与“全部治疗”“全部不治疗”策略对比,在不同阈值区间展现出特定收益差异;病理分型模型中“全部治疗”曲线呈上升态势,模型在部分概率阈值范围净收益更优,表明该模型可为病理分型决策提供有效参考。综合上述研究结果,与单一的临床模型或生境分析模型相比,临床+生境组合模型在预测颈部淋巴结转移及病理分型中展现出更高的精准性和判断能力。
3 讨论
OSCC是头颈部常见的恶性肿瘤,发病率持续攀升,已经构成了重大的公共卫生负担
[19]。准确评估淋巴结转移状态及病理分型对于判断患者预后和制定个体化术前诊疗策略至关重要。然而,临床查体、影像学评估及病理活检等常规诊断方法在实现早期诊断、精准分期以及指导个体化治疗方面仍存在明显的局限性
[20]。AI技术的迅猛发展,特别是影像组学技术的突破,为克服这些局限提供了革命性的新视角
[21]。在此背景下,本研究基于术前CECT影像构建了影像组学生境模型,旨在系统评估这种新兴模型在预测OSCC淋巴结转移及病理分型中的效能与价值,以期为临床医师在术前提供更精准的疾病进展预测工具,为术前诊疗方案提供关键的决策支持,以期最终改善患者管理和预后。
本研究除了收集患者的一般临床特征
[22],特别将肿瘤的生长方式及神经相关症状纳入临床考量
[23-24],以更加全面地评估预后。研究中将OSCC的生长方式分为溃疡性、外生性、浸润性共3种,通过数据分析,浸润性生长在低分化及淋巴结转移阳性患者中所占比例高于其他2类患者,差异有统计学意义(
P<0.05),可见生长方式对病理分型有影响。此外,本研究关注了神经症状在OSCC中的表现,在入组患者中伴随神经症状者的比例为57.9%,其占比明显高于无神经症状的患者,特别是在颈部淋巴结转移阳性及相对恶性程度较高的中低分化患者群中,伴随神经症状患者的比例高于神经症状阴性患者,差异有统计学意义(
P<0.05)。
本研究进一步证实了肿瘤生长模式及神经侵犯表现对口腔癌患者预后的重要预测价值
[22-24]。本研究中,低分化肿瘤及存在颈部淋巴结转移的患者中,浸润性生长的检出率高于其他组别,差异有统计学意义,提示该生长方式与肿瘤的转移潜能密切相关。在入组患者中,高达57.9%的患者表现出神经系统症状。深入分析发现:这些症状在合并颈部淋巴结转移以及中、低分化患者中的比例明显升高。这一现象的解剖学基础可能在于口腔区域特有的密集神经血管网络分布,不仅为肿瘤生长提供了营养支持,也可能为肿瘤细胞沿神经束和血管周隙的侵袭扩散提供了便利通道。由此可见,由肿瘤直接浸润神经结构引发的特定神经症状应被视为评估肿瘤局部侵袭程度和预测疾病进展的重要临床警示信号。
口腔癌的高度异质性使其生长演化受肿瘤微环境多因素调控
[25],而传统影像组学研究常局限于单一特征分析,难以解析肿瘤空间整体性及特征间交互作用
[26]。为此,本研究建立了基于口腔癌CECT的生境模型,将肿瘤视为多生态位构成的生态系统,验证生境异质性与病理分型及淋巴结转移的相关性。相较于传统临床模型,生境模型通过量化微环境动态变化,实现了“由表及里”的机制突破,精准映射肿瘤生物学行为
[27-29]。方法学上,本研究融合K-means算法的高效特征分群与FCN的非线性建模优势,实现了多尺度特征融合与三维空间拓扑分析,成功克服高维数据“维度灾难”并降低对数据质量的依赖性
[30-32]。本研究开发的生境分析模型在预测口腔癌病理亚型方面展现出显著优势,其原因可能由于口腔癌病理分类的细胞构型、分化状态及微环境异质性等微观特征与本模型捕捉的空间异质性信号形成精准映射。同时本研究通过K-Means聚类定量解析肿瘤影像的空间生态位,识别具有病理意义的微环境区域;继而利用FCN建立影像生境特征与组织病理表型的非线性关联模型,实现对原发性病变病理亚型的生物学合理性预测。然而,该模型对颈部淋巴结转移的预测效能相对有限,这一局限源于原发灶影像的间接预测无法直接观测微观转移过程。当预测目标依赖肿瘤细胞迁移的动态过程时,生境模型的解释力仍面临挑战。
为深入探索影像组学与临床医学的融合,本研究整合临床特征与生境特征,构建了临床+生境组合模型
[33]。测试结果表明:该组合模型对2种研究结局的预测性能均显著优于其他模型。 临床医师对疾病进展的主观评估有助于解析潜在的病理生理关系,从而弥补影像组学在捕捉生物学逻辑方面的固有局限
[34]。同时,生境分析提供了对肿瘤微环境的高通量量化,能够客观验证临床假设,并有效校正纯数据驱动模型中存在的认知偏差
[35]。这种人智协同范式,不仅降低了对图像质量差异和算法依赖性的敏感性,也减轻了临床特征采集过程中的人为偏倚
[36]。这种方法为口腔癌的早期诊断、精准分期及优化治疗策略的临床决策构建了一个强有力的支持框架。本研究亦存在一定的局限性:首先,回顾性分析采用单中心数据且样本量相对较小,需通过多中心研究进一步验证模型的泛化能力;其次,本研究未纳入组织病理学切片,仅依赖术后病理报告,可能导致影像学定义的感兴趣区域与其组织学对应区域匹配时存在不确定性
[37-38];再次,CECT成像易受口腔修复体伪影干扰,且软组织分辨率有限,未来研究应考虑引入其他成像模态作为替代或补充。
综合本研究可以看出:生境分析与临床特征相结合构建的临床+生境组合模型能够通过整合肿瘤微环境的异质性信息与患者的宏观临床特征,在术前对口腔癌的淋巴结转移及病理分型进行精准预测。