鼻咽癌(NPC)是起源于鼻咽部黏膜上皮的恶性肿瘤,主要分布在东南亚及中国南部地区
[1, 2]。磁共振成像(MRI)因其优异的软组织分辨率,已成为鼻咽癌术前评估及术后随访的重要影像学工具,扫描范围通常涵盖鼻咽及颈部区域,以确保准确的TNM分期
[3, 4]。然而,传统MRI扫描时间较长,对患者配合度要求较高。在保证图像质量和诊断需求的前提下,缩短扫描时间对于提升患者舒适度、提高检查成功率及优化检查流程具有重要意义。
当前MRI加速技术主要包括并行成像(PI)和压缩感知(CS)
[5, 6]。PI利用多通道线圈的空间敏感性加速采集,因其实现方式较为成熟,至今仍为临床最常用的加速方法,但其加速能力受限于线圈通道数,且高倍加速下图像信噪比会明显下降
[7, 8]。CS通过稀疏采样和迭代重建实现加速,理论上具有更高潜力,但重建过程复杂且可能影响病灶边缘清晰度,限制了其临床应用
[9, 10]。近年来,基于卷积神经网络的深度学习方法为MRI重建提供了新思路,能够通过端到端学习实现从k空间到图像空间的非线性映射,在细节保留和噪声抑制方面表现出显著优势
[11]。人工智能辅助压缩感知(ACS)作为该类方法的代表,将深度学习嵌入传统CS框架中,利用改进的ResNet与U-net网络从全采样数据中提取先验知识,并作为约束引入图像重建过程中,在保障图像质量的同时显著提升了扫描速度,已在临床获得广泛应用
[12-14]。
既往研究通过主观评分(如Likert量表)和客观指标(如信噪比、对比噪声比)评价表明,ACS在显著缩短扫描时间的同时,在图像质量、病灶细节显示及伪影抑制方面均优于传统PI序列
[12-17]。影像组学通过提取常规医学图像中人眼无法识别的高维定量特征,构建可解释的预测模型,推动医学影像分析从“视觉诊断”向“数据驱动”模式的转变
[18, 19]。尽管ACS作为新兴MRI加速技术逐渐普及,其在影像组学中的适用性仍未明确。当前,缺乏系统性研究验证ACS与PI在特征提取层面的稳定性及其在预测模型中的表现。现有大多数MRI鼻咽癌影像组学的研究均采用PI序列
[20-24],但已有研究表明,影像组学分析的稳健性高度依赖于特征的稳定性
[25, 26],而采集协议和重建算法等因素可能显著影响特征稳定性
[27-29]。Joo等
[27]发现,急性缺血性脑卒中的快速序列与传统T2-FLAIR序列因图像质量差异,导致提取特征显著不同;另有研究表明,即使使用相同序列,不同重建算法也可能影响前列腺MRI的影像组学特征
[30, 31]。然而,关于MRI加速序列对特征一致性及预测模型泛化能力的影响,尚缺乏系统性探索。在鼻咽癌MRI影像组学分析中,ACS与PI加速图像的特征一致性及其对预测模型性能的影响仍是亟待解决的关键问题。系统评估这一问题,对于推动新型MRI加速序列在影像组学中的规范应用具有重要意义。
因此,本研究将ACS序列的评估维度从传统的图像质量评价扩展至影像组学层面。通过严格控制变量的实验设计,系统评估了ACS在鼻咽癌影像组学中的应用可行性。研究中我们定量比较了ACS与PI两种加速序列在特征提取结果中的一致性,并进一步分析了其对分期预测模型性能的影响,为ACS技术在影像组学中的规范应用及未来多中心、大样本研究提供实证依据。
1 资料和方法
1.1 研究对象
本研究回顾性选取2021年8月~2022年7月于中山大学肿瘤防治中心接受鼻咽及颈部MRI检查的初诊鼻咽癌患者。研究方案已获医院伦理委员会批准(伦理批号:B2022-134-01)。初始共收集73例确诊或疑似鼻咽癌患者。纳入标准为:未经治疗且初诊为鼻咽癌,年龄≥18岁;排除标准为:未经病理学证实,依从性差、影像资料不完整或存在严重运动伪影。两名分别具有5年和8年诊断经验的放射科医师独立评估所有图像质量,排除显著伪影或解剖结构显示不清者,以确保用于特征提取的图像数据可靠。最终纳入64例病理确诊的鼻咽癌患者,男性42例,女性22例,年龄18~68(44.2±11.3)岁(
表1)。
1.2 图像采集与病灶勾画
所有检查均在联影uMR790 3.0T MR系统上完成,使用24通道头颈联合线圈和32通道脊柱线圈进行鼻咽–颈部联合扫描。扫描序列包括平扫快速自旋回波横断面T1WI、T2WI、矢状面T1WI、冠状面T1WI及弥散加权成像。增强扫描在注射钆对比剂后进行,序列包括横断面及矢状面T1WI,以及快速自旋回波水脂分离冠状面T1WI。实验序列中,平扫横断面T1WI、T2WI及增强横断面T1WI分别采用PI和ACS两种加速序列连续采集。除加速方式外,两组图像的其他成像参数均保持一致。所有采集图像均进行了厂家自带的B1场均匀性校正、图像均一化及变形校正(
表2)。
图像配准及肿瘤感兴趣区域勾画采用3D Slicer软件(
https://www.slicer.org/)进行。将ACS序列采集的三种加权图像分别与对应PI加速序列进行配准(使用SlicerElastix模块)。配准完成后,两名具有8年和34年头颈部影像诊断经验的放射科医师共同逐层勾画鼻咽癌病灶区域,协商一致后融合生成肿瘤容积(VOI)。
1.3 特征提取
本研究采用Python开源工具包Pyradiomics(版本信息见:
https://pyradiomics.readthedocs.io/en/latest/)对勾画的病灶区域进行影像组学特征提取。每种加权图像提取93种常用特征,包括:一阶统计(First-order)18个,灰度共生矩阵(GLCM)24个,灰度依赖矩阵(GLDM)14个,灰度游程矩阵(GLRLM)16个,灰度区域大小矩阵(GLSZM)16个,以及邻域灰度差分矩阵(NGTDM)5个。参照图像生物标志物标准化倡议(IBSI)指南
[32],所有图像数据进行了统一标准化处理,包括体素重采样至3 mm×3 mm×3 mm,并采用固定宽度(Bin width=25)进行灰度离散化,旨在最大限度减少采集协议差异对特征稳定性的影响。鉴于本研究的核心目标是直接比较同一设备、同一受试者连续两次扫描所重建图像的原始信号差异,未采用IBSI指南中针对多中心MRI组学研究推荐的灰度归一化或N4偏置场校正。这些预处理可能系统性改变图像的原始灰度分布,从而混淆或高估由重建序列本身引入的特征差异,可能带来不必要的混杂效应
[33-35]。因此,本研究保留了原始图像数据,直接揭示不同加速序列对影像组学特征稳定性的真实影响。研究流程见
图1。
1.4 特征一致性分析与模型构建
采用组内相关系数(ICC)评估ACS与PI加速序列在不同加权图像中提取的影像组学特征一致性。ICC计算基于双向混合效应、绝对一致性模型。结果按ICC值分为4个等级:ICC>0.90 为优秀,0.75< ICC≤0.90 为良好,0.50<ICC≤0.75 为中等,ICC≤0.50 为一致性差。特征ICC值>0.75 被认定为一致性良好、稳定性高的特征
[36]。
为比较不同加速图像对影像组学模型预测性能的影响,本研究基于ACS和PI图像提取的特征,采用相同的建模流程构建早期(T1~T2期)与晚期(T3~T4期)鼻咽癌的诊断预测模型,并对两者的性能进行比较。模型训练与验证采用留一交叉验证(LOOCV)方法。在每次迭代中,首先通过最小绝对收缩与选择算子(LASSO)对训练集进行特征降维和筛选。内层在对数区间[10⁻⁴, 10¹]上进行5折交叉验证,以优化正则化参数λ,外层则使用LOOCV,确保每个数据点都能作为验证集参与评估,从而减少数据泄漏的风险。随后,采用筛选后的特征构建随机森林分类模型,并在测试集上进行预测,重复迭代直至所有样本完成验证。
模型性能通过受试者操作特征曲线(ROC)及曲线下面积(AUC)评估,并结合准确率、敏感度、特异度等指标综合评估分类器效能。为提高模型的可解释性,使用基于合作博弈论的SHAP(SHapley Additive exPlanation)算法,量化特征对预测结果的贡献度,实现决策过程的透明展示
[37]。
1.5 统计学分析
所有统计分析均在Python(版本 3.9.5)环境中完成,主要使用 scipy 和 statsmodels 软件包。符合正态分布的计量资料以均数±标准差表示。采用Wilcoxon符号秩检验比较ACS与PI图像所提取组学特征ICC值的差异,通过Delong检验评估基于两种加速序列图像所构建预测模型的ROC曲线下面积是否存在统计学差异。以P<0.05为差异具有统计学意义。
2 结果
2.1 特征数据的一致性
从所有序列图像中提取的279个特征中,86.0%(240/279)具有良好一致性(ICC>0.75)。
图2展示了所有特征ICC按一致性等级分类的散点分布,
图3为特征ICC箱线图。在各序列中,平扫T1WI的特征ICC平均值为0.91±0.09(0.67~0.99),中位数为0.94,ICC>0.75的特征占比为90.3%(84/93);T2WI的ICC平均值为0.89±0.13(0.46~0.99),中位数为0.94,ICC>0.75的特征占比为84.9%(79/93);增强T1WI的ICC平均值为0.88±0.11(0.44~0.99),中位数为0.89,ICC>0.75的特征占比为82.8%(77/93)。增强T1WI的特征一致性显著低于平扫T1WI(
t=1623.0,
Z=-2.155,
P=0.031)和T2WI(
t=1417.0,
Z=-2.945,
P=0.003),而平扫T1WI与T2WI间的特征一致性无统计学差异(
t=2122.0,
Z=-0.243,
P=0.808)。
2.2 影像组学建模性能比较
基于ACS和PI图像,采用相同的建模与验证流程,分别构建了鼻咽癌早期(T1~T2期)与晚期(T3~T4期)的分类预测模型,并在全部特征及ICC>0.75的一致性良好特征子集上进行了训练与性能评估。结果如
图4和
表3所示:在使用全部特征构建的分期模型中,PI和ACS模型的AUC分别为0.90和0.89,差异无统计学意义(
Z=0.011,
P=0.991);当使用一致性良好的特征子集进行建模时,两类模型的AUC均提高至0.92,组间差异仍无统计学意义(
Z=3.090,
P=0.998)。
2.3 组学模型的可解释性
为提高模型在临床应用中的可解释性,采用SHAP方法对基于PI与ACS图像特征构建的随机森林模型进行了解释性分析。SHAP基于合作博弈论原理,能够量化特征对个体预测结果的贡献,并评估其对模型输出的影响方向与强度。
图5分别展示了基于PI与ACS图像的分期预测模型的SHAP特征重要性排序结果,图中颜色深浅表示特征值的高低,横轴的SHAP值反映特征对预测结果的影响方向与程度。
以PI模型为例,Coarseness特征值较高的样本更可能被预测为晚期(T3–T4),呈现正向贡献。在ACS模型中,GLSZM_SmallAreaEmphasis特征的SHAP值分布范围最大,对模型输出的影响程度最高。两个模型中,SHAP排名前列的特征主要为纹理类特征,包括GLCM、GLSZM和GLRLM等。SHAP值分布显示,模型分类结果依赖多个特征的复杂非线性联合判断,而非单一特征的阈值决策。
3 讨论
随着ACS技术逐步应用于临床,MRI影像组学研究正从传统PI图像向ACS图像过渡。尽管这一转变符合技术发展的趋势,但仍需验证ACS在特征一致性和模型预测性能方面的有效性。本研究首次评估了ACS加速序列在鼻咽癌影像组学中的可行性,结果表明,ACS与PI加速序列所获的T1WI、T2WI和增强T1WI在提取组学特征时,大多数表现出良好的一致性。此外,在相同建模方法下基于ACS和PI加速图像构建的鼻咽癌T分期诊断预测模型表现相当,进一步证明了ACS序列在影像组学预测中的应用潜力,且具备替代传统PI序列的可能性。
尽管本研究是在单中心、单设备条件下进行的,但所识别的稳健特征为多中心研究的进一步验证提供了重要参考。多中心研究的主要挑战之一是由于不同厂商、磁场强度和扫描协议引起的系统性偏倚。为了提高影像组学模型的泛化能力,首先需要建立统一的标准化图像采集协议,如遵循QIBA等倡议
[38-40];其次,应采用标准化的后处理技术,以及利用ComBat及其变体方法进行特征层面的批效应校正,或采用基于物理信息的离散化(PID)策略,以减少中心间的差异并增强特征的鲁棒性
[41-43]。本研究在单中心条件下识别出的稳健特征为上述标准化框架下的进一步验证提供了潜在的候选指标。
影像组学的核心在于挖掘人眼难以识别的图像高阶信息,组学特征本质上是对图像灰阶信息的数学量化。图像采集质量直接影响特征提取的可靠性。ACS技术不仅加速了图像采集过程,还能有效提高信噪比并抑制伪影
[13],从而确保特征提取的准确性和稳定性。这也是本研究中ACS与PI加速图像特征一致性较高(86.0%的特征ICC>0.75)及模型预测性能相当的关键因素。尽管全采样图像被视为理想参照,但其扫描时间较长,临床应用受限。因此,本研究以PI加速图像作为基准,使得结论具备更广泛的临床参考价值。此外,作为“黑箱”理论的一部分,影像组学通过SHAP分析揭示了多特征协同影响模型输出的机制,提升了决策过程的透明度与可信度,推动模型的临床转化。两个模型中的关键特征主要与影像纹理异质性相关,这与晚期鼻咽癌的影像学特征一致,因其常侵犯颅底骨质及周围组织,导致影像上出现坏死、出血及细胞密度变化等表现,这些纹理特征具有一定的生物学解释基础
[20, 21]。
在鼻咽癌MRI成像中,增强图像相比平扫图像能提供更清晰的病灶细节和更好的组织对比度。然而,在不同加权图像的影像组学特征一致性分析中,增强T1WI提取的特征一致性低于平扫T1WI和T2WI。我们认为,这一现象可能与造影剂在病灶内的动态分布及由此引起的对比度微小变化有关,这些变化可能影响特征提取的稳定性。尽管鼻咽癌为富血供肿瘤,通常注射造影剂后在动脉期(约40~60 s)显著增强,随后进入平台期或缓慢上升期(2~5 min内)
[44],为了减轻早期强化阶段对图像采集的影响,本研究将增强横断位图像的采集安排在最后。增强图像本质上是动态增强过程的瞬时捕捉,受采集时相、组织灌注特性等生理和操作因素的影响。这些因素在不同个体间可能存在差异,导致病灶增强区域信号强度的变化,从而影响纹理特征的可重复性。此外,增强图像常见的病灶内部强化不均现象使得图像对局部灰度变化高度敏感,进而降低了如灰度共生矩阵(GLCM)等纹理特征的稳定性。本研究结果与Carbonell等
[45]在肝癌增强影像特征重现性研究中的结论一致,同时也与既往CT增强扫描中影像组学特征重现性下降的现象相符
[46, 47],提示这一问题可能普遍存在于不同影像模态中。
本研究存在若干局限性。首先,受限于临床扫描时间与患者流通量,总样本量为64例。尽管该规模可支持影像组学特征一致性的初步评估,但在构建临床分期预测模型时,样本量仍偏小,可能影响模型的泛化能力。其次,由于鼻咽癌初诊患者大多为中晚期(III~IV期),样本存在类别不均衡问题。尽管本研究采用留一交叉验证提高小样本分析的稳定性,未来仍需扩大样本量,特别是增加早期病例,确保各分期的分布均衡,从而提升模型对早期病变的识别能力。此外,考虑到样本规模限制,本研究选择随机森林作为主要建模工具。该方法在小样本情况下训练稳定,且对超参数调节相对鲁棒,同时结合SHAP方法提升了模型的可解释性,从而增强了其临床可用性与可信度。最后,本研究仅评估了单一厂商的ACS加速算法,不同深度学习重建策略(如K空间、图像域或混合域方法)在图像质量与细节保留方面可能存在差异,进而影响组学特征稳定性与预测性能
[30]。因此,未来应开展多中心、多平台的联合研究,以进一步验证不同加速方法对影像组学分析结果的影响。
综上所述,在鼻咽癌MRI影像组学研究中,基于ACS加速图像提取的组学特征与传统PI加速图像提取的特征具有较高的一致性,并且在构建分期诊断预测模型时表现相当。因此,ACS技术有望为影像组学研究提供更高效的临床数据采集方案。