融合位置编码的阿尔茨海默症诊断与病理区域可视化

葛威 ,  刘汝璇 ,  唐奇伶

中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 515 -525.

PDF (3009KB)
中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 515 -525. DOI: 10.20056/j.cnki.ZNMDZK.20250411
物理与电子信息科学

融合位置编码的阿尔茨海默症诊断与病理区域可视化

作者信息 +

Fusion position encoding in Alzheimer's disease diagnosis and visualization of pathological regions

Author information +
文章历史 +
PDF (3080K)

摘要

阿尔茨海默症(AD)的早期诊断对于及时治疗以减缓进一步恶化至关重要.AD病理特征的可视化对于临床应用具有重要价值.研究设计了一种基于位置编码的全卷积网络(P-FCN)模型,该网络构建了大脑局部结构学习策略,并迁移到整体sMRI影像模型中,以生成高分辨率的病理概率图.其中,位置编码将所有影像模板对齐到标准空间,利用统一的笛卡尔空间表示脑图像的位置,并结合冠状面、矢状面和轴位面的位置信息生成三维位置编码.P-FCN模型融合位置响应与病理特征,将学习到的病理概率图应用于分类模型中.分类模型使用基于注意力机制的CNN-BiLSTM网络,以学习不同区域影像数据之间、多模态数据之间的关联信息,并提高模型对重要参数的敏感性.该模型使用ADNI数据集进行训练与测试,并使用独立的数据集(AIBL、NACC)对模型泛化能力进行验证.在不同数据集之间都能捕捉到相应的病理区域并表现出良好的诊断性能,验证了该方法在可视化病理区域及疾病诊断方面的有效性及良好的泛化能力.

Abstract

The early diagnosis of Alzheimer's disease (AD) is the leading cause of dementia worldwide is critical for timely treatment to slow further deterioration. Visualization of pathological features in AD brain regions is of great value for clinical applications. In this work, a Position Encoding Full Convolutional Network (P-FCN) model based on a local brain structure learning strategy is designed, which is constructed and migrated to the overall sMRI image model to generate high-resolution probabilistic maps of pathology. In this regard, position encoding is performed by aligning all image templates to a standard space so that the positions of brain images can be represented using a uniform Cartesian space and combining position information from coronal, sagittal and axial planes to generate 3D position encoding. The P-FCN model fuses the position response with pathological features and applies the learned pathological probability maps to the classification model. The classification model uses a CNN-BiLSTM network based on an attention mechanism to learn associations between different regions of image data, between multimodal data, and to improve the sensitivity of the model to important parameters. The model is trained and tested using the ADNI dataset, and the model generalization ability is validated using independent datasets (AIBL, NACC). The corresponding pathological regions were captured between different datasets and showed good diagnostic performance, demonstrating the effectiveness and good generalization ability of the method in visualizing pathological regions and disease diagnosis.

Graphical abstract

关键词

阿尔茨海默症 / 位置编码 / 全卷积网络 / 可视化 / 磁共振成像

Key words

Alzheimer's disease / position encoding / full convolutional networks / visualization / magnetic resonance imaging

引用本文

引用格式 ▾
葛威,刘汝璇,唐奇伶. 融合位置编码的阿尔茨海默症诊断与病理区域可视化[J]. 中南民族大学学报(自然科学版), 2025, 44(04): 515-525 DOI:10.20056/j.cnki.ZNMDZK.20250411

登录浏览全文

4963

注册一个新账户 忘记密码

阿尔茨海默症(AD)是全球范围内导致痴呆症最常见的原因1,其特点是认知功能逐渐受损,最终导致不可逆转的神经元损失2.未来随着老龄人口的不断增加,会加剧现有医疗服务的压力.随着临床需求的不断增加可能会加重老年人的发病率和死亡率3,然而目前临床诊断过程非常耗时,并且需要临床医生进行广泛的临床培训和经验积累.因此,利用深度学习可视化病理结构变化,以开发自动化方法为临床医生进行阿尔茨海默症诊断提供有意义的认知衰退发病机制信息.然而,由于病理区域与邻近区域之间的低对比度、病理边界模糊以及病理形状不规则等问题,使该任务具有一定挑战性.
近年来,在阿尔茨海默症诊断方面,进行了持续的研究,包括开发脑脊液(CSF)生物标志物4和先进的成像模式(例如淀粉样蛋白和tau正电子发射断层扫描(PET)5-6).但这些诊断方法受限于研究环境,临床诊断仍依赖于传统的临床评估[如简易智力状态检查量表(MMSE)]、神经心理学测试7和结构磁共振成像(sMRI)8.需要进一步优化这些生物标志物和成像模式,以改善阿尔茨海默症的临床诊断和管理.与痴呆症相关的脑部萎缩是阿尔茨海默症及其进展的重要生物标志,结构性磁共振成像可以无创地捕捉萎缩过程所引起的深刻的大脑变化,尤其考虑到萎缩过程甚至早于失忆症状的出现9.虽然sMRI揭示了阿尔茨海默症相关的大脑特征性变化,例如海马和顶叶萎缩,但这些特征被认为缺乏基于成像的阿尔茨海默症诊断的特异性10.针对阿尔茨海默症的诊断存在单一sMRI图像相对不精确,CSF和PET诊断侵入性较强以及缺乏具有足够经验和诊断专业知识的临床医生等不足之处,本文将sMRI影像数据和临床信息相结合,应用深度学习技术进行AD诊断11.此方法具有广泛的临床应用前景,可以为研究阿尔茨海默症的病理机制和治疗策略提供有力的支持.
深度学习已广泛应用于AD领域研究,例如,基于3D CNN网络12-13将3D全脑图像作为输入,进行准确的阿尔茨海默症诊断;基于体素形态及先验知识提取块级和区域级特征14-15,用于检测AD结构变化并进行诊断.尽管取得了令人鼓舞的结果,但由于以下原因,这些模型尚未完全融入临床实践.首先,目前深度学习算法缺乏外部验证,因为大部分模型都仅在单一数据集上训练和测试.此外,尽管目前研究能够对疾病进行高精度分类,但目前的方法中既没有阐明潜在的诊断决策,也没有指出与输出预测相关的病理特征.在医学应用中,决策的解释与诊断的依据(例如,哪些脑区有助于决策)对于临床整合、错误追踪和知识发现至关重要.目前已有的深度学习方法在临床应用方面面临两大主要问题:一是缺乏对单一数据集驱动模型的外部验证,二是目前深度学习模型决策过程的不透明性.
为了克服上述限制,本文选择三种不同的数据集进行模型开发和验证,并构建了一种基于位置编码的全卷积网络(Position Encoding with Full Convolutional Network,P-FCN)模型,将病理区域的位置响应与分类特征相结合,以生成可视化的阿尔茨海默症高风险病理概率图,然后将其用于预测阿尔茨海默症的状态.此外,为了提升分类性能,本文设计了基于注意力机制的CNN-BiLSTM分类模型.集成多模态的输入数据(包括选定高风险病理概率图中的体素以及年龄、性别和MMSE),通过BiLSTM学习来自不同区域疾病体素值之间的联系及影像数据与非影像参数之间的关联,以准确预测阿尔茨海默症状态.

1 数据与方法

1.1 实验数据集

本文使用的阿尔茨海默症相关样本选取自三个不同的数据集(ADNI、AIBL及NACC).ADNI(Alzheimer's Disease Neuroimaging Initiative)16是一项纵向多中心研究,旨在开发用于早期检测和跟踪阿尔茨海默症的临床、影像学、遗传和生化生物标志物. AIBL(Australian Imaging, Biomarkers and Lifestyle Flagship Study, AIBL)17是澳大利亚同类研究中规模最大的,旨在发现影响阿尔茨海默症发展的生物标志物、认知特征和生活方式因素.NACC(National Alzheimer's Coordinating Center)18维护着一个大型关系数据库,其中包含从美国各地的阿尔茨海默症中心收集的标准化临床和神经病理学研究数据.

本文数据选取和排除标准参考了ADNI研究16的基线招募方案,选取了年龄大于等于55岁,临床诊断为阿尔茨海默症或认知正常,并在临床诊断日期前后6个月内进行了1.5T-T1加权sMRI影像诊断的样本.此外,排除了混合性痴呆、非阿尔茨海默症痴呆、严重创伤性脑损伤史、严重抑郁症、中风和脑肿瘤以及重大全身性疾病的样本.本文使用相同的标准来选择其他数据集队列中的样本,以保持一致性.本文从ADNI队列中选择了417人,从AIBL中选择了382人,从NACC队列中选择了292人.除sMRI影像数据外,本文还获取与阿尔茨海默症相关的临床信息(年龄、性别和MMSE).年龄有助于模型更好地捕捉随年龄增长带来的大脑形态变化,从而提高预测性能.将性别纳入模型,有助于模型区分性别因素对大脑形态和病理变化的影响.MMSE评分是常用的评估认知功能的工具,对早期诊断和病情监测具有重要作用.将MMSE评分引入模型,可以增强模型对早期认知变化的感知能力.详细信息如表1所示,其中AD表示被诊断为阿尔茨海默症,NC表示正常的受试者.对于一个人在时间窗内进行了多次sMRI扫描的情况,本文选择最接近临床诊断日期的影像作为样本.

1.2 图像预处理

训练之前将所有数据集获取到的NIFTI格式的sMRI影像数据按照标准流程进行预处理.首先使用HD-BET19工具剥离颈部组织及脑颅骨.其次使用FSL软件中提供的FLIRT工具20对影像数据进行仿射配准,使其与MNI152模板线性对齐,以消除全局的线性差异,使不同的影像数据之间具有相同的空间分辨率(1×1×1 mm3).然后将NIFTI数据转换成numpy数组,以便进行高效的数据处理和分析,并进行Z-score体素标准化,将数据转换为标准正态分布,消除了不同数据之间尺度差异的影响,使其更具可比性和一致性.裁剪掉体素值低于-1或高于2.5的强度异常值,以确保数据分析的可靠性和准确性.最后去除图像背景,将脑部区域之外的所有背景区域的体素值都设置为-1,以确保背景强度均匀.经过以上预处理步骤最终得到的影像数据的尺寸为181 mm×217 mm×181 mm.

1.3 融合位置编码生成病理概率图

本文使用基于位置编码的全卷积神经网络(P-FCN)来可视化阿尔茨海默症的病理区域.首先,采用patch-wise的训练策略对输入的sMRI图像进行训练.具体来说,将每个完整的sMRI影像进行随机采样,得到n个patch,然后将采样到的patch传递给P-FCN模型进行训练.使用位置编码获取的相应位置响应并与FCN模型得到的特征表示相融合,以提高模型的性能.使用样本对应阿尔茨海默症的真实标签作为分类指标,进行模型训练.

接着,由于P-FCN模型的操作与输入数据大小无关,因此本文将经过patch-wise训练策略的模型迁移到整体sMRI影像中.通过使用局部预训练的模型来预测整个sMRI影像映射疾病的二分类概率,使该模型能够生成输入sMRI样本的病理概率图,实现AD的病理区域的可视化,并利用病理区域的体素信息增强分类模型.

1.3.1 基于patch-wise训练策略的P-FCN模型

鉴于三维sMRI影像数据庞大的数据量与计算参数,本文使用计算效率高的patch-wise训练策略来训练P-FCN模型,P-FCN采用随机采样3000个尺寸为47×47×47体素patch作为网络的输入.考虑到sMRI图像分析任务中,位置信息对于病理区域辨别非常重要,因为不同的病变可能会在不同的位置出现.为了准确地捕捉sMRI影像中的病变位置和形状,本文设计了基于位置编码的门控分支将位置信息与病理特征相结合.位置编码使用了一个三维的笛卡尔坐标系来指定sMRI影像中每个体素的位置.这个坐标系可以被看作是一个全局的空间参考系,可以在不同的sMRI影像之间共享.与使用独热编码(One-Hot Encoding)21表示位置信息相比,位置编码能够指示每个体素在笛卡尔坐标系中的精确位置,而独热编码只能指示位置是否存在.这种方式可以更好地表达不同体素之间的相对位置关系,提高模型对sMRI影像中不同位置的特征表征能力.故将位置编码与卷积神经网络相结合,以提供更加灵活的位置信息控制机制,使模型可以更好地表达sMRI影像中不同位置的特征信息.

为了提取不同受试者的采样图像patch的位置信息,需要将所有sMRI图像通过线性仿射配准到标准空间模板(MNI152).因此,所有图像共享同一个三维笛卡尔空间.通过三维笛卡尔坐标系,位于(i,j,k)中的patch可以定义为Pi,j,k,其中(i,j,k)表示3D空间中的坐标,如图1中所示.进一步将三维笛卡尔空间中的坐标表示为4D张量IL3×W×H×D,该张量由三个通道(即冠状位、矢状位和轴位)组成22.每个坐标通道都是通道为1的张量,如冠状面表示为ICoronalL1×W×H×D,其值在第一个冠状面上填充为1,在第二个冠状面上填充为2,在第三个冠状面上填充为3,以此类推.将所有冠状面填充完之后,对所有冠状面每一面的数值进行-1和1之间归一化.类似地,ISagittalIAxial的值分别通过矢状面和轴向面填充.将这三个坐标通道被连接起来,最终形成一个完整的表示三维笛卡尔空间位置的张量IL3×W×H×D.由于3D空间坐标指示了大脑区域的位置,本文通过sMRI随机采样的区域信息,从IL3×W×H×D获取到对应patch的位置信息I'L3×W'×H'×D'.

图2所示,P-FCN模型由FCN和基于位置编码的门控分支组成,其中FCN包含六个卷积块,前四个卷积块都由3D卷积层组成,每个卷积层都包含以下操作:3D最大池化、3D批量归一化、Leaky Relu和Dropout.基于位置编码的门控分支由位置编码和门控网络组成,所有的sMRI样本都共享一个三维笛卡尔坐标空间,本文从标准的4D张量IL3×W×H×D空间获取到对应patch的位置信息I'L3×W'×H'×D',并作为基于位置编码的门控分支的输入.位置编码获取到随机采样patch的位置信息I',并对patch的中心位置信息进行编码,使其能与FCN提取的特征表征相融合.通过层次化提取卷积神经网络中感受野的中心位置,以获取patch的中心位置信息.这个提取过程使用多层卷积和非参数化核权重,其中核中的所有权重都设置为0,但中心位置权重为1.经过此过程提取到的patch中心位置信息尺寸为L3×w×h×d,并通过2个1×1×1的卷积层以增加特征映射的数量来提取相关语义特征表示I^Lf×w×h×d,每个卷积层都包含3DInstanceNorm及ReLu激活函数,以便检测任务定向的区域.在门控网络中通过2层1×1×1的卷积层对语义特征表示进行编码减少输出特征图的数量,并对剩余的特征图平均化,最终通过sigmoid激活函数生成patch病理位置响应GL1×w×h×d.位置响应由Gi,j,k[0, 1]组成,表示位于(ijk)位置产生的病理响应程度.将通过基于位置编码的门控分支生成patch级的病理位置响应G乘以FCN网络中经过卷积层获得的病理特征,产生具有位置感知的patch级病理响应,将其传入最后两个分类卷积层.最后两个卷积层充当分类任务的密集层,在训练过程中,P-FCN模型的参数通过最小化病理位置感知的patch级响应和真实标签之间的误差来进行优化.这里的真实标签是指每个patch所属的类别信息(正常或异常).在训练过程中,模型在ADNI验证集上达到最低错误时被保存.

将参与训练sMRI样本随机采样到的patch体素块反复应用于P-FCN模型训练.考虑到卷积操作会逐层减小输入的大小,因此本文针对每层卷积层的输出进行设计,以确保最终输出形状为2×1×1×1.在训练过程中,P-FCN对于每个patch会产生两个标量值,这些值可以通过应用softmax函数转换为相应的阿尔茨海默症和正常认知概率.然后,选取两个概率中较大的值作为分类的依据.通过这种模式,该模型被训练来推断表明大脑疾病状态的局部模式.通过基于位置编码的门控分支训练,使P-FCN能够同时学习特征表示和位置感知,从而更有效地提取疾病的病理特征.同时,位置编码的门控分支也能够提高模型的可解释性,因为它揭示了构成模型决策依据的病理位置和特征.

1.3.2 病理概率图生成模型

鉴于FCN的操作与输入数据大小无关,并且基于位置编码的门控分支直接使用全脑三维笛卡尔空间的坐标表示IL3×W×H×D作为输入,这与patch级网络中输入的位置信息是相同的.故可以将基于patch-wise训练策略的P-FCN模型迁移到全脑网络模型中.如图3所示,使用经过预训练位置编码与门控网络能够提取全脑病理位置信息,产生具有全脑位置信息的响应GL1×w'×h'×d',并与预测分支提取的病理特征相融合,将融合后的结果进行后续分类卷积操作,并通过softmax函数转换为相应的阿尔茨海默症和正常认知概率.可以获取到大脑整体区域映射到的病理区域概率,从而生成该患者的大脑病理概率图.

1.4 基于注意力机制的CNN-BiLSTM分类模型

在为所有受试者生成病理概率图后,又设计了基于注意力机制的CNN-BiLSTM分类模型框架预测输入样本的状态,通过从病理概率图中选择一定数量阿尔茨海默症概率值来预测阿尔茨海默症状态.其中数量选择基于对分类模型整体性能的测试,该性能是使用ADNI训练数据得到Matthew's相关系数(MCC)图进行估计的.从这些位置提取的特征用作分类模型的输入,该模型对阿尔茨海默症状态进行二元分类.

除病理概率图选取的影像特征外,本文还将受试者的临床数据(如年龄、性别和MMSE评分值)作为附加信息输入到分类模型中.临床数据参数能够为模型提供与阿尔茨海默症状态相关的额外信息.通过采用基于注意力机制的CNN-BiLSTM模型,本文实现多模态数据的有机融合.具体地,将一维的临床特征与选取的一维影像特征一同输入到CNN模型中,通过这种方式将影像特征和临床特征融合在一起.融合后的特征被传递至BiLSTM网络,以便更准确地捕获序列性的信息,并运用注意力机制来对不同输入的贡献进行加权.

基于注意力机制的CNN-BiLSTM分类模型架构如图4所示.首先,模型输入的训练数据经过一维CNN网络进行特征提取,通过应用多个卷积层加深了CNN网络特征提取的过程,使模型能获取更高级别的特征,使预测任务更具鲁棒性和辨别力.接着,使用BiLSTM层用于学习输入数据之间的关联信息,BiLSTM通过前向和后向状态建模能捕捉到上下文信息进而更好地理解数据之间的关系.为了进一步提高模型性能,本文引入了一个注意力层,其作用是合并重要特征并重新分配权重来选择关键特征.最后,通过全连接层将提取的特征映射到预测目标,从而对疾病状态进行预测.

输入数据首先通过三个连续的一维卷积(Conv)层来提取深度特征.每个卷积层都使用了尺寸为3的卷积核进行卷积处理,随后经过批量归一化(BN)、ReLU激活函数和最大池化层.由于影像数据是来自不同脑区的疾病概率值组成,不同脑区数据之间的关联非常复杂.为了学习不同脑区之间的联系,以及影像数据及非影像数据之间的关联信息,在通过CNN层后,将输出特征输入BiLSTM模型,以从特征图中学习到特征间的关联信息. Bi-directional LSTM网络是一个双向堆叠的LSTM网络,具有前向和后向LSTM特征.先前的值是通过前向LSTM网络学习的,类似地,未来的值是通过应用后向LSTM网络反向学习的.后一层隐藏状态的利用有助于学习前向和后向信息,以提高模型的表现.通过Bi-LSTM单元执行操作如下所示:

hn=σW1xt+W2hn-1×tanhCt
hn=σW3xt+W4hn-1×tanhCt'
ogn=w5hn+w6hn

其中,xt表示第t层的输入.w*是LSTM单元门的权重.hnhn分别是前向和后向输出.通过BiLSTM输出门(output gate)得到特征表示为ogn,其保留了有关双向步骤的信息.在本文中,经过1维CNN的特征向量被输入到BiLSTM模型中,并采用‘tanh’激活函数来完成归一化并有助于减少过度拟合问题.

通常情况下,输入数据的各个参数对于特定预测的贡献是不同的.因此,筛选出最重要的特征参数来实现识别的目的就成为了另一项任务.为此,注意力机制被用来强调预测过程中最重要的参数.首先,注意力机制根据来自BiLSTM网络不同通道的输入数据计算最终的隐藏状态和注意力得分向量.接着,采用点积函数来获得相应特征的权重信息.然后,对这些权重信息运用softmax函数来获得归一化的权重分数.最后,将这些对齐和归一化的分数通过等式(4-6)进行求和以形成上下文向量.本研究采用点积注意力机制,因为它具有良好的时间复杂度.

μi=tanhwd×flattenogn+bd
αn=expμiμdnexpμiμd
αvt=nαnogn

其中, μn为隐藏层的表示信息, μd是特征向量的相似度,αn是归一化权重.wdbd分别是神经网络训练时初始化的权重矩阵和偏置向量.重要参数的影响可以通过计算μnμd的相似度来衡量.然后,通过对每个输入特征使用softmax函数获得归一化权重αn.最后,将注意力层输出的注意特征αvt输入到密集层中,对疾病状态进行分类预测.

2 实验与分析

2.1 实验环境

CPU: Intel Xeon Gold 6240@2.60 GHz × 72; GPU: NVIDIA TITAN RTX 24 G × 2; 内存: 64 G; 操作系统为64位Ubuntu 20.04.5 LTS; cuda:11.0; Python 3.7; Pytorch 1.7.0.

2.2 实验设置

本文的模型都是基于ADNI数据集构建的,将ADNI数据集按照3∶1∶1的比例随机分为三组,分别用于训练、验证和测试.此外本文还使用其他独立的数据集(AIBL和NACC)进行测试,以评估模型的普适性.模型的训练集和验证集在每次训练之前都会重新划分,并重复进行了5次.模型的性能以平均值和标准偏差的形式表示.该网络模型是通过随机初始化权重进行训练.本文使用了Adam优化器,学习率为0.0001,mini-batch大小为10.

通过病理概率生成模型得到从ADNI训练集数据中获取到的Matthew's相关系数(MCC)图,从MCC图中获取相应数量具有高Matthew's相关系数的体素位置,以提取样本对应位置的病理概率体素值作为分类模型的输入.为了验证分类模型中输入不同体素数量的影响,本文测试在不同体素数量输入的情况下分类模型的诊断性能.如图5所示,本文在MCC图上选择不同数量下的最优Matthew's相关系数的体素位置,并将相应位置的病理概率体素值输入到分类模型中进行测试.通过实验测试比较,本文选择分类性能最优情况下体素的输入数量,最终确定选取200个体素位置作为分类模型的输入.

2.3 评价指标

分类模型对AD及NC受试者进行分类诊断,并基于对ADNI测试数据以及其他独立数据集(AIBL和NACC)的预测生成了灵敏度-特异度曲线(Sensitivity-Specificity Curve)和精确率-召回率(Precision-Recall Curve )曲线.此外,本文采用5种评价指标评估分类模型的整体性能表现,包括:模型预测的准确率(Accuracy,ACC)、敏感度(Sensitivity,SEN)、特异度(Specificity,SPE)、F1分数(F1-Score)和Matthews相关系数(Matthews Correlation Coefficient,MCC).F1分数同时考虑了测试的精确度和召回率,其中召回率(Recall)是评价分类模型性能的指标之一,它衡量了模型在所有实际正例中正确识别出多少个正例. F1分数定义为:

F1_Score=2×TP2×TP+FP+FN

其中,TP(True Positive)表示真阳性值、FP(False Positive)表示假阳性值、FN(False Negative)分别表示假阴性值.Matthews相关系数(MCC)用于平衡衡量二元分类器在不同规模数据集上的分类质量,其定义如下:

MCC=TP×TN-FP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

其中,TN表示真阴性值(True Negative).

2.4 实验结果与分析

2.4.1 病理概率图生成结果

将经过patch-wise训练策略的P-FCN迁移到完整sMRI样本中,可以从全脑位置信息编码中提取病理位置响应并获取在相应的大脑区域中生成病理特征,进一步生成全脑AD病理概率分布图.将3D病理概率图按照冠状面、矢状面和轴位面进行展示.图6展示了临床确诊为阿尔茨海默症受试者的病理概率图,红色区域表示阿尔茨海默症的高风险区,其推断的阿尔茨海默症概率>0.5,而蓝色区域表示低风险的病理区域,其推断的阿尔茨海默症概率<0.5.图7展示了临床诊断为正常受试者的病理概率图.在图8中展示AD/NC对照的四组对照样例,前两个样本被临床诊断为阿尔茨海默症,而后两个样本被临床证实为认知正常的受试者.从AD与NC对比可以看出P-FCN产生的高响应分布在具有解剖学意义的区域23,例如海马、颞叶和顶叶区域.表明生成的病理概率图可以辨别出与AD相关的病理特征.

为了评估P-FCN生成病理概率分布图的阿尔茨海默症病理区域与神经解剖学的一致性,本文构建了Matthews相关系数(MCC)的全样本图.该映射能够展示出每个数据集病理区域预测相较集中的区域(图9),从而作为一种辅助手段来展示对阿尔茨海默症类别诊断影响最大的结构区域.Matthew相关系数(MCC)的体素图在所有数据集中都是单独计算的,以证明P-FCN在不同数据集(特别是外部数据集)的预测性能的泛化能力.图中显示了来自ADNI的训练集、验证集、测试集和AIBL及NACC数据集的MCC图.

2.4.2 分类模型实验结果

本文使用P-FCN模型生成相应样本的病理概率图,并将其应用于基于注意力机制的CNN-BiLSTM分类模型中.分类诊断分为两种方式,直接使用病理概率图提取的疾病概率值作为分类模型的输入,或采用多模态的输入方式包括疾病概率值、MMSE评分、年龄和性别信息,以准确预测独立数据集中阿尔茨海默症状态.

本文探究使用sMRI影像数据以及多模态数据作为分类模型输入的性能表现.首先,在仅使用sMRI影像数据的情况下,对分类模型进行了测试,并统计了其在ADNI测试集、AIBL和NACC数据集中的分类性能.图10展示了模型的灵敏度-特异性曲线和准确率-召回曲线.在三项测试数据集中,灵敏度-特异性曲线下的面积(Area Under the Curve,AUC)的平均值超过0.88,表明模型具有良好的分类性能.然而,在准确率-召回曲线下的面积(Area Under the Precision-Recall Curve,AUC-PR)方面,AIBL测试集的性能相对较低,这表明在该测试集中对正样本的判别能力较弱.进一步,将提取的影像数据与年龄、性别和MMSE值一起作为多模态输入,计算其在三项测试集中的分类性能,图11展示了多模态分类模型的灵敏度-特异性曲线和准确率-召回曲线.在多模态分类模型中,三项测试数据集的AUC和AUC-PR指标均接近1,说明通过添加临床信息可以使模型获取更全面的患者信息,从多个角度捕获患者特征,从而提高模型整体性能.

为了评估临床特征对分类模型的贡献度,引入SHAP(SHapley Additive exPlanations)方法24对分类模型输入的临床信息进行分析,统计年龄、性别及MMSE的SHAP平均绝对值.根据图12的结果,发现年龄和MMSE的SHAP平均绝对值分数高于性别因素.这表明在模型的预测中,年龄和MMSE分数对于结果的影响更为显著,而性别因素虽然影响较低,但也对模型的预测产生了一定的影响.

两种分类模型的具体结果在表2中展示,通过五种指标详细确认了这两种分类模型的具体性能,以及它们在外部数据集中的诊断性能及泛化能力.在仅使用sMRI影像数据的分类模型中,AIBL测试集呈现出准确率、特异度指标较高,然而敏感度、F1分数和MCC相对较低.通过与AUC-PR指标进行对比,可以得出分类模型在AIBL测试集中更倾向于将样本分类为负例,即对正样本的判别能力较差.这可能是由于AIBL数据集中负例样本(NC)明显多于正例样本(AD),导致数据集类别不平衡,进而影响了准确率和特异度指标的表现.进一步比较sMRI分类模型及多模态分类模型,结果表明多模态数据输入在五个指标上均取得了一致的性能改进,进一步证实多模态数据输入可以使模型从不同角度获取信息.F1分数综合考虑了模型的精确度和召回率,因此在数据不平衡的情况下,它能够提供更全面的性能评估.通过对两种分类模型F1分数比较,特别是对AIBL数据集的分析,证明了临床信息的引入为模型提供了额外的特征,有助于更好地区分正负样本,缓解了类别不平衡造成的问题.MCC衡量了预测结果与真实标签之间的相关性,它考虑了真阳性、真阴性、假阳性和假阴性的数量,适用于不同类别分布和不同误差权重的情况,多模态分类模型在三项测试集中MCC分数均有所提升,进一步证实了多模态数据的引入对于提高模型的鲁棒性和准确性具有积极作用.

3 结语

本文设计了基于位置编码的全卷积神经网络(P-FCN),通过位置编码得到相应病理区域位置的响应并与FCN模型中提取的病理特征相融合,最终生成高分辨率的病理概率图.病理概率图可以结合非影像的参数信息来进行精确的阿尔茨海默症状态诊断.P-FCN模型输出的病理概率图能可视化阿尔茨海默症疾病的高风险区域,能从传统诊断方式中得出隐匿性的疾病位置信息,进而为分类模型的决策及诊断提供实际依据.然后,根据几种不同的评价指标,对基于注意力机制的CNN-BiLSTM分类模型的诊断性能进行评估,在影像协议、地理位置和招募标准等方面具有广泛差异的不同数据集上表现出一致的优越的诊断性能,证明了本文方法具有较高的准确率和泛化能力.

参考文献

[1]

NICHOLS ESZOEKE C E IVOLLSET S Eet al. Global, regional, and national burden of Alzheimer's disease and other dementias, 1990-2016: A systematic analysis for the Global Burden of Disease Study 2016[J]. The Lancet Neurology201918(1): 88-106.

[2]

JAGUST W. Vulnerable neural systems and the borderland of brain aging and neurodegeneration[J]. Neuron201377(2): 219-234.

[3]

LIANG C SLI D JYANG F Cet al. Mortality rates in Alzheimer's disease and non-Alzheimer's dementias: A systematic review and meta-analysis[J]. The Lancet Healthy Longevity20212(8): e479-e488.

[4]

PALMQVIST SJANELIDZE SQUIROZ Y Tet al. Discriminative accuracy of plasma phospho-tau217 for Alzheimer disease vs other neurodegenerative disorders[J]. JAMA2020324(8): 772-781.

[5]

MATTSSON NINSEL P SDONOHUE Met al. Predicting diagnosis and cognition with 18 F-AV-1451 tau PET and structural MRI in Alzheimer's disease[J]. Alzheimer's & Dementia201915(4): 570-580.

[6]

OSSENKOPPELE RSMITH ROHLSSON Tet al. Associations between tau, Aβ, and cortical thickness with cognition in Alzheimer disease[J]. Neurology201992(6): e601-e612.

[7]

MCKHANN G MKNOPMAN D SCHERTKOW Het al. The diagnosis of dementia due to Alzheimer's disease: Recommendations from the National Institute on Aging-Alzheimer's Association workgroups on diagnostic guidelines for Alzheimer's disease[J]. Alzheimer's & Dementia20117(3): 263-269.

[8]

李丰卓, 符玲玲, 郭金鑫, . 应用对抗神经网络的胶质瘤MR图像分割[J]. 中南民族大学学报(自然科学版)202241(1): 64-70.

[9]

BUCKNER R L. Memory and executive function in aging and AD: Multiple factors that cause decline and reserve factors that compensate[J]. Neuron200444(1): 195-208.

[10]

FRISONI G BFOX N CJACK C Ret al. The clinical use of structural MRI in Alzheimer disease[J]. Nature Reviews Neurology20106(2): 67-77.

[11]

TOPOL E J. High-performance medicine: The convergence of human and artificial intelligence[J]. Nature Medicine201925(1): 44-56.

[12]

LI JWEI YWANG Cet al. 3-D CNN-based multichannel contrastive learning for Alzheimer's disease automatic diagnosis[J]. IEEE Transactions on Instrumentation and Measurement202271: 1-11.

[13]

LIAN CLIU MPAN Yet al. Attention-guided hybrid network for dementia diagnosis with structural MR images[J]. IEEE Transactions on Cybernetics202252(4): 1992-2003.

[14]

AHMED OBENMIZOTIN MBENOIS-PINEAU Jet al. Alzheimer's disease diagnosis on structural MR images using circular harmonic functions descriptors on hippocampus and posterior cingulate cortex[J]. Computerized Medical Imaging and Graphics201544: 13-25.

[15]

LIU MTANG JYU Wet al. Attention-based 3D ResNet for Detection of Alzheimer's disease process[M]// Neural Information Processing. Cham: Springer International Publishing, 2021.

[16]

JACK C R JrBERNSTEIN M AFOX N Cet al. The Alzheimer's disease neuroimaging initiative (ADNI): MRI methods[J]. Journal of Magnetic Resonance Imaging200827(4): 685-691.

[17]

ELLIS K AROWE C CVILLEMAGNE V Let al. Addressing population aging and Alzheimer's disease through the Australian Imaging Biomarkers and Lifestyle study: Collaboration with the Alzheimer's Disease Neuroimaging Initiative[J]. Alzheimer's & Dementia20106(3): 291-296.

[18]

BEEKLY D LRAMOS E MVAN BELLE Get al. The National Alzheimer's Coordinating Center (NACC) Database: An Alzheimer disease database[J]. Alzheimer Disease and Associated Disorders200418(4): 270-277.

[19]

ISENSEE FSCHELL MPFLUEGER Iet al. Automated brain extraction of multisequence MRI using artificial neural networks[J]. Human Brain Mapping201940(17): 4952-4964.

[20]

WOOLRICH M WJBABDI SPATENAUDE Bet al. Bayesian analysis of neuroimaging data in FSL[J]. NeuroImage200945(1): S173-S186.

[21]

梁杰, 陈嘉豪, 张雪芹, . 基于独热编码和卷积神经网络的异常检测[J]. 清华大学学报(自然科学版)201959(7): 523-529.

[22]

LIU RLEHMAN JMOLINO Pet al. An intriguing failing of convolutional neural networks and the CoordConv solution[EB/OL]. 2018arXiv: 1807.03247.

[23]

GERARDIN ECHÉTELAT GCHUPIN Met al. Multidimensional classification of hippocampal shape features discriminates Alzheimer's disease and mild cognitive impairment from normal aging[J]. NeuroImage200947(4): 1476-1486.

[24]

LUNDBERG S MNAIR BVAVILALA M Set al. Explainable machine-learning predictions for the prevention of hypoxaemia during surgery[J]. Nature Biomedical Engineering20182(10): 749-760.

基金资助

湖北省自然科学基金资助项目(2008CDB392)

中央高校基本科研业务费专项资金资助项目(CZY22014)

AI Summary AI Mindmap
PDF (3009KB)

192

访问

0

被引

详细

导航
相关文章

AI思维导图

/