基于图像融合技术的阿尔茨海默病检测研究

李志刚 ,  牟明凯 ,  胡德安 ,  项楠

东北大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (06) : 1 -7.

PDF (1984KB)
东北大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (06) : 1 -7. DOI: 10.12068/j.issn.1005-3026.2025.20230338
信息与控制

基于图像融合技术的阿尔茨海默病检测研究

作者信息 +

Research on Detection of Alzheimer Disease Based on Image Fusion Technology

Author information +
文章历史 +
PDF (2031K)

摘要

利用傅里叶变换红外衰减全反射光谱(FTIR-ATR)技术采集阿尔茨海默病(AD)患者血浆样本.根据血浆膜样本的FTIR-ATR光谱数据,利用格拉姆角场(GAF)和马尔可夫转移场(MTF)将光谱数据编码为二维图像,同时结合基于深度残差网络和注意力机制的神经网络模型,实现对阿尔茨海默病的筛查分类研究.实验结果表明,使用GAF-MTF-CNN模型能够有效提升光谱特征提取的准确率.同时,使用二维数据结合深度学习的方法比传统的分类方法具有更高的分类精度.采用GAF与MTF技术编码光谱为图像,结合改进残差神经网络,有效提升了AD筛查模型的泛化能力与诊断精准度,优化了筛查性能.

Abstract

The plasma samples of Alzheimer disease(AD) patients are collected using Fourier transform infrared-attenuated total reflection (FTIR-ATR) spectroscopy technology. Based on the FTIR-ATR spectral data of the plasma membrane samples, the spectral data are encoded into two-dimensional images by utilizing the Gram angular field (GAF) and Markov transition field (MTF). Meanwhile, a neural network model based on the deep residual networks and attention mechanism is combined to conduct the screening and classification research on Alzheimer disease. The experimental results show that the GAF-MTF-CNN model can effectively improve the accuracy of spectral feature extraction. Additionally, the method of combining two-dimensional data with deep learning has better classification accuracy compared with traditional classification methods. Encoding spectrum into images using GAF and MTF techniques, and combining them with an improved residual neural network, effectively enhances the generalization ability and diagnostic accuracy of AD screening models, optimizing the screening performance.

Graphical abstract

关键词

近红外光谱 / 阿尔茨海默病 / 格拉姆角场 / 马尔可夫转移场 / 卷积神经网络

Key words

near-infrared spectrum / Alzheimer disease / Gramian angular field (GAF) / Markov transition field (MTF) / convolutional neural networks (CNN)

引用本文

引用格式 ▾
李志刚,牟明凯,胡德安,项楠. 基于图像融合技术的阿尔茨海默病检测研究[J]. 东北大学学报(自然科学版), 2025, 46(06): 1-7 DOI:10.12068/j.issn.1005-3026.2025.20230338

登录浏览全文

4963

注册一个新账户 忘记密码

阿尔茨海默病(Alzheimer disease,AD)是全球老年人口中最普遍的痴呆形式.AD患者可能由于短期记忆的严重丧失和全面的认知功能障碍1,需要早期发现和治疗.在现有的医疗筛查与监测技术中,针对复杂疾病的筛查与监测,多数依靠量表筛查、生化检验以及影像标志等.而在使用过程中,上述所提常用筛查方法却存在掺杂主观判断、操作复杂、侵入性高以及磁共振功能成像、正电子发射断层扫描等多种脑成像技术2检测成本高昂等问题.傅里叶变换红外光谱(FTIR)检测作为潜在筛查神经系统异常以及体内各种代谢异常的手段3-6,已在AD筛查和辅助诊断领域得到了较彻底的研究,许多研究提供的统计数据表明其在临床环境中的应用具有真正的前景7.Ryzhikova等8利用血清拉曼光谱和人工神经网络(ANN)对早期、中度、和患有AD的健康个体进行分析,使用PCA变量作为输入的神经网络模型无法识别与AD相关的重要波数或从生化角度解释光谱信息.而国内只有少数研究人员对AD的光谱筛选进行了探索性研究,吕庆坤等9利用血浆和红细胞表面的增强拉曼光谱技术开展老年人轻度认知障碍筛查研究,探索AD的早期筛查,但远远不能满足实际应用要求.国内外虽然已经选择了更为方便的包含AD标志物的血液,搭配光谱技术作为诊断和筛查的重要方法,但光谱重要特征波段的选择依然是关键难题,存在人工提炼特征信息缺失等问题.疾病筛查本质上是一个分类问题,传统的机器学习分类算法在从近红外光谱中提取特征时仍面临挑战.近红外光谱包含众多连续分布的波段,其中存在多个理论上对疾病分类有重要指示意义的波段集合,但这些波段集合范围宽泛,难以直接用作分类指标.当前算法难以从中筛选出单个特征点,致使在实际筛查中误诊率和漏诊率表现失衡,存在误诊率偏高或漏诊率居高不下的情况.因此,首次将目光转向处理图像数据以及特征提取更具优势的深度学习10来构建合适的AD筛查体系.
Wang等11提出了格拉姆角场 (GAF)和马尔可夫转移场(MTF),用于将时间序列编码为不同类型的图像.这使得使用计算机视觉技术进行时间序列分类和插补成为可能,在 20 个标准数据集上使用此方法取得了极具竞争力的结果.这一方法在数学和一维时序数据领域具有重要意义,可以应用于多个领域,包括近红外光谱和疾病领域.Wang等12提出了基于格拉姆角场的卷积神经网络(GAF-CNN),将一维拉曼光谱数据转换为图像,用于预测血糖的生化价值.De Paula等13使用基于2D内核的CNN进行分类,采用GAD(Gramian angular difference)将脑电图(EEG)数据编码为图像预处理,此外,还使用一系列CNN进行了比较分析.本文采用GAF与MTF技术将光谱数据编码为二维图像,结合改进残差神经网络(含注意力机制)开展AD筛查.实验显示,该模型能提升特征提取准确率与分类精度,增强模型泛化能力和诊断精准度,优化筛查性能.

1 实验材料和实验方法

1.1 血浆光谱采集

2018年12月至2021年12月,在中国天津市环湖医院认知障碍门诊招募了179例AD患者(包括87例早期和92例中期)和237例健康样本作为健康对照组.本研究中描述的所有方案和方法均已获得天津环湖医院医学伦理委员会(项目编号2020-60)的批准,并按照《赫尔辛基宣言》进行.在对所有测试程序进行彻底解释后,获得了所有参与者的知情同意.AD组患者符合美国国家老龄化研究所和阿尔茨海默病协会关于可能AD的核心临床标准.采集AD不同症状阶段患者和健康者的血浆样本的具体流程为:将血浆样本批量加载至血浆膜制样板干燥成膜.制样板由弹性的硅胶框架嵌入红外低吸收材质的载体窗片构成,制样板上携带含有患者信息的二维码标识.通过血浆膜样品板,样本成批同步干燥,极大压缩了测量时ATR测试平台上样本原位逐次干燥需要的时间,实现ATR的快速非原位测量,满足大规模的筛查需求.采集使用带有ATR附件的α-FTIR光谱仪(Bruker Optics Ltd),通过OPUS 5.5软件进行血浆样本ATR-FTIR光谱的采集操作.血液样本按照标准操作程序收集在EDTA(ethylene diamine tetraacetic acid)管中.全血于4 ℃,2 000 r/min离心10 min,获取血浆.血浆样本保存于-80 ℃.测量时,样品在室温下解冻.冷冻样品解冻后,分别取1 µL置于ATR表面,通风干燥5 min后进行测定.光谱分辨率为4 cm-1,波数范围为4 000~950 cm-1.179个AD样品的近红外光谱图如图1所示.

1.2 编码为图像的方法

1.2.1 格拉姆角场

格拉姆角场(GAF)可以将时间序列转换成图像,从而能够使用卷积神经网络(CNN)处理复杂疾病光谱数据.具体的转换过程如图2所示,既能保留光谱吸收度的完整信息,也保持着吸收度对波长的依赖性.时间序列数据转换为图像数据后就可以充分利用CNN在图像分类识别上的优势进行建模.ATR光谱转换格拉姆角场二维图像的转换过程如下.

通过极坐标变换将光谱吸收度值利用反余弦函数编码为角度值θi,将波数编码为半径ri,其转换过程如式(1)所示:

θi=arccos Ai0Ai1,   i=1,2,,789;ri=N-i+1N.

式中:i为光谱数字化生物标志物(波数)的显著性排序序号;N为光谱数字化生物标志物(波数)的个数;Ai 为第i个光谱数字化生物标志物(波数)对应的吸收度.数据都落在极坐标系的单位圆内,波数在极坐标系中被编码成不同的半径,吸收度在极坐标系中被编码成角度,并不规则地在极坐标系中向外延伸.

GAF定义下的内积形式为<xi,xj >=cos(xi+xj ).即两个时序点之间的“内积”是这两个时序点的极坐标转换后的极角之和的余弦,对变换后的数据进行编码,式(2)定义了格拉姆角和场(GASF),其基于余弦函数,式(3)定义了格拉姆角差场(GADF),其基于正弦函数.

GASF=cos θ1+θ1cos θ1+θncos θ2+θ1cos θ2+θncos θn+θ1cos θn+θn,
GADF=sin θ1-θ1sin θ1-θnsin θ2-θ1sin θ2-θnsin θn-θ1sin θn-θn.

1.2.2 马尔可夫转移场

马尔可夫转移场14-15是用于编码动态转移统计的框架.对于给定的时间序列X={x1,x2,xn },其值域被划分为Q个区间,则每个xi 可以被映射到对应的qj.根据马尔可夫链中定义的单步转移概率和多步转移概率表述序列关系为

pi,i-1=pi,i-1xtqi|xt-1qi-1 ,pi,j=pi,jxtqi|xt-1qj,i-j>1 .

其中,pi,j为多步转移概率,表示此刻位于qi分位数区域的元素在下一刻跃迁到qj分位数区域的概率.通过统计各时刻分位数序列的变迁情况来获得具体的转移概率,因此可以得到Q×Q大小的马尔可夫转移矩阵 W

W=p1,1xtq1|xt-1q1 p1,Qxtq1|xt-1qQp2,1xtq2|xt-1q1 p2,Qxtq2|xt-1qQ                                                                                   pQ,1xtqQ|xt-1q1 pQ,QxtqQ|xt-1qQ .

但是,它对分布和时间序列X的依赖性不够强,矩阵 W 对原始时间序列存在较大的信息损失.马尔可夫链的特性是,在进行状态转移时,当前状态的概率仅取决于前一个状态,而与更早的状态无关.为了将时间信息合并到 W 中,有效利用序列的时间信息,提出了马尔可夫转移场 M,定义为

M=pi,jx1qi|x1qj pi,jx1qi|xnqjpi,jx2qi|x1qj pi,jx2qi|xnqj                                                                     pi,jxnqi|x1qj pi,jxnqi|xnqj.

式中, Mij 表示具有时间间隔|i-j|的点之间的转移矩阵,并且在 M 中,主对角线上的元素是指转移到自身所在分位区的概率.最终得到n×n矩阵 ,通过PCA降维去冗余后再进行图像转化.马尔可夫转移矩阵的转化过程如图3所示.

1.3 搭建筛查模型

本文通过利用格拉姆角场技术和马尔可夫变迁场,将AD患者的血浆光谱吸收度数据转换为二维图像,编码为图像后得到的6种不同类型的二维图像如图4所示(AD1为AD早期,AD2为AD中期).

将实验样本按8∶2的比例随机划分为训练集和测试集,实验样本集的划分如表1所示.

本文基于深度残差神经网络16-18进行改进,深度残差神经网络是由微软研究院提出的采用残差连接(residual connection)的结构.每个卷积层由数量不等的基本块构成.本文将转换后的图像数据作为输入(单通道和多通道),在改进的ResNet34网络中进行训练和测试.对基于ResNet34网络的优化具体如下:①针对所采集样本数目偏小,对网络结构进行对应调整.对于图像升维使用的步长为2的卷积,存在主通道信息丢失过多的问题,不利于主通道信息传播,使用3×3的最大池化层进行下采样,再使用步长1×1的Conv进行替换.这个改进并不增加模型复杂度和参数量.②加入CBAM注意力机制19.CBAM是轻量级的通用模块,它结合了通道注意力和空间注意力,其作用是在卷积的过程中,给予每个通道不同的权重比.残差网络模型结构如图5所示.

使用上述网络进行模型训练,并适当调节学习率等超参数,最终得到最优的神经网络模型.最后用独立测试集检验所训练模型的泛化能力,使用准确率、敏感度、特异性等指标进行评价.整体的AD筛查流程如图6所示.

2 结果与讨论

2.1 实验环境

实验是在Windows 10操作系统下完成,处理器为Intel(R) Core(TM) i5-12500H,使用GPU为NVIDIA GeForce RTX 3060,16 GB运行内存,训练采用PyTorch 1.12.0框架,Python 3.9的编程环境以及PyCharm开发工具.初始学习率设置为0.01,选择随机梯度下降(SGD)优化器更新模型参数.

2.2 GAF-MTF-iresnet34实验结果分析

首先对AD早期和中期的光谱数据进行预处理,使用主成分分析(PCA)降维.选择的主成分过少容易丢失相关信息,因此将降维后的主成分数量分别设置为64,128,256和512进行实验20-21,然后使用GAF和MTF将光谱数据转换为二维图像数据,并将二维数据输入到优化后的残差神经网络中.在本次实验所设定的条件下,主成分的数量与图像尺寸呈现出一种直接的对应关系,即主成分的数量确定为多少时,图像尺寸恰好与之相等.为了验证不同图像尺寸分类结果的差异,选择原始的ResNet34网络进行训练.通过预测结果不断调整模型参数,最终获得最佳结果.不同尺寸二维图像的分类结果如图7所示.实验结果表明,当图像尺寸为128像素×128像素时,分类准确率达到峰值,能够获得更多的有效信息;再加大图像尺寸,分类准确率未明显提升,不仅引入了更多无用信息,还会导致神经网络需要更多的计算资源和内存空间来处理和存储这些图像数据,从而增加了训练和推理的时间和成本.

为了验证本文提出的将光谱数据编码为图像的方法的优越性,将转换后的GAF图像、MTF图像以及两种图像融合后的双通道图像作为输入,分别输入到4种网络进行对比试验.从图8可以看出:对于AD早期和中期的筛查过程,在独立测试集中,本文提出的筛查模型的准确率最高,分别为92%和93%;GASF方法将吸收度光谱数据从直角坐标域转换到极坐标域,然后编码为二维图像,基本保留了原始数据的静态信息,但是GADF与GASF对于信息的提取略有差异,GASF对AD光谱特征转换表现更好;而MTF方法的表现不佳,可能与MTF的动态转换过程中更侧重于保留动态信息,从而流失了更多的静态信息相关.双通道输入在每个模型中都表现较好,旨在尽可能多地保留原始光谱特征,因此将两种方法转换后的二维图像作为双通道输入,以获得GAF的静态信息和MTF的动态信息.

本文还与机器学习中常用的分类算法进行了对比,分类结果见表2表3.在实际进行AD筛查的任务中,更看重灵敏度指标,即不漏诊的概率.本文提出的模型与偏最小二乘判别分析(PLSDA)都具有很高的分类精度,再次证明了所提出方法在AD筛查诊断任务中的可行性.

3 结 论

1) 将含有痴呆信息的人体血浆光谱通过GAF和MTF技术编码为图像,不会损失任何原有的光谱信息,并结合深度学习方法明显改善了重要特征提取困难的问题,避免了针对具体应用背景需要的人工调参以及专业知识的依赖,有效改善了人工提炼特征存在信息缺失的问题,通过二维图像结合神经网络构建的模型能够有效提升筛查模型的泛化能力和鲁棒性.

2) 将原始吸收度光谱特征降维至128并转换为128像素×128像素的GAF图像,相比于其他尺寸更适合筛查模型的建立.本文提出的GAF-MTF-iresnet34模型,与其他基于机器学习的分类算法相比,具有更低的诊断误差.MTF比GAF技术保留更多的动态特征和更少的静态信息,使用GAF和MTF图像作为双通道输入,使得残差神经网络可以学习到光谱吸收度信息中的GAF静态信息和MTF动态信息.将一维吸收度光谱序列编码为图像并结合改进的残差神经网络,能够在不增加模型复杂度的基础上优化神经网络、提高模型的学习能力,从而解决特征提取不足的问题.

参考文献

[1]

Brown E EKuumar SRaiji T Ket al. Anticipating and mitigating the impact of the COVID-19 pandemic on Alzheimer’s disease and related dementias[J]. American Journal of Geriatric Psychiatry202028(7): 712-721.

[2]

Sala AAnderson D JBreman P Met al. Biofluid diagnostics by FTIR spectroscopy:a platform technology for cancer detection[J]. Cancer Letters2020477: 122-130.

[3]

Backhaus JMueller RFormanski Net al. Diagnosis of breast cancer with infrared spectroscopy from serum samples[J]. Vibrational Spectroscopy201052(2): 173-177.

[4]

Harris CDespa MKelly K. Design and fabrication of a cross flow micro heat exchanger[J]. Journal of Microelectromechanical Systems20009(4): 502-508.

[5]

Ollesch JHeinze MMichael H. It’s in your blood: spectral biomarker candidates for urinary bladder cancer from automated FTIR spectroscopy[J]. Journal of Biophotonics20147(3/4): 210-221.

[6]

单鹏,吴缀,何年, .基于ATR-FTIR光谱的γ-PGA发酵批次分类研究[J]. 东北大学学报(自然科学版)202243(10): 1376-1382.

[7]

Shan PengWu ZhuiHe Nianet al. Research on batch classification of γ-polyglutamic-acid fermentation based on ATR-FTIR spectroscopy[J]. Journal of Northeastern University(Natural Science)202243(10): 1376-1382.

[8]

Du YXie FYin L Fet al. Breast cancer early detection by using Fourier-transform infrared spectroscopy combined with different classification algorithms[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy2022283: 121715.

[9]

Ryzhikova EKazakov OHalamkova Let al. Raman spectroscopy of blood serum for Alzheimer’s disease diagnostics:specificity relative to other types of dementia[J]. Journal of Biophotonics20158(7): 584-596.

[10]

吕庆坤, 黄高忠. 外周血拉曼光谱在阿尔茨海默病诊断中的应用[J]. 中华老年多器官疾病杂志201716(4): 313-316.

[11]

Qing-kun LyuHuang Gao-zhong. Application of Raman spectroscopy of peripheral blood in the diagnosis of Alzheimer’s disease[J]. Chinese Journal of Geriatric Multiple-Organ Diseases in the Elderly201716(4): 313-316.

[12]

Stahlschmidt S RUlfenborg BSynnergren J. Multimodal deep learning for biomedical data fusion: a review[J]. Briefings in Bioinformatics202223(2): 569.

[13]

Wang Z GOates T. Imaging time-series to improve classification and imputation[EB/OL]. (2015-06-01) [2023-10-15].

[14]

Wang Q YPian F FWang M Xet al. Quantitative analysis of Raman spectra for glucose concentration in human blood using Gramian angular field and convolutional neural network[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy2022275: 121189.

[15]

De Paula P Oda Silva C T Bde Faissol A R Ret al. Classification of image encoded SSVEP-based EEG signals using convolutional neural networks[J]. Expert Systems with Applications2023214(15): 119096.

[16]

雷春丽, 夏奔锋, 薛林林, . 基于MTF-CNN的滚动轴承故障诊断方法[J]. 振动与冲击202241(9): 151-158.

[17]

Lei Chun-liXia Ben-fengXue Lin-linet al. Rolling bearing fault diagnosis method based on MTF-CNN[J]. Journal of Vibration and Shock202241(9): 151-158.

[18]

Sun WZhou JSun B Tet al. Markov transition field enhanced deep domain adaptation network for milling tool condition monitoring[J]. Micromachines202213(6): 873.

[19]

张珂, 冯晓晗, 郭玉荣, . 图像分类的深度卷积神经网络模型综述[J]. 中国图象图形学报202126(10): 2305-2325.

[20]

Zhang KeFeng Xiao-hanGuo Yu-ronget al. Overview of deep convolutional neural networks for image classification[J]. Journal of Image and Graphics202126(10): 2305-2325.

[21]

王一宁, 秦品乐, 李传朋, . 基于残差神经网络的图像超分辨率改进算法[J]. 计算机应用201838(1): 246-254.

[22]

Wang Yi-ningQin Pin-leLi Chuan-penget al. Improved algorithm of image super resolution based on residual neural network[J]. Journal of Computer Applications201838(1): 246-254.

[23]

车畅畅, 王华伟, 倪晓梅, . 基于深度残差收缩网络的滚动轴承故障诊断[J]. 北京航空航天大学学报202147(7): 1399-1406.

[24]

Che Chang-changWang Hua-weiNi Xiao-meiet al. Fault diagnosis of rolling bearings based on deep residual shrinkage network[J]. Journal of Beijing University of Aeronautics and Astronautics202147(7): 1399-1406.

[25]

魏颖, 林子涵, 齐林, . 基于空间自注意力机制和深度特征重建的脑MR图像分割方法[J]. 东北大学学报(自然科学版)202344(2): 177-185.

[26]

Wei YingLin Zi-hanQi Linet al. Brain MR image segmentation based on spatial self-attention mechanism and depth feature reconstruction[J]. Journal of Northeastern University(Natural Science)202344(2): 177-185.

[27]

Xu Z BLee CLyu Y Qet al. Ensemble capsule network with an attention mechanism for the fault diagnosis of bearings from imbalanced data samples[J]. Sensors202222(15): 5543.

[28]

Yin Y QLi J CLing C Jet al. Fusing spectral and image information for characterization of black tea grade based on hyperspectral technology[J]. LWT2023185: 115150.

基金资助

河北省自然科学基金资助项目(F2020501040)

AI Summary AI Mindmap
PDF (1984KB)

180

访问

0

被引

详细

导航
相关文章

AI思维导图

/