基于中心指导与交替优化的低剂量CT图像恢复方法

张晓瑜 ,  王昊 ,  曾栋 ,  边兆英

南方医科大学学报 ›› 2025, Vol. 45 ›› Issue (04) : 844 -852.

PDF (2677KB)
南方医科大学学报 ›› 2025, Vol. 45 ›› Issue (04) : 844 -852. DOI: 10.12122/j.issn.1673-4254.2025.04.20

基于中心指导与交替优化的低剂量CT图像恢复方法

作者信息 +

A low-dose CT image restoration method based on central guidance and alternating optimization

Author information +
文章历史 +
PDF (2740K)

摘要

目的 提出一种基于中心指导与交替优化的低剂量CT图像恢复方法(FedGP)。 方法 FedGP框架革新了传统的联邦学习模式,采用无固定中央服务器的结构,每个机构交替担任中心服务器。该方法采用机构调制的CT图像恢复网络作为客户端局部训练的核心,通过中心指导和交替优化的联邦学习方法,中央服务器利用本地标记数据指导客户端局部网络训练,从而显著提升多机构低剂量CT图像恢复模型的泛化能力。 结果 在低管电流和稀疏角度CT图像恢复任务中,与其他对比的联邦学习方法相比,FedGP方法的CT图像结果在视觉和定量评估上均有明显优势,FedGP获得了最高的PSNR指标(40.25和38.84)、最高的SSIM指标(0.95和0.92)以及最低的RMSE指标(2.39和2.56)。此外,FedGP的消融实验结果表明基于中心指导与交替优化的联邦学习框架能更好适应各机构之间的数据异构性,确保模型在各类成像条件下的稳健性和泛化能力。 结论 本文提出的FedGP为解决CT成像异质性问题提供了一个更灵活的FL框架,可以更好地适应不同参与方的数据特征,提高模型在多样化成像几何的泛化能力。

Abstract

Objective We propose a low-dose CT image restoration method based on central guidance and alternating optimization (FedGP). Methods The FedGP framework revolutionizes the traditional federated learning model by adopting a structure without a fixed central server, where each institution alternatively serves as the central server. This method uses an institution-modulated CT image restoration network as the core of client-side local training. Through a federated learning approach of central guidance and alternating optimization, the central server leverages local labeled data to guide client-side network training to enhance the generalization capability of the CT imaging model across multiple institutions. Results In the low-dose and sparse-view CT image restoration tasks, the FedGP method showed significant advantages in both visual and quantitative evaluation and achieved the highest PSNR (40.25 and 38.84), the highest SSIM (0.95 and 0.92), and the lowest RMSE (2.39 and 2.56). Ablation study of FedGP demonstrated that compared with FedGP(w/o GP) without central guidance, the FedGP method better adapted to data heterogeneity across institutions, thus ensuring robustness and generalization capability of the model in different imaging conditions. Conclusions FedGP provides a more flexible FL framework to solve the problem of CT imaging heterogeneity and well adapts to multi-institutional data characteristics to improve generalization ability of the model under diverse imaging geometric configurations.

Graphical abstract

关键词

计算机断层成像 / 联邦学习 / 图像恢复 / 数据异质性

Key words

computed tomography / federated learning / image restoration / data heterogeneity

引用本文

引用格式 ▾
张晓瑜,王昊,曾栋,边兆英. 基于中心指导与交替优化的低剂量CT图像恢复方法[J]. 南方医科大学学报, 2025, 45(04): 844-852 DOI:10.12122/j.issn.1673-4254.2025.04.20

登录浏览全文

4963

注册一个新账户 忘记密码

计算机断层扫描(CT)已成为临床应用中评估和诊断多种疾病的重要工具。然而,随着公众对辐射暴露带来的健康风险愈发关注,低剂量CT(LDCT)逐渐引起重视12。LDCT的常用方法包括降低管电流(Low-mAs)和减少投影视图数量(稀疏角度CT),但这些方法往往伴随噪声和条纹伪影等图像失真问题。低管电流模式通过降低mAs值显著减少X射线剂量,常导致图像质量下降、噪声增加,影响诊断的准确性3。稀疏角度CT则通过减少投影角度数量降低辐射剂量,但在图像结果会显示条形伪影,同样影响诊断效果。因此,如何在低管电流和稀疏角度条件下既减少辐射又维持图像质量,仍然是一个亟待解决的挑战。
近年来,基于人工智能和机器学习的LDCT重建算法逐渐成为研究的热点。这些算法能够有效去除噪声、减少伪影,同时恢复图像细节,使得即便在低管电流或稀疏角度条件下,也能获得高质量的诊断图像。例如,Meng等4提出了一个双任务学习网络(DTNet),用于同时在任意剂量水平下进行低剂量CT模拟和去噪。Li等5提出了一种无监督网络模型,该模型可以有效地建模噪声特征,以增强鲁棒性的CT图像重建。You等6提出了基于深度学习(DL)的方法,从低分辨率对应图像中准确恢复高分辨率CT图像。He等7提出了一种使用DL进行Radon反演的新型重建框架,通过结合全连接滤波和正弦反向投影层,实现了对Radon反演的有效重建。Xia等8引入了用于LDCT重建的流形和图积分卷积网络,展开了迭代方案,并在图像和流形空间中同时执行。DL用于稀疏角度成像中也得了优异的重建效果,如Han等9提出基于紧框架的稀疏角度CT模型,Kim等10提出基于自监督学习框架的稀疏角度CT成像模型,Lee等11提出基于小波变换框架的稀疏角度CT智能成像模型。
然而,在实际临床场景中,获取足够的训练数据存在诸多困难。由于患者数量有限,设备供应商的差异,以及不同医疗机构的数据不一致性,通常导致数据不足,难以覆盖广泛的临床应用场景。此外,遵循医疗数据隐私法规的要求12,使得共享患者数据变得更加复杂,以防止隐私泄露。这些挑战不仅限制了数据的可用性,也对开发和验证可靠的医疗AI模型提出了更高的要求。
联邦学习13-15 (FL)作为一种解决这些挑战的有效解决方案,使得多个医疗机构能够在不共享敏感患者数据的情况下协同训练模型。然而,传统的FL框架(如FedAvg16)依赖于一个中央服务器来进行模型参数的聚合,这虽然保护了数据隐私,但也带来了其他挑战,尤其是找到一个可靠的集中式第三方进行模型聚合存在困难。为了应对非独立同分布(non-IID)数据问题,Yang等17提出了一种基于超网络的个性化FL方法,用于多机构CT成像。Chen等18提出了一种联邦特征学习网络,可以同时重建来自不同供应商的CT图像。然而,这些方法在处理多样化数据源方面仍然存在局限19。具体来说,在多机构合作中,固定中心服务器可能缺乏某些特殊几何成像配置的数据,从而难以全面地指导所有客户端的模型训练。固定中心服务器无法充分理解和整合这些复杂的几何信息,可能会导致特定机构的数据特征被边缘化,从而削弱了FL的实际效用。
为了进一步提升FL在CT图像中的表现,我们提出了一种基于中心指导与交替优化的FL方法(FedGP)。与传统方法不同,我们的方法可以灵活地交替选择每个机构作为中心服务器,使模型能够有效整合和利用各机构的特征和特定数据分布。每个机构均配备有机构调制的低剂量CT图像恢复网络,通过中心服务器的知识共享实现特征的适应性调制,从而实现精确的图像恢复。在训练过程中,中央服务器的角色和图像域参数在每个客户端之间共享。利用交换的特征,具有配对数据的全局服务器可以表征结构细节,指导精确的局部特征恢复,从而方便跨不同机构的关键特征空间的学习。

1 材料和方法

本文所提出的FedGP方法由3个部分组成:机构调制的低剂量CT图像恢复网络、中心知识联邦指导策略和交替优化的FL框架(图1)。

1.1 机构调制的低剂量CT图像恢复网络

基于X射线断层成像原理,Radon变换通过沿特定角度对物体进行线积分来生成投影数据,这些数据随后用于重建物体的图像。具体来说,对于任意二维物体fx,y,其在设定平行光束成像几何下的Radon变换可以通过以下公式表示:

          ps,θ=fx,yδ(xcos θ+ysin θ-t)dxdy    

其中,ps,θ表示在角度θ下,物体fx,y沿平行光束方向的衰减值投影,即在该角度方向上经过物体的射线衰减信息的累积结果。θ为投影的角度,s是探测器单元的位置,δ是狄拉克函数。

将公式(1)中的连续Radon变换离散化,得到如下形式:

          p=Aμ                                                                           

其中,p表示离散化后的投影数据,A是投影矩阵,μ是物体的离散化密度分布。通过这种离散化处理,可以更方便地进行数值计算和图像重建。

为了进行低剂量图像重建,离散化的Radon反变换可以进一步表示为:

          x*=ATA-1ATp                                                         

其中x*表示待重建的目标,AT表示投影矩阵A的转置,通常用于反投影过程,ATA-1表示反投影后的滤波操作。

为了更好地适应不同机构的数据特性,我们引入了机构调制的低剂量CT图像恢复网络,以构建DL网络参数化x*的重建过程。该网络是根据重建框架iRadonMAP7进行改进设计的,针对图像域的恢复过程进行优化:

          x*=M(xi;w)                                                          

其中,xi表示低剂量CT图像,w表示客户端的图像恢复网络参数。具体地,对于CT图像恢复网络,我们采用设计的是ResNet神经网络架构,具有随机初始化的权重。首先,前两层是二维卷积层(3×3卷积核)和组归一化层的卷积组合,将图像数据映射为多通道特征图。每个卷积后面都有一个组归一化和一个泄漏校正线性单元。然后,接4个由具有空间注意力的残差卷积块构造的图像增强单元。最后,两个卷积输出层(1×1卷积核)将高维特征图合并回图像数据。

此外,我们通过由3个全连接层单元组成的多层感知器MLP20对每个机构所扫描的成像几何形状和剂量水平等信息进行一维参数化,并生成与各机构成像条件相适应的归一化特征向量。通过这些特征向量调整并调控图像恢复网络中间特定卷积层的特征图输出,使得共享的图像恢复网络可以根据不同数据流进行网络特异性响应,从而适应各机构的特定成像条件和数据特性。这种网络调整过程可以表示如下:

           f ̃=h1ρf¯+h2ρ,ρ=Gk,Pk                        

其中,ρ代表每个机构的条件归一化参数信息,Gk代表第k个机构的成像几何信息,Pk代表第k个机构的剂量水平信息,h1h2分别代表MLP输出的加性和乘性的特征向量,f¯是中间卷积层的特征图输出,f ̃是调制后特征图输出。

1.2 基于中心服务器的联邦知识指导

1.2.1 联邦学习基础理论

FL的核心思想是在保证多方数据不出域的前提下相互协作完成重建网络模型的训练。每个客户端在其本地数据上进行局部网络模型训练,并将共享信息(通常是模型参数或梯度)发送给中央服务器。中央服务器对来自所有客户端的共享信息进行聚合,并将更新后的全局模型发送回客户端。这一过程重复进行,直到全局模型收敛。

具体来说,中央服务器初始化一个全局模型参数,并将其分发给每个客户端。在联邦轮t中,每个客户端i接收到全局模型θt后,在本地数据上执行若干次训练,计算本地模型更新:

           θit+1= θt-ηFiθt                                                  

中央服务器接收到所有客户端的共享信息θit+1后,根据各客户端数据量大小加权平均更新全局模型:

          θt+1=i=1NDiDθit+1                                                        

其中Di为局部客户端的本地数据集,N为客户端个数,总数据集为D=i=1NDi。目标是通过全局聚合来自各个客户端的模型更新,最小化全局损失函数。

1.2.2 基于中心服务器的联邦知识指导策略

在FL这一架构中,多个参与方(如医疗机构)协同训练一个全局模型,同时保留各自的本地数据不离开本地服务器。在此基础上,我们的FedGP框架在模型训练过程中引入了联邦知识指导。每个参与机构各自保留其本地数据,并在FL过程中维护特定网络模块的训练。各医疗机构的图像恢复网络参数和特征调制参数在中央服务器上共享。通过有效的全局信息整合,中心服务器利用全局特征准确地指导局部特征恢复。

在这个设置中,中心服务器初始化一个全局模型Mc,并将网络参数发送给所有参与的本地客户端。每个客户端k接收到参数后对图像恢复网络初始化,基于自身的数据Dk开始本地训练。具体地,在FL轮数t中,客户端k利用本地配对的数据来更新它们各自的图像恢复网络模型:

           wkt+1= wkt-σkLk(Mk(xik;φk)-yik)                  

其中, Lk表示客户端kL2正则化的损失函数,Mk表示客户端k的图像恢复网络,xik是当地机构的低剂量CT图像数据,φk代表当地机构的图像恢复网络参数,yik代表当地机构的正常剂量CT图像数据,σk是客户端k的学习率设置。每个客户端在完成本地训练后,将更新的网络参数wkt+1上传至中心服务器进行共享。中心服务器接收到所有客户端的网络参数后,采用加权平均的方法对网络参数进行聚合,得到新的全局模型网络参数:

             wct+1¯= k=1N-1ξkwkt+1                                                     

其中,wct+1¯表示聚合后全局模型网络参数,c是在当前设置下中心服务器所在的机构,ξk表示客户端聚合的权重系数。不同于其他的FL方法,FedGP方法中的中心服务器所在的机构在聚合客户端网络参数之后,使用内部本地数据对全局模型网络参数进行微调,通过融入中心服务器所在机构的数据知识,增强模型的泛化性能:

          wct+1= wct+1¯-σcLc(Mc(xic;wc)-yic)            

微调后的全局模型网络参数wct+1不再是简单的参数聚合结果,通过融入中心服务器的特定数据知识,wct+1不仅包含多机构的数据特性,还结合了中心服务器的特定信息。随后,更新的全局模型网络参数被广播至所有客户端,作为下一轮本地训练的初始化参数。每个客户端接收更新的全局模型,新一轮的本地训练在全局模型指导下进行,使每个客户端的优化过程不仅基于自身数据,还受到全局知识的有效引导,从而提升局部模型特征恢复能力和模型泛化性。

1.3 交替优化的FL框架

基于固定中心服务器的FL方法在处理多机型成像几何的非独立同分布数据时,面临一定缺陷21-23。由于不同医疗机构所使用的成像设备和扫描协议各不相同,导致产生的数据在统计特性上存在显著差异。固定中心服务器在整合这些具有高度异质性的本地模型时,往往无法有效地捕捉每个机构的特定数据特征,可能导致全局聚合模型在面对多样化的本地数据时出现漂移或偏离局部最优解,进而降低图像恢复的性能。为克服以上问题,我们提出了一种交替优化的FL框架。在该框架中,所有参与方交替作为中心服务器参与训练。随着每个机构承担服务器的角色,每个机构都有机会为全局模型做出贡献。具体而言,假设我们有N个参与方,记为C1,C2,,CN,每个参与方 k持有本地模型参数wk和本地数据Dk。在该框架中,每轮迭代后,微调后的全局模型将再次被广播给所有参与方,并用于下一轮的本地训练。随着训练的进行,中心服务器的角色在各个参与方之间轮流交替,这样每个参与方都能在不同轮次中承担中心服务器的角色,充分发挥其独特数据特性的优势:

           Mct+1=Mkt,k1,2,,N                               

考虑到各机构数据质量及对全局模型的贡献不同,在此过程中,我们设计了一个动态中心服务器选举机制以提升中心服务器的灵活性和公平性,从而进一步增强模型泛化能力和收敛性能。根据各机构的数据量、训练损失以及收敛能力等因素计算选举得分,并选取得分最高的机构作为下一轮中心服务器。具体地,假设机构k拥有的数据量为Dk,在第t轮的训练损失为Lkt,我们可以设计一个选举得分Skt,以确定下一轮中心服务器。公式可以如下表示:

Skt=αDkkN-1Dk-βLkkN-1Lk                           

其中,选出得分Skt最大的机构作为新的中心服务器。其中αβ为平衡各项因素的权重系数。

1.4 实验数据集及仿真设计

为了验证和评估FedGP方法在多机构协作的有效性,本文使用了来自多个机构且具备不同成像几何设置的CT数据进行实验。具体来说,我们从之前的正常剂量CT图像中提取了低剂量的正弦图数据,通过仿真获得了涵盖4种成像几何配置的CT数据集。本文使用4个公开可用的数据集的胸腹部CT图像进行数据仿真,评估所提出的FedGP方法在医疗CT图像恢复任务中的性能。数据集涵盖了不同供应商和扫描仪的CT数据,包括:(1)Site #1的数据集来自于2016 NIH-AAPM-Mayo低剂量CT挑战赛数据集,包含10例患者的CT重建图像,这些患者在正常剂量(即120 kVp和200 mAs)辐射下从胸部到腹部进行扫描24;(2) Site #2数据集来自于LDCT image and projection data,包含来自患者检查的CT投影数据,使用GE Discovery CT750 HD扫描仪25;(3) Site #3来自于Abdomen-1K数据集,包含由飞利浦CT扫描仪采集的腹部多层kVp和有效mAs的CT图像26;(4) Site #4来自于数据集来自CT Spine1K,包含由东芝CT扫描仪采集的不同kVp和有效mAs水平的CT图像27。CT仿真和重建由Astra工具箱进行28,在实验中,我们分别使用低管电流和稀疏角度两种不同的实验设置,以验证FedGP框架在不同条件下的低剂量CT图像恢复效果。具体而言,低管电流数据模拟了不同管电流设置下的低光子量条件,而稀疏角度数据则通过减少投影角度模拟了临床中可能出现的欠采样情况。

本文两个实验条件下的数据的详细分布如下:(1)低管电流实验条件下的4组机构数据:第1组包含1000张图像,采用成像几何#1和剂量水平#1;第2组包含900张图像,采用成像几何#2和剂量水平#2;第3组包含1140张图像,采用成像几何#3和剂量水平#3;最后1组包含1260张图像,采用成像几何#4和剂量水平#4采集。(2)稀疏角度实验条件下的4组机构数据:第1组包含600张图像,采用成像几何#1和采样间隔#1;第2组包含900张图像,采用成像几何#2和采样间隔#2;第3组包含1140张图像,采用成像几何#3和采样间隔#1;最后1组包含1260张图像,采用成像几何#4和采样间隔#2采集。

表1列出了成像的几何配置和扫描协议29,由于成像几何形状、扫描协议和受试者队列的不同30,来自不同数据集的CT图像分布是非独立同分布的。在实验中,我们将90%的数据用于模型训练,剩下的10%用于各个机构的测试,以评估FedGP在多机构CT图像恢复中的表现。

1.5 实验设置

本实验针对2种实验条件分别建立了4个协作机构,客户的模型权重均设置为1/3。在实验1即低管电流协议条件下,客户端局部迭代次数设为20,交替中心服务器次数设为4,每个轮次下中央服务器和本地客户端执行100轮聚合。在实验2即稀疏角度协议条件下,客户端局部迭代次数设为40,交替中心服务器次数设为4,每个轮次下中央服务器和本地客户端执行50轮聚合。该方法使用RMSprop作为优化器,初始学习速率为2×10-4。客户端的CT重建局部网络由标准的ResNet作为骨干网络,网络模型由PyTorch 工具箱进行训练,并在2个具有48 GB内存的NVIDIA RTX A6000图形处理单元上进行训练并利用ASTRA工具箱进行CT模拟。

1.6 对比方法

将FedGP的低剂量CT图像恢复结果与其他的FL方法进行了比较,包括:客户端局部训练模型(Local):每个机构仅使用其本地数据进行训练,即使用机构调制的低剂量CT图像恢复网络而不与其他机构共享模型的本地训练性能;FedAvg16:平均聚合的FL方法;Fedprox31:通过在损失函数中添加正则项,改善不同客户端数据分布不一致情况的FL方法。所有FL方法均采用相同的客户端局部模型结构、实验设置和训练数据,以确保公平比较。此外,本文还针对FedGP的联邦知识指导和交替优化框架进行了消融研究。

1.7 评价指标

本文的实验采用峰值信噪比(PSNR)、结构相似度指数(SSIM)和均方根误差(RMSE)来量化图像恢复性能。PSNR用于评估输出图像与原始图像之间的误差,PSNR值越高,表示输出图像越接近原始图像,噪声越少,图像质量越好。在CT图像恢复任务中,PSNR值较高的模型通常能够更好地恢复细节,减少伪影和噪声。SSIM衡量两幅图像在亮度、对比度和结构上的相似性。在评估医学图像时,SSIM能够反映图像的结构保真度SSIM值在0~1之间,值越接近1,表示输出图像与原始图像的结构相似度越高。RMSE通过计算图像像素误差的平方根平均值,衡量输出图像与原始图像像素值差异。RMSE值越小,说明输出图像与原始图像之间的差异越小,误差越低。

2 结果

2.1 多机构跨机型低管电流CT图像恢复结果

图2展示了使用Local、FBP、FedAvg、FedProx和所提出的FedGP在4个机构的图像结果以及感兴趣的区域(ROI),并与正常剂量下的CT图(Ground truth)进行了比较。表2展示了Site #1-4在多机构跨机型数据集上对不同方法的定量评价结果,评估了各方法在PSNR、SSIM和RMSE等指标上的性能。

2.2 多机构跨机型稀疏角度CT图像恢复结果

在4个机构Site #1-4的稀疏角度CT图像恢复任务中,不同方法在图像质量、噪声抑制和细节恢复方面存在显著差异(图3)。通过对比包括FBP、Local模型、FedAvg和FedProx方法的稀疏角度图像恢复效果,可以更全面地分析其性能表现。表3展示了不同方法在4个机构上稀疏角度CT实验测试集的定量评估结果。

2.3 消融实验

对低管电流CT和稀疏角度CT图像恢复实验进行消融来评估中心指导策略与交替优化对所提出的FedGP性能的有效性,分别以视觉代表性图像和训练曲线的收敛性展示。图4展示了中心服务器固定且无指导的模型FedGP (w/o GP)和FedGP在低管电流CT条件下的代表性图像比较以及两种方法的预测误差。此外,训练曲线提供了进一步的验证(图5)。FedGP(w/o GP)的收敛速度较慢,且波动较大,而FedGP相比没有中心指导的模型展现出更快且更稳定的收敛速度。

3 讨论

为解决DL方法与传统FL方法在多机构协作面临的适应性及模型收敛缓慢等问题,我们提出了FedGP方法,通过交替优化机制和机构调制网络,显著提升了多机构环境下的模型鲁棒性和泛化能力。通过轮替中央服务器的方式,避免模型对单一机构数据的过度依赖,增强了整体的稳定性和公平性;而机构调制网络则通过自适应调整,有效应对异质数据问题,进一步提升了跨机构图像恢复的质量。

本研究在低管电流和稀疏角度条件下对FedGP进行了全面评估,结果显示该方法在两种场景下均表现出卓越的图像恢复性能。图2可以观察到,FedGP能够有效减少伪影,同时保持组织细节的完整性。首先,传统的FBP方法在低管电流CT图像结果中显示了不同程度的噪声,图像质量受损严重。由机构单独进行训练的Local模型降低了噪声并恢复了一般结构,但细节恢复仍然是次优的,且结构性失真较为突出,特别是在Site #3和Site #4的ROI中边缘区域和器官内部的细微结构处。这是因为模型仅利用单一机构数据,缺乏对多机构多样数据的学习,在局部数据量不足或数据质量不好的情况下局限性大。相比之下FL方法在处理跨机构CT图像恢复任务利用多机构协作训练展现了一定的优势。其中,FedAvg 结果有残留伪影,图像细节模糊,尤其在复杂结构区域如Site #4的ROI中的红色箭头所示;FedProx 生成图像在某些区域保证细节,但存在数值偏移和部分噪声残留。原因在于,图像恢复网络对不同成像几何下的数据泛化性差,传统的中心固定式FL方法直接聚合所有局部模型参数,无法充分学习足够的全局信息,难以适应复杂的多机构协作图像恢复任务。相比之下,FedGP 方法在四个机构的结果中均表现优异,能有效抑制噪声,避免结构性伪影问题,呈现更清晰的边缘和精细组织结构。此外,由表2得到,所提出的FedGP方法在所有机构中的表现均显著优于其他对比方法。具体来说,在Site #1中,FedGP的PSNR相较于第二优的FedProx方法,获得了5.317 dB的PSNR增益。同样,在Site #2、Site #3和Site #4中,相较于第二优方法FedAvg,FedGP的PSNR增益分别为5.030 dB、4.415 dB和3.640 dB。在SSIM方面,FedGP在4个机构中的SSIM平均增益均超过0.04,显著优于其他对比方法。

在稀疏角度条件下中,FedGP成功抑制了条形伪影并恢复了复杂结构区域的细节。FBP方法表现出明显的条形伪影,图像细节损失显著。Local模型的结果虽然优于FBP,图像细节有所改善,但仍存在明显的条形伪影和细节模糊的问题。特别是在Site #2和Site #3中,图像边缘的伪影较为严重,而在Site #4中,图像整体表现过于模糊,细节丢失较多;在Site #2中,图像CT值存在偏移。而FedAvg和FedProx方法的结果在周围组织边缘仍存在部分的条形伪影,特别是在Site #2和Site #4中,图像的结构还原仍存在一定的局限性。原因在于稀疏角度采样造成图像信息严重缺失,多机构数据异质性强,对比FL方法在模型训练过程中难以平衡不同机构数据的特点,导致模型结构恢复能力不强,最终影响图像质量。相比之下,FedGP方法在所有机构的稀疏角度CT图像恢复任务中均展现了明显的优势,几乎完全消除了条形伪影,图像细节恢复更加精细。尤其在Site #1和Site #4的输出结果中,FedGP有效恢复了组织边缘,几乎看不到明显的条形伪影。此外,根据表3的定量评估结果,与第二优方法相比,FedGP在4个机构产生的平均PSNR增益为3.42 dB,SSIM平均增益为0.079,RMSE则平均降低了1.11。这是由于FedGP通过中心服务器的交替优化更全面地整合各机构特性,中心服务器利用中心指导策略指导各局部客户端特征学习,从而解决数据异质性导致的性能偏差问题。此外,消融实验进一步验证了中心指导与交替优化策略对模型性能提升的关键作用,去除这些策略后模型性能明显下降。FeGP (w/o GP)的预测误差图显示出明显的条纹伪影,特别是在低对比度和器官边界处,误差较为显著。而FedGP的预测误差则较低,误差主要集中在一些边缘区域,而且在最终的图像中保持了良好的细节纹理。消融实验表明交替优化的中心指导使得本地模型能够从全局知识的聚合中受益,进而提高了学习过程的鲁棒性和效率。

未来研究中,我们将进一步提升FedGP的实际应用性能,探索如何将多模态数据融入FedGP框架中,以实现更全面的个性化医疗。同时,可在更大规模和更高复杂度的异构数据环境中验证其泛化能力,为跨机构协作的医学图像恢复研究提供更强有力的技术支撑。

参考文献

[1]

Berrington de González A, Darby S. Risk of cancer from diagnostic X-rays: estimates for the UK and 14 other countries[J]. Lancet, 2004, 363(9406): 345-51.

[2]

Brenner DJ, Hall EJ. Computed tomography: an increasing source of radiation exposure[J]. N Engl J Med, 2007, 357(22): 2277-84.

[3]

Murase K, Nanjo T, Ii S, et al. Effect of X-ray tube current on the accuracy of cerebral perfusion parameters obtained by CT perfusion studies[J]. Phys Med Biol, 2005, 50(21): 5019-29.

[4]

Meng MQ, Wang YB, Zhu MM, et al. Dual-task learning for low-dose CT simulation and denoising[C]//7th International Conference on Image Formation in X-Ray Computed Tomography. June 12-16, 2022. Baltimore, USA. SPIE, 2022: 602-607.

[5]

Li DY, Bian ZY, Li S, et al. Noise characteristics modeled unsupervised network for robust CT image reconstruction[J]. IEEE Trans Med Imaging, 2022, 41(12): 3849-61.

[6]

You CY, Li G, Zhang Y, et al. CT super-resolution GAN constrained by the identical, residual, and cycle learning ensemble (GAN-CIRCLE)[J]. IEEE Trans Med Imaging, 2020, 39(1): 188-203.

[7]

He J, Wang YB, Ma JH. Radon inversion via deep learning[J]. IEEE Trans Med Imaging, 2020, 39(6): 2076-87.

[8]

Xia WJ, Lu ZX, Huang YQ, et al. MAGIC: manifold and graph integrative convolutional network for low-dose CT reconstruction[J]. IEEE Trans Med Imag, 2021, 40(12): 3459-72.

[9]

Han Y, Ye JC. Framing U-Net via deep convolutional framelets: application to sparse-view CT[J]. IEEE Trans Med Imaging, 2018, 37(6): 1418-29.

[10]

Kim B, Shim H, Baek J. A streak artifact reduction algorithm in sparse-view CT using a self-supervised neural representation[J]. Med Phys, 2022, 49(12): 7497-515.

[11]

Lee M, Kim H, Kim HJ. Sparse-view CT reconstruction based on multi-level wavelet convolution neural network[J]. Phys Med, 2020, 80: 352-62.

[12]

Voigt P, von dem Bussche A. The EU general data protection regulation (GDPR): a practical guide[M]. Cham, Switzerland: Springer International Publishing, 2017.

[13]

Sheller MJ, Edwards B, Anthony Reina G, et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data[J]. Sci Rep, 2020, 10(1): 12598.

[14]

Fallah A, Mokhtari A, Ozdaglar A. Personalized federated learning: a meta-learning approach[EB/OL]. 2020: 2002.07948.

[15]

Li T, Sahu AK, Talwalkar A, et al. Federated learning: challenges, methods, and future directions[J]. IEEE Signal Process Mag, 2020, 37(3): 50-60.

[16]

McMahan HB, Moore E, Ramage D, et al. Communication-efficient learning of deep networks from decentralized data[EB/OL]. 2016: 1602.05629.

[17]

Yang ZY, Xia WJ, Lu ZX, et al. Hypernetwork-based personalized federated learning for multi-institutional CT imaging[EB/OL]. 2022: 2206.03709.

[18]

陈世宣, 曾 栋, 边兆英, . 基于联邦特征学习的多机型低剂量CT重建算法[J]. 南方医科大学学报, 2024, 44(2): 333-43.

[19]

Solanes A, Palau P, Fortea L, et al. Biased accuracy in multisite machine-learning studies due to incomplete removal of the effects of the site[J]. Psychiatry Res Neuroimaging, 2021, 314: 111313.

[20]

Perez E, Strub F, De Vries H, et al. FiLM: visual reasoning with a general conditioning layer[J]. Proc AAAI Conf Artif Intell, 2018, 32(1): 3942-51.

[21]

Albarqouni S, Bakas S, Kamnitsas K, et al. Domain adaptation and representation transfer, and distributed and collaborative learning: second MICCAI Workshop, DART 2020, and first MICCAI Workshop, DCL 2020, held in conjunction with MICCAI 2020, Lima, Peru, October 4-8, 2020 , Proceedings[M]. Cham, Switzerland: Springer, 2020.

[22]

Zhu HY, Xu JJ, Liu SQ, et al. Federated learning on non-IID data: a survey[J]. Neurocomputing, 2021, 465: 371-90.

[23]

Li XX, Jiang MR, Zhang XF, et al. FedBN: federated learning on non-IID features via local batch normalization[EB/OL]. 2021: 2102.07623.

[24]

McCollough C. TU-FG-207A-04: overview of the low dose CT grand challenge[J]. Med Phys, 2016, 43(6Part35): 3759-60.

[25]

Moen TR, Chen BY, et al. Low-dose CT image and projection dataset[J]. Med Phys, 2021, 48(2): 902-11.

[26]

Ma J, Zhang Y, Gu S, et al. AbdomenCT-1K: is abdominal organ segmentation a solved problem[J]? IEEE Trans Pattern Anal Mach Intell, 2022, 44(10): 6695-714.

[27]

Deng Y, Wang C, Hui Y, et al. CTSpine 1K: a large-scale dataset for spinal vertebrae segmentation in computed tomography[EB/OL]. 2021: 2105.14711.

[28]

van Aarle W, Palenstijn WJ, Cant J, et al. Fast and flexible X-ray tomography using the ASTRA toolbox[J]. Opt Express, 2016, 24(22): 25129-47.

[29]

Zeng D, Huang J, Bian ZY, et al. A simple low-dose X-ray CT simulation from high-dose scan[J]. IEEE Trans Nucl Sci, 2015, 62(5): 2226-33.

[30]

Hinton G, Van Der Maaten L. Visualizing data using t-sne journal of machine learning research[J]. Jf Mach Learn Res, 2008, 9: 2579-605.

[31]

Li T, Sahu AK, Zaheer M, et al. Federated optimization in heterogeneous networks[J]. Proceed Mach Learn Sys, 2020, 2: 429-50.

基金资助

RIGHTS & PERMISSIONS

版权所有©《南方医科大学学报》编辑部2021

AI Summary AI Mindmap
PDF (2677KB)

218

访问

0

被引

详细

导航
相关文章

AI思维导图

/