结合多尺度与注意力机制的脑组织分割方法

张秀峰; 蒋云飞; 郭盛瑾; 刘岩松; 田凌卓; 张仕琛

doi:10.13229/j.cnki.jdxbgxb.20231419

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (10) : 3352 -3360. DOI: 10.13229/j.cnki.jdxbgxb.20231419

计算机科学与技术

结合多尺度与注意力机制的脑组织分割方法

作者信息 +

Brain tissue segmentation method combining multi-scale and attention mechanisms

Author information +

文章历史 +

PDF (2732K)

摘要

针对脑皮层下组织部分结构（如纹状体）在医学影像中目标小、对比度低，图像分割难度大，在自动医学诊断中应用比较困难的问题，本文基于深度学习的方法提出了一种医学图像分割网络，在磁共振成像中分割组成纹状体的苍白球、尾状核、壳核3部分。本文提出的网络模型具有捕获全局和局部特征的能力，并建立了全局与局部信息的相关性，在深度不退化的同时有效融合不同尺度的深层语义特征和浅层细节特征，实现对纹状体的精确分割。模型在公开的脑部数据集上进行了验证，并与其他先进的方法进行对比，结果表明本文的戴斯相似系数、平均交并比、95%豪斯多夫距离分别为94.26%、90.94%、3.82，均优于其他几种方法，达到了先进水平，这表明本文模型可以提高对纹状体的分割精度，为相关疾病的研究提供依据。

Abstract

Due to the small size and low contrast of subcortical brain structures（such as the striatum）in medical images， their segmentation is challenging， making their application in automated medical diagnosis difficult，this article proposes a medical image segmentation network based on deep learning methods to segment the three parts of the striatum， namely the globus pallidus， caudate nucleus， and putamen， in magnetic resonance imaging. The network model proposed in this article has the ability to capture global and local features and establish the correlation between global and local information， and effectively fuses deep semantic features and shallow detail features at different scales without degrading the depth， achieving accurate segmentation of the striatum. The model is validated on publicly available brain datasets and compared with other state-of-the-art methods. The model achieved dice similarity coefficient， average intersection ratio， and 95% Hausdorff distance are 94.26%， 90.94%， and 3.82 respectively， which are better than several other methods and have reached the advanced level. This shows that the model proposed in this article can improve the segmentation accuracy of the striatum and provide a basis for research on related diseases.

Graphical abstract

关键词

生物医学工程 / 医学图像分割 / 深度学习 / 多尺度特征提取 / 纹状体

Key words

biomedical engineering / medical image segmentation / deep learning / multi-scale feature extraction / striatum

引用本文

引用格式 ▾

[Author(id=1273335580251997092, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=20050736@dlnu.edu.cn, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335580310717353, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580251997092, language=EN, stringName=Xiu-feng ZHANG, firstName=Xiu-feng, middleName=null, lastName=ZHANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335580356854699, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580251997092, language=CN, stringName=张秀峰, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio={"content":"

张秀峰（1975-），男，副教授，博士. 研究方向：智能检测与生物特征识别，智能医学影像处理. E-mail： 20050736@dlnu.edu.cn

"}, bioImg=null, bioContent=

张秀峰（1975-），男，副教授，博士. 研究方向：智能检测与生物特征识别，智能医学影像处理. E-mail： 20050736@dlnu.edu.cn

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])]), Author(id=1273335580402992045, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335580461712305, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580402992045, language=EN, stringName=Yun-fei JIANG, firstName=Yun-fei, middleName=null, lastName=JIANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335580507849652, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580402992045, language=CN, stringName=蒋云飞, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])]), Author(id=1273335580553987000, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335580612707260, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580553987000, language=EN, stringName=Sheng-jin GUO, firstName=Sheng-jin, middleName=null, lastName=GUO, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335580658844605, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580553987000, language=CN, stringName=郭盛瑾, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])]), Author(id=1273335580704981952, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=3, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335580767896515, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580704981952, language=EN, stringName=Yan-song LIU, firstName=Yan-song, middleName=null, lastName=LIU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335580814033862, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580704981952, language=CN, stringName=刘岩松, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])]), Author(id=1273335580860171211, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=4, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335580918891472, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580860171211, language=EN, stringName=Ling-zhuo TIAN, firstName=Ling-zhuo, middleName=null, lastName=TIAN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335580960834517, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335580860171211, language=CN, stringName=田凌卓, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])]), Author(id=1273335581006971867, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, orderNo=5, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273335581069886436, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335581006971867, language=EN, stringName=Shi-chen ZHANG, firstName=Shi-chen, middleName=null, lastName=ZHANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273335581111829479, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, authorId=1273335581006971867, language=CN, stringName=张仕琛, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=大连民族大学机电工程学院，辽宁大连 116600, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273335580176499612, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, xref=null, ext=[AuthorCompanyExt(id=1273335580193276830, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical and Electrical Engineering，Dalian Minzu University，Dalian 116600，China), AuthorCompanyExt(id=1273335580205859744, tenantId=1045748351789510663, journalId=1155139928303341643, articleId=1273335578318422868, companyId=1273335580176499612, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=大连民族大学机电工程学院，辽宁大连 116600)])])] 张秀峰,蒋云飞,郭盛瑾,刘岩松,田凌卓,张仕琛. 结合多尺度与注意力机制的脑组织分割方法[J]. 吉林大学学报(工学版), 2025, 55(10): 3352-3360 DOI:10.13229/j.cnki.jdxbgxb.20231419

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

纹状体是大脑基底神经节的主要组成部分，它包括尾状核和豆状核，而豆状核又分为壳核和苍白球。研究表明，许多常见的脑部疾病都与纹状体有关，如亨廷顿病、帕金森病等运动和认知障碍性疾病^［1，2］，此外，自闭症、精神分裂症、注意缺陷以及重度抑郁等神经疾病也会导致纹状体结构改变^［3，4］。因此，研究纹状体的形态结构对了解相关疾病的发病机制和疾病的治疗有很大帮助^［5，6］。磁共振成像（Magnetic resonance imaging， MRI）是观察大脑内部结构的主要手段，但在MRI中，纹状体的目标小、对比度低，且不易与周围的灰质组织区分^［7，8］。因此，准确地对组成纹状体的苍白球、尾状核、壳核进行自动分割是一项具有挑战性的任务。

传统的分割算法有基于模型的分割、基于图谱的分割等，Jha等^［9］通过使用多个图谱来优化分割结果，结合医学图像的先验知识，将目标的分割看成待分割图像和已有图谱图像间的配准问题。随着人工智能的发展，基于卷积神经网络^［10］（Convolutional neural network， CNN）的深度学习方法应用十分广泛。在图像分割任务中，全卷积神经网络^［11］（Full convolutional neural network， FCN）将CNN的最后一层全连接层替换为卷积层，实现了像素级别的分类。U-Net^［12］通过编码器逐层提取图像的深度信息，再通过解码器逐层恢复图像的尺寸，并通过跳连接融合浅层纹理特征和深层语义信息，在医学图像分割领域表现出良好的性能。在DeepLab^［13-16］系列模型中，通过设置不同的扩张率使卷积操作在特征提取时具有更大的感受野，一定程度上解决了边缘分割过于平滑的问题^［17-19］。随着ViT^［20］的提出，用于自然语言处理的Transformer^［21］模型也被应用到图像处理领域。Transformer的自注意力机制可以对长距离依赖关系进行建模，能够很好地关注全局特征。

为了提高分割精度，本文结合以上方法提出一种结合多尺度和注意力机制的脑组织分割网络，该网络采用编解码结构，编码部分具有关注局部和全局信息的能力，解码部分采用多尺度特征融合策略，关注全局多尺度信息以实现精确的分割。该网络加强了对特征的复用，融合了浅层细节信息和深层语义信息，实现了对苍白球、壳核、尾状核的自动分割，在公开的脑部影像数据集上开展了相关实验，进而评估本文模型的分割性能与泛化能力。

1 网络模型

近年来，基于深度学习的医学图像分割方法性能大幅度提升。刘近贞等^［8］提出的多尺度注意网络通过设置不同扩张率的空洞卷积对特征图进行多尺度特征提取。Yee等^［22］基于U-Net进行改进，使用不同扩张率的空洞卷积对不同深度的特征进行提取，在扩大感受野的同时，提取更深层的语义信息。Ramzan等^［23］基于3D卷积网络，利用残差连接和扩张卷积对多个脑组织进行分割，并在多个数据集上取得了良好的性能。以上方法都应用了扩张卷积在不同感受野下提取图像的多尺度信息，但这些方法只能对同一采样深度下的特征进行提取，忽略了不同深度特征语义信息的多样性，在全局与局部信息的有效融合方面都存在不足之处。在医学图像分割中，不仅要关注通道上不同块之间的关系，还要对不同通道语义信息之间的关系进行建模^{［24，25］}。

单一的卷积操作始终无法在同一深度关注全局特征。ViT的提出将自注意力机制引入图像处理中，但是，Transfomer缺乏局部归纳偏置，对局部信息的特征提取能力不如CNN强，且自注意力运算需要消耗高昂的计算成本。因此，结合CNN和Transformer的方法被广泛提出，且取得了良好的效果。Li等^［26］将DenseNet用于编码，使用通道注意、空间注意和自注意力机制构建的多重注意力网络作为解码器进行解码和融合，深度关注感兴趣区域，提高了分割的准确性。Xie等^［27］提出的TransUNet将自注意力机制用于U型网络的底端以关注图像的全局特征，在解码阶段通过CNN为全局特征补充局部空间特征增强细节信息。Chen等^［28］提出的CoTr引入了可变形自注意力机制，仅关注小部分关键位置，降低了计算的复杂度，能够更好地处理多尺度和高分辨率图像。Li等^［29］提出的TFCNs，将Transformer和卷积线性注意力块引入FC-DenseNet，可以有效地捕获和传播语义特征并过滤非语义特征。

为更好地获取图像像素之间全局和局部的相关性和特征图的多尺度信息，本文提出了一种新型的编解码网络结构。如图1所示，网络采用与U-Net相同的跳连接方式融合编码和解码路径的特征图，不同的是本文将编码阶段的每一层特征图传递到解码路径的各个层，在多尺度特征中恢复分割目标。在编码阶段，本文提出了双路径特征提取模块（Dual-path feature extraction module， DFE），巧妙地将卷积和自注意力机制相结合，在有效提取局部特征的同时建立全局特征之间的相关性以丰富空间上下文信息。在解码阶段的特征融合中，本文设计了自适应多尺度特征提取模块（Adaptive multi-scale feature extraction module， AMFE），该模块主要由多尺度特征融合单元（Multi-scale feature fusion unit， MFF）和并行扩张卷积单元（Parallel extended convolution unit， PEC）级联组成，在不同分辨率和不同感受野下提取多尺度特征，以恢复分割目标的空间信息和低级语义信息，从而减少其他相同脑组织元素之间的干扰，提高类别间的语义一致性。

1.1　编码阶段

卷积具有很强的局部特征提取能力，能够很好地描述分割目标的形状、大小等信息。卷积运算是以滑动窗口的形式进行特征提取并在整个特征图中共享权重，因此，在局部感受野上能够取得很好的效果。但图像固有的内在特征对图像分割起到至关重要的作用，相比之下，自注意力机制对输入特征的上下文信息进行平均加权操作，通过相关像素之间的相似性函数来调整权重，具有很强的全局相关性建模能力。因此，在编码阶段，本文考虑将卷积和自注意力机制结合以实现互补，对全局信息和局部信息都进行关注以捕获更多的关键特征信息，从而提高分割精度。

本文提出的双路径特征提取模块如图2所示。该模块主要由局部特征提取路径和全局特征提取路径组成。在局部特征提取路径中，一个常规的卷积操作包括3×3卷积层、批归一化层和激活层，该路径通过两次连续的卷积操作进行更高维度的特征映射和深层特征提取，一次完整的卷积操作的过程可表示为：

F 1 = R e L U (B N (C o n v (X i n)))

（1）

式中：

X i n

为输入的特征图；Conv为卷积运算；BN为批归一化；ReLU为激活函数；

F 1

为输出的特征图。

在全局特征提取路径中，由于自注意力机制需要大量的参数和计算量，所以首先使用分组卷积将特征图等分为3组，为自注意力运算提供查询向量（ q ）、键（ k ）和值（ v ）以减少所需要的参数量。然后通过补丁嵌入操作和线性映射将特征图转换为用于自注意力计算的向量矩阵。自注意力的计算细节为：

f = S o f t m a x (q × k T d k) × v

（2）

式中：

q

、

k

、

v

分别为查询、键和值向量；

k T

为

k

的转置矩阵；

d k

为缩放因子；Softmax为分类函数；

f

为自注意力运算的输出。首先通过

q

和

k

的转置矩阵计算注意力模型分布，得到各个像素之间的相似度，然后通过Softmax函数进行归一化处理，生成注意力权重矩阵，最后结合

v

进行加权平均得到最终的向量

f

。将自注意力的输出向量经过重塑变为二维特征图：

F 2 = r e s h a p e (f)

（3）

式中：reshape为重塑操作；

F 2

为全局特征提取路径输出的特征图，最后将来自两个路径的特征图进行相加融合得到最终的输出

F

。

F = F 1 + F 2

（4）

在编码阶段将卷积和自注意力进行结合，使网络自适应的聚焦不同区域捕捉足够多的特征信息，通过全局信息感知分割目标的位置，通过局部信息描绘分割目标的细节，并有效区分出不同脑组织，提高分割精度。

1.2　解码阶段

在医学图像分割的过程中编码器主要是获取图像的空间和高级语义信息，而解码器通过逐层上采样恢复分割目标的语义图像。在此过程中高级语义信息和低级空间信息显得尤为重要。因此，本文提出了自适应多尺度特征提取模块，为解码路径提供图像的语义信息和空间信息两种不同尺度的特征，再通过拼接操作将同一分辨率下的特征图融合到解码路径，经过逐层卷积和上采样输出最终的分割结果。

AMFE以各个编码阶段的特征图作为输入，通过级联的多尺度特征融合单元（Multi-scale feature fusion unit， MFF）和并行扩张卷积单元（Parallel expansion convolutional unit， PEC），输出多尺度特征。利用多尺度特征融合单元将来自不同采样深度的特征图进行融合，再输入并行扩张卷积单元进行多尺度特征提取，既关注了不同感受野下的多尺度特征，又融合了不同深度的多尺度特征。AMFE整体结构如图3所示，其中两个级联单元具体细节如下文所示。

1.2.1　多尺度特征融合单元(MFF)

在下采样过程中，随着网络深度的加深会造成图像的部分纹理信息丢失，虽然通过跳连接的方式可以为网络深层补充浅层特征的位置、形状等信息，但该方式获取的特征信息较为单一，无法充分利用多尺度信息，因此，本文设计了多尺度特征融合单元，将编码过程的特征图融合到不同的解码层以获取不同尺度的空间上下文信息。

多尺度特征融合单元设计为并行结构，能够提取中间层的语义特征，从而最大限度地保留图像的浅层信息，以学习特征权重的方式融合不同尺度的特征信息。多尺度特征融合的过程如图3（a）所示，首先，通过1×1的卷积调整特征图的通道数，然后再通过上采样或最大池化调整不同层的特征图尺寸，以使其能够适配当前的解码层。

多尺度特征融合单元需要根据所在的解码层设置不同的参数对编码路径的特征图进行处理，例如，将来自编码器的特征融合到第3解码层，首先将编码器第1、2、4层的特征图通道都调整为与第3层相等的数量，再分别使用4、2倍最大池化和2倍上采样调整特征图的尺寸与第3层尺寸一致，这样就可以将编码器4个层的特征图通过相加融合输入下一单元进行处理。

1.2.2　并行扩张卷积模块(PEC)

医学图像语义分割的典型特征是类不平衡，池化操作只能对区域较大的背景与目标的区分有效。纹状体在脑部影像中存在目标较小、对比度低等问题，池化操作会造成空间信息的丢失。针对此问题，本文使用并行扩张卷积结构来捕获不同分辨率和不同尺度的上下文信息。扩张卷积在不增加网络参数和计算复杂度的前提下，通过并联不同扩张率的卷积来扩大感受野，能够获取到更多的上下文信息。不同的扩张率对应感受野大小遵循以下公式：

k' = k + (k - 1) (r - 1)

（5）

s = (2 r + 1 - 1) 2

（6）

式中：

r

为扩张率；

k

和

k'

分别为原始卷积核尺寸和扩张后卷积核尺寸；

s

为扩张后感受野大小，当

r = 1

时为标准卷积。如图3（b）所示，并行扩张卷积模块采用3个并行的卷积分支，扩张率分别为1、2、4，对MFF模块输出的特征图进行多尺度卷积操作，在不同的感受野下建立局部特征的相关性，然后将3个分支输出的特征图拼接进行融合，将该特征图输入解码阶段的卷积层映射更高的维度进行计算，恢复分割目标并抑制冗余信息。

选择合适的扩张率对网络的分割效果有极大的影响，扩张率太大会导致卷积过程中掺杂无关的采样信息，而扩张率太小也会使扩张卷积接近普通卷积而无法真正发挥作用。为避免对特征图中的任何两个扩张卷积层进行重复采样，本文提出的多尺度扩张卷积的扩张率设置遵循以下公式：

k - 1 2 < m a x ([r, I r j] r I, [r I, r j] r j) ∀ I, j ∈ {1,2, ⋯, s}

（7）

式中：

k

为卷积核的大小；

[r I, r j]

为

r I

和

r j

的最小公倍数，满足上述公式约束的可以认为是一组可接受的扩张率。按照式（7）的约束，同时考虑到目标的不平衡度、大小和形状的特点。在实验中不连续使用相同扩张率的扩张卷积，把扩张率设置为“阶梯状”，如［1， 2， 4］，可以有效避免采样位置重合导致提取冗余特征。

2 实验结果与分析

2.1　数据集

本项研究中使用的脑部MRI数据集为MICCAI 2012。该数据集包含多个专家勾画的T1加权MRI脑组织多结构图像和标签图像，专家标注均遵循BrainCOLOR协议和NeuroMorphometric协议。通过对MRI横断面进行切片、裁剪、筛选等数据预处理操作，得到389张尺寸为512×512像素的有效图像。然后对图像进行旋转和翻转的数据增强操作，最终生成3 600张清晰图片。本文将扩展后的数据集以7∶2∶1划分为训练集、测试集和验证集进行模型的训练。

2.2　评价指标

模型性能的评估使用医学图像分割最常用的评估指标，包括戴斯相似系数（Dice similarity coefficient， DSC）、平均交并比（Intersection over union， IoU）、豪斯多夫距离（Hausdorff distance， HD）。各种指标的计算方式如下：

（1）DSC计算公式：

D S C = 2 T P 2 T P + F P + F N

（8）

（2）IoU计算公式：

I o U = T P T P + F P + F N

（9）

（3）HD计算公式：

H D = m a x [d X Y, d Y X] = m a x m a x m i n x - y x ∈ X, y ∈ Y, m a x m i n y - x y ∈ Y, x ∈ X

（10）

式中：

T P

、

F P

、

F N

分别为网络预测的真阳性、假阳性、假阴性的数量；DSC为用来衡量预测结果与真实结果之间相似程度的指标；

I o U

为计算真实值和预测值两个集合的交集与并集之比的指标；

H D

为预测结果和真实结果之间的最大不相似程度，该值越小表示网络模型的分割结果与标签越接近，其中

X

表示真实结果，

Y

表示预测结果，

d X Y

和

d Y X

代表预测图像与真实图像的单向距离，max和min分别表示取最大值和最小值。

2.3　参数设置及训练

本次实验所使用的服务器参数：中央处理器为AMD Ryzen93900X，内存为16 GB，图形处理器为RTX3080Ti，操作系统为Ubuntu18.04.2LTS，优化器选用Adam。以Python 3.6作为编程语言，应用Pytorch深度学习框架。训练参数：训练轮次200轮，每批样本为4，初始学习率为0.001，输出图片尺寸为512×512像素。

2.4　对比实验

为了评估本文模型的分割性能，将本文模型与8个先进模型进行了对比实验，所有模型运行在相同的实验环境下。表1~表3分别展示了在不同评估指标中各个模型对苍白球、尾状核和壳核的分割结果，与其他模型相比，本文模型在各项评估指标中均表现出良好的分割性能，平均水平优于其他模型，达到了先进水平。

表4展示了各个模型所需要的参数量和计算量。由于本文模型使用分组卷积减少了自注意力计算的参数，在模型性能良好的前提下，比其他采用自注意力机制的网络运行速度更快，网络参数量更少。

图4展示了各种网络模型的分割效果图，红色区域代表苍白球，蓝色区域代表尾状核，绿色区域代表壳核。可以看出，在分割任务中CAN、CoTr、TransUNet等方法出现了边缘分割不准确的问题，其他方法则有边缘分割过于平滑的问题存在。

图5和图6所示为模型的训练曲线图，从曲线图可以看出在模型训练到50轮次左右时，模型的收敛速度变慢，在训练到150轮次左右时，DSC与IoU数值趋于稳定，指标良好。最终模型收敛趋于稳定，说明网络具有良好的泛化能力。

2.5　消融实验

为了验证本文方法对分割的有效性，对双路径特征提取模块和自适应多尺度特征提取模块进行消融实验。本文网络以U-Net为基线网络（Baseline），在基线网络的基础上分别构建使用了DFE模块和AMFE模块的两个网络，在MICCAI 2012数据集上对纹状体进行分割，最终得到的各项指标数据如表5所示。以戴斯系数作为评估指标，在使用DEF模块时，戴斯系数达到93.15%，与U-Net相比提升了0.87%，这表明在编码阶段同时获取局部和全局不同区域的上下文信息是有效的。在只加入AMFE模块的情况下，戴斯系数达到了94.04%，说明网络在解码的过程中连接不同阶段的编码特征带来的多尺度信息有益于纹状体的分割。两个模块同时构建的网络戴斯系数达到94.26%，这表明在将编码阶段具有局部和全局的特征自适应地映射到解码阶段比单一路径映射更有效，同时二者有效结合能够充分利用不同尺度的局部特征与全局上下文信息，提高分割的精度。

此外，图7展示了所设置的消融实验分割效果，可以看出仅有部分模块构成的模型分割图像存在边角虚化以及边缘分割不精确的问题，而本文网络解决了这方面的问题，呈现了良好的分割结果。

2.6　分割结果三维重构

对纹状体进行分割的目的是观察其形态结构，帮助医生更好地了解纹状体相关疾病的病因、发病机理等，能够进行更准确和快速的诊断，采用更合适的治疗方式。为此，本文将同一MRI的分割结果图片进行逐层堆叠，重构回3D图像，如图8所示，使用ITK-SNAP软件，可以实现在各个方向对纹状体3D结构进行观察。

3 结束语

本文针对卷积神经网络在医学影像小目标的分割中存在分割精度低、复杂度较高的问题进行改进。结合医学图像数据的特点，重新思考了局部信息与全局信息的结合方式，巧妙地将卷积和自注意力机制有效结合，改善了传统的特征提取方式。在特征解码阶段构建了自适应多尺度扩张卷积模块，将不同尺度特征进行自适应融合并提取局部与全局的上下文信息，从而将不同分辨率的特征信息结合在一起；在并行扩张卷积单元获取不同感受野下的空间信息和高级语义信息，并通过降维等操作实现特征拼接以建立全局依赖关系。对比实验结果表明，本文模型戴斯相似系数为94.26%，平均交并比为90.94%，相比其他网络有一定程度的提升；95%豪斯多夫距离为3.82，有明显下降，这表明模型的分割效果较好，稳定性较强。当然，本文模型也存在一定的问题，如在获取2D切片时，丢失了一些空间特征信息，影响分割精度，在后续的相关研究中，应重点考虑3D空间的特征关联性，进一步提高分割精度。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Del Rey N L G, García-Cabezas M Á. Cytology, architecture, development, and connections of the primate striatum: hints for human pathology[J]. Neurobiology of Disease, 2023, 176: No. 105945.

[2]	Cataldi S, Stanley A T, Miniaci M C, et al. Interpreting the role of the striatum during multiple phases of motor learning[J]. The FEBS Journal, 2022, 289(8): 2263-2281.

[3]	Mätlik K, Baffuto M, Kus L, et al. Cell-type-specific CAG repeat expansions and toxicity of mutant Huntingtin in human striatum and cerebellum[J]. Nature Genetics, 2024, 56: 383-394.

[4]	Afrasiabi M, Redinbaugh M J, Phillips J M, et al. Consciousness depends on integration between parietal cortex, striatum, and thalamus[J]. Cell Systems, 2021, 12(4): 363-373.

[5]	Blumenstock S, Dudanova I. Cortical and striatal circuits in Huntington´s disease[J]. Frontiers in Neuroscience, 2020, 14: No. 82.

[6]	Valjent E, Gangarossa G. The tail of the striatum: from anatomy to connectivity and function[J]. Trends in Neurosciences, 2021, 44(3): 203-214.

[7]	Liu X, Song L, Liu S, et al. A review of deep-learning-based medical image segmentation methods[J]. Sustainability, 2021, 13(3): No.1224.

[8]	刘近贞, 高国辉, 熊慧. 用于脑组织分割的多尺度注意网络[J]. 吉林大学学报: 工学版, 2023, 53(2): 576-583.

[9]	Liu Jin-zhen, Gao Guo-hui, Xiong Hui. Multi⁃scale attention network for brain tissue segmentation[J]. Journal of Jilin University(Engineering and Technology Edition), 2023, 53(2): 576-583.

[10]	Jha D, Riegler M A, Johansen D, et al. Doubleu-net: a deep convolutional neural network for medical image segmentation[C]∥IEEE 33rd International Symposium on Computer-Based Medical Systems (CBMS), Rochester, USA, 2020: 558-564.

[11]	Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.

[12]	Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 3431-3440.

[13]	Ronneberger O, Fischer P, Brox T. U-net: convolutional networks for biomedical image segmentation[C]∥ The 18th International Conference on Medical Image Computing and Computer-Assisted Intervention, Munich, Germany, 2015: 234-241.

[14]	Chen L C, Papandreou G, Kokkinos I, et al. Semantic image segmentation with deep convolutional nets and fully connected crfs[J/OL].[2023-11-22].

[15]	Chen L C, Papandreou G, Kokkinos I, et al. Deeplab: semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(4): 834-848.

[16]	Chen L C, Papandreou G, Schroff F, et al. Rethinking atrous convolution for semantic image segmentation[J/OL].[2023-11-23].

[17]	Chen L C, Zhu Y, Papandreou G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation[C]∥Proceedings of the European Conference on Computer Vision(ECCV), Munich, Germany, 2018: 801-818.

[18]	Safavian N, Batouli S A H, Oghabian M A. An automatic level set method for hippocampus segmentation in MR images[J]. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 2020, 8(4): 400-410.

[19]	黄鸿, 吕容飞, 陶俊利, 等. 基于改进 U-Net++ 的 CT 影像肺结节分割算法[J]. 光子学报, 2021, 50(2): 65-75.

[20]	Huang Hong, Rong-fei Lü, Tao Jun-li, et al. Segmentation of lung nodules in CT images using improved UNet++[J]. Acta Photonica Sinica, 2021, 50(2):65-75.

[21]	Qin D, Bu J J, Liu Z, et al. Efficient medical image segmentation based on knowledge distillation[J]. IEEE Transactions on Medical Imaging, 2021, 40(12): 3820-3831.

[22]	Dosovitskiy A, Beyer L, Kolesnikov A, et al. An image is worth 16x16 words: Transformers for image recognition at scale[J/OL].[2023-11-24].

[23]	Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]∥Proceedings of the 31st International Conference on Neural Information Processing Systems,Long Beach California USA,2017: 6000-6010.

[24]	Yee E, Ma D, Popuri K, et al. 3D hemisphere-based convolutional neural network for whole-brain MRI segmentation[J]. Computerized Medical Imaging and Graphics, 2022, 95: No.102000.

[25]	Ramzan F, Khan M U G, Iqbal S, et al. Volumetric segmentation of brain regions from MRI scans using 3D convolutional neural networks[J]. IEEE Access, 2020, 8: 103697-103709.

[26]	Wu W, Gao L, Duan H, et al. Segmentation of pulmonary nodules in CT images based on 3D‐UNET combined with three‐dimensional conditional random field optimization[J]. Medical Physics, 2020, 47(9): 4054-4063.

[27]	Yan H, Chen A. A novel improved brain tumor segmentation method using deep learning network[J].Journal of Physics: Conference Series, 2021, 1944(1): No.012011.

[28]	Li Z, Zhang C, Zhang Y, et al. CAN: context-assisted full attention network for brain tissue segmentation[J]. Medical Image Analysis, 2023, 85: No.102710.

[29]	Xie Y, Zhang J, Shen C, et al. Cotr: efficiently bridging cnn and transformer for 3d medical image segmentation[C]∥The 24th International Conference on Medical Image Computing and Computer Assisted Intervention, Strasbourg, France,2021: 171-180.

[30]	Chen J, Lu Y, Yu Q, et al. Transunet: Transformers make strong encoders for medical image segmentation[J/OL].[2023-10-25].

[31]	Li Z, Li D, Xu C, et al. TFCNs: a CNN-transformer hybrid network for medical image segmentation[C]∥International Conference on Artificial Neural Networks,Bristol, UK, 2022: 781-792.

[32]	Wang K, Zhang X, Zhang X, et al. EANet: iterative edge attention network for medical image segmentation[J]. Pattern Recognition, 2022, 127: No.108636.