PCS-TransUNet:基于多维度注意力机制与空间金字塔池化的医学图像分割

颜美丽; 瞿绍军

doi:10.20009/j.cnki.21-1106/TP.2025-0081

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (3) : 653 -661. DOI: 10.20009/j.cnki.21-1106/TP.2025-0081

PCS-TransUNet:基于多维度注意力机制与空间金字塔池化的医学图像分割

颜美丽, 瞿绍军

作者信息 +

Author information +

文章历史 +

PDF

摘要

医学图像分割在疾病诊断与治疗中具有关键作用，精准分割可为临床医生提供重要决策支持.然而，传统U-Net架构及其Transformer变体在捕获图像位置信息、通道特征和空间信息方面存在局限性，同时在参数效率和计算精度上仍有改进空间.为此，本文提出了一种基于多维度注意力机制与空间金字塔池化的医学图像分割模型PCS-TransUNet,提升分割精度和效率.其中利用包含Transformer的编码器，结合PCS-Block模块提纯多尺度特征，通过包含ASPP模块的解码器与改进跳跃连接的机制融合增强性能，并采用卷积模块实现上采样生成最终预测结果.同时，引入深监督机制强化中间层特征学习，并结合Dice与交叉熵损失函数优化训练过程，确保精度与效率的平衡.在Synapse数据集上，PCS-TransUNet在8个器官(主动脉、胆囊、左右肾脏、肝脏、胰腺、脾脏、胃)的分割任务中，Dice系数和Hausdorff距离分别达82.15%和18.73mm,在5个公开数据集(CVC-ClinicDB,Chest X-ray, Kvasir SEG,Kvasir-Instrument, ISIC 2018-Task)上的实验结果表明，PCS-TransUNet在IoU和Dice系数方面均超越6种主流方法，展现了显著优势.此外，PCS-TransUNet在可视化对比中也取得了最好的表现，由此表明PCS-TransUNet在智能医疗领域具有较好参考价值，能够提供高效可靠的解决方案.