基于Transformer改进YOLO的视网膜病变区域图像分割

中国医学物理学杂志 ›› 2026, Vol. 43 ›› Issue (05) : 582 -590.

作者信息 +

Author information +

文章历史 +

PDF

摘要

针对糖尿病视网膜病变图像分割中存在的病灶尺度差异大、边界模糊及小目标识别困难等问题，提出一种融合多尺度Transformer注意力机制的YOLO改进模型。该模型在YOLO骨干网络与Transformer之间引入轻量化跨域特征适配模块，实现卷积特征与自注意力特征的有效对齐；设计多尺度Transformer注意力模块，通过尺度自适应融合机制增强模型对不同大小病变区域的识别能力；同时耦合边缘增强模块，利用空间梯度信息强化病灶边界特征。模型采用多任务学习与参数共享策略，使分割与分类任务共享特征提取层，在提升精度的同时控制计算开销。在IDRiD和OIA-ODIR数据集上的实验表明，本文模型在分割任务中Dice相似性系数和交并比分别达到83.6%和71.8%，相较于YOLOv8提升2.3%和3.3%，边界准确性指标的平均表面距离和95%豪斯多夫距离分别降低0.22和0.47 mm；在分类任务中准确率达90.2%。消融实验与跨数据集泛化实验进一步验证各模块的有效性与模型的鲁棒性。本研究可为视网膜病变的精准分割与分类提供高效的技术方案。