基于Transformer改进YOLO的视网膜病变区域图像分割

中国医学物理学杂志 ›› 2026, Vol. 43 ›› Issue (05) : 582 -590.

PDF
中国医学物理学杂志 ›› 2026, Vol. 43 ›› Issue (05) : 582 -590.

基于Transformer改进YOLO的视网膜病变区域图像分割

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对糖尿病视网膜病变图像分割中存在的病灶尺度差异大、边界模糊及小目标识别困难等问题,提出一种融合多尺度Transformer注意力机制的YOLO改进模型。该模型在YOLO骨干网络与Transformer之间引入轻量化跨域特征适配模块,实现卷积特征与自注意力特征的有效对齐;设计多尺度Transformer注意力模块,通过尺度自适应融合机制增强模型对不同大小病变区域的识别能力;同时耦合边缘增强模块,利用空间梯度信息强化病灶边界特征。模型采用多任务学习与参数共享策略,使分割与分类任务共享特征提取层,在提升精度的同时控制计算开销。在IDRiD和OIA-ODIR数据集上的实验表明,本文模型在分割任务中Dice相似性系数和交并比分别达到83.6%和71.8%,相较于YOLOv8提升2.3%和3.3%,边界准确性指标的平均表面距离和95%豪斯多夫距离分别降低0.22和0.47 mm;在分类任务中准确率达90.2%。消融实验与跨数据集泛化实验进一步验证各模块的有效性与模型的鲁棒性。本研究可为视网膜病变的精准分割与分类提供高效的技术方案。

关键词

糖尿病视网膜病变 / 图像分割 / 神经网络 / 深度学习 / 多尺度Transformer注意力机制

Key words

引用本文

引用格式 ▾
. 基于Transformer改进YOLO的视网膜病变区域图像分割[J]. 中国医学物理学杂志, 2026, 43(05): 582-590 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/