PDF
摘要
针对水下光线衰减、散射等影响导致水下目标检测效果不佳的问题,提出一种基于YOLOv8的水下目标检测框架ERMS-YOLOv8,提升水下目标检测性能。主干网络采用高效视觉transformer网络(efficient vision transformer, EfficientViT),增强模型对水下生物的特征提取能力,减少特征信息丢失;Neck部分采用高效重参数化广义特征金字塔网络(reparameterized generalized-directional feature pyramid network, RepGFPN),增强模型对水下生物高层语义和低级空间特征的提取和融合能力,使得模型获取更加丰富的特征信息;引入混合局部通道注意力机制(mixed local channel attention for object detection, MLCA),使得模型同时融合通道信息、空间信息、局部通道信息和全局通道信息,增强了模型的表征能力;引入可扩展交并比损失函数(scalable intersection over union loss, SIoU),提升模型对目标边界信息的提取能力,从而进一步提高检测精度。实验结果表明,改进后的算法在UPRC2021和DUO数据集上mAP值分别达到83.9%和84.4%,与基准YOLOv8算法相比都有提高,在水下目标检测中具有优越的性能。
关键词
YOLOv8
/
EfficientViT
/
重参数化广义特征金字塔网络
/
注意力机制
/
损失函数
Key words
改进YOLOv8的水下目标检测算法[J].
重庆邮电大学学报(自然科学版), 2025, 37(05): 729-740 DOI: