基于混合注意力机制的茶芽检测

王洲, 周旗, 王李进, 吴清寿

南京信息工程大学学报 ›› 2025, Vol. 17 ›› Issue (04) : 506 -514.

PDF
南京信息工程大学学报 ›› 2025, Vol. 17 ›› Issue (04) : 506 -514. DOI: 10.13878/j.cnki.jnuist.20240729001

基于混合注意力机制的茶芽检测

    王洲, 周旗, 王李进, 吴清寿
作者信息 +

Author information +
文章历史 +
PDF

摘要

准确识别茶芽图像需要克服茶芽颜色与背景相似且目标尺寸小的问题,为此提出一种应用于茶芽检测的基于混合注意力机制的YOLOv5s模型.首先,提出一种混合注意力机制(HAM)并将其加入到YOLOv5s主干网络中,使网络能够专注于目标区域,更加充分地提取特征,提高模型识别物体的准确性.然后,引入归一化瓦瑟斯坦距离(NWD)作为新的度量指标,并与原有的CIoU损失函数相结合.NWD损失函数通过边界框对应的高斯分布来计算它们之间的相似性,从而提高模型对图像中小目标的检测精度.实验结果表明,与原YOLOv5s模型相比,改进后模型的mAP0.5、mAP0.5∶0.95分别提高0.9和1.3个百分点,而参数量仅仅增加0.044×10~6.这些结果验证了本文所提出的方法在茶芽检测方面的有效性.

关键词

茶芽检测 / YOLOv5s / 注意力机制 / 损失函数

Key words

引用本文

引用格式 ▾
基于混合注意力机制的茶芽检测[J]. 南京信息工程大学学报, 2025, 17(04): 506-514 DOI:10.13878/j.cnki.jnuist.20240729001

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

129

访问

0

被引

详细

导航
相关文章

AI思维导图

/