基于注意力机制改进YOLOv5的茶叶病害检测方法

杨业辉 ,  范菁 ,  钟声

云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (04) : 473 -479.

PDF (2254KB)
云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (04) : 473 -479. DOI: 10.3969/j.issn.1672-8513.2025.04.012
信息与计算机科学

基于注意力机制改进YOLOv5的茶叶病害检测方法

作者信息 +

A tea disease detection method based on Yolov5 improved attention mechanism

Author information +
文章历史 +
PDF (2307K)

摘要

针对茶叶病害在复杂自然环境下识别精度受限的问题,提出了一种融合SE注意力机制的改进YOLOv5目标检测方法YOLOv5 - SE.该方法在YOLOv5网络主干中引入SE注意力模块,增强特征通道的自适应加权能力,抑制冗余信息对检测精度的影响.同时,引入小目标检测头,提升对小尺度病害的检测效果,增强模型在高分辨率特征图上的检测能力.在包含8种茶叶病害及健康叶片的数据集上进行实验验证,结果表明,YOLOv5 - SE的检测精度达到93.2%,召回率达到95.0%,较改进前模型精度提高4.5个百分点,召回率提高3.8个百分点.进一步的消融实验表明,SE注意力机制能够在优化特征提取能力的同时,有效提升模型对复杂背景下茶叶病害的检测鲁棒性,减少误检与漏检的发生.

Abstract

To address the limitations in the accuracy of tea disease recognition under complex natural environments, this paper proposes an improved YOLOv5 target detection method, YOLOv5 - SE, which integrates the SE attention mechanism. The proposed method incorporates the SE attention module into the YOLOv5 backbone to enhance the adaptive weighting of feature channels and suppress redundant information that may affect detection accuracy. Additionally, a small - object detection head is introduced to improve the detection performance of small - scale tea diseases and enhance the model′s capability in high - resolution feature maps. Experimental validation on a dataset containing eight types of tea diseases and healthy leaves demonstrates that YOLOv5 - SE achieves a detection accuracy of 93.2% and a recall rate of 95.0%, with an improvement of 4.5 percentage points in accuracy and 3.8 percentage points in recall compared to the previous model. Further ablation experiments indicate that the SE attention mechanism optimizes feature extraction while significantly enhancing the model′s robustness in detecting tea diseases under complex backgrounds, thereby reducing false positives and false negatives.

Graphical abstract

关键词

目标检测 / 注意力机制 / YOLOv5 / 茶叶病害

Key words

target detection / attention mechanism / YOLOV5 / tea disease

引用本文

引用格式 ▾
杨业辉,范菁,钟声. 基于注意力机制改进YOLOv5的茶叶病害检测方法[J]. 云南民族大学学报(自然科学版), 2025, 34(04): 473-479 DOI:10.3969/j.issn.1672-8513.2025.04.012

登录浏览全文

4963

注册一个新账户 忘记密码

中国是最重要的茶叶生产、消费、出口国之一,截至2022年我国茶园面积约为5 089.0万亩,茶叶总产量达到334.21万吨,总产值超过3 000亿元,茶叶出口量突破37万吨,出口总额超21亿美元.但是在中国已记载的茶树病虫有400多种,病害100多种,且不同茶叶园区基于当地特殊的气候环境存在不同的病虫害,造就了中国复杂的茶叶病害问题,这一复杂多变的病害问题直接影响茶叶的产量与品质,每年因病害导致的减产幅度约占10% ~ 15%1.及时的茶叶病害检测和识别是茶叶病虫害防治的重要环节,为制定合理的防治措施提供依据.传统的茶叶病害识别主要依赖人工观察和经验判断,但准确性较低,诊断效率不高,易导致误诊或漏诊.尽管专业人员的参与可提升检测准确率,但其高昂的人工成本及人力资源的限制,使得该方法难以大规模应用于所有茶园2-3.随着自动化技术的发展,通过多传感器融合检测病害的方法很早便被应用于实践中4,通过模型建立、信息采集、特征量提取、信息融合及检测判别检测农作物病虫害.无人机也被频繁应用于病虫害检测的工作当中5.在农作物病害检测方面提供了高效、精确、和全面的监测能力.然而上述方法所获取的图像与信息仍过于庞杂,对于精确,高效的识别农作物病虫害仍存在距离.
近年来,随着计算机视觉和深度学习技术的快速发展,使得基于深度学习的茶叶病害检测方法成为研究热点6-8.通过使用深度学习模型,可以从茶叶病害的图像中自动提取特征,实现对病害的分类和定位,提高检测和识别的准确性和效率.李吴洁等9用加入Van Block模块的改进YOLOv5s模型来检测柑橘的病虫害,相较于原模型其检测准确率提高的同时很好控制了模型的大小,但是该模型所覆盖的样本量较小,样本外的病害仍需人工识别.陈禹等10提出了一种基于YOLOv5s改进的YOLOv5 - CBM模型,该方法在提高检测速度的同时,优化了模型大小减少了计算机成本,在特征提取、特征融合和小目标检测方面进行了优化,然而该模型在检测速率与实时性方面仍存在不足.杨小伟等11提出了一种基于卷积神经网络构建的茶叶病害识别系统,该系统实现了茶叶图像中18种病害的检测,能较好地帮助茶农快速识别茶叶病害,但其对设备计算能力要求过高.上述深度学习模型在面对海量信息时无法精确提取出检测识别茶叶病虫害的关键信息,导致信息过载影响识别的精确性与效率.并且由于茶叶病害数据背景复杂,传统的CNN网络无法高效进行识别.针对以上问题,此篇文章中提出了一种基于SE注意力机制改进的YOLOv5 - SE模型,并且加入了小目标检测头,用于提升茶叶病害识别的准确率.

1 模型与材料

1.1 YOLOv5 模型

YOLOv5的网络结构主要包括一个主干网络和一些检测头,其主干网络用了基Darknet 提取器的CSPDarknet结构12.YOLOv5采用无锚框检测方式减少了显现框和计算量并且其具有的特征融合机制使其可以根据图像特征进行调整更好的适应大小的变化13.YOLOv5模型的主要组成部分包括:背景网络(Backbone)、颈部网络(Neck)和头部网络(Head).背景网络(Backbone):一个预训练的网络,用于为图像提取丰富的特征表示.有助于减小图像的空间分辨率并增加其特征(通道)分辨率.YOLOv5使用CSP - Darknet53作为其背景网络.CSP - Darknet53是YOLOv3用作背景网络的Darknet53的卷积网络,在其上应用了Cross Stage Partial (CSP)网络策略.颈部网络(Neck):用于提取特征金字塔.有助于模型对不同大小和尺度的对象进行良好的泛化.YOLOv5的颈部网络结合了特征金字塔网络(FPNs)和像素聚合网络(PAN)的架构,从本质上扩展了特征金字塔和像素聚合的概念.头部网络(Head):头部网络用于执行最后阶段的操作.它在特征图上应用锚框,并呈现最终输出:类别、对象性分数和边界框.YOLOv5使用与YOLOv3和YOLOv4相同的头部网络.它由3个卷积层组成,这些层预测边界框的位置(xy,高度,宽度),分数和对象类别.YOLOv5模型有4个主要版本:小型(s)、中型(m)、大型(l)和额外(x),具有不同的大小和性能指标.采用了YOLOv5s进行改进,相较于其他版本YOLOv5s更加方便快捷且具有实时性便于以后布置在手机等移动设备进行检测.

1.2 SE注意力机制

注意力机制模仿了人类注意力的特点,以达到更高效的资源分配.注意力机制可以让深度学习网络关注更重要的地方,其对深度学习网络性能的提升有很大的帮助,目前被广泛用于计算机视觉14.SE注意力机制是一种在卷积神经网络(CNN)中引入的注意力机制15.SE模块通过一个权重矩阵,从通道域的角度赋予图像不同位置不同的权重,以提取更重要的特征信息.SE模块的主要操作包括挤压(Squeeze)和激励(Excitation).挤压操作是通过全局平均池化将特征图压缩成一个特征向量.激励操作是通过两层全连接层和非线性激活函数,学习生成一个通道的权重向量.这个权重向量被应用于原始特征图上的每个通道,以对不同通道的特征进行加权.SE注意力机制具体实现过程如下.

1) 对给定对特征图X(大小为X×W×C),让其经过卷积算子Frt进行全局平均池化形成特征图Uc,如式(1)所示.

Uc=Vc*X=s=1c'Vsc*XC.

*表示卷积操作;V表示过滤器合集;Vc表示单个过滤器;s表示输入特征图XC的通道索引;c'为输入特征图的通道数;Vsc为用于加权通道s的系数.

进一步将特征图Uc进行全局平均池化,生成一个1 × 1 × C的特征向量Zc,以得到一个拥有通道C全局感受野的数值,如式(2)所示.

Zc=Fsq(Uc)=1H×Wi=1Hj=1WUc(i,j).

其中,Fsq表示卷积操作.

通过2个全连接层W1W2对上一步得到的向量Z进行进一步处理,得到所需要的通道权重值s,如式(3)所示.

s=Fex(z,W)=σ(g(z,W))=σW2δ(W1z)).

其中,δ代表激活函数Relu,σ代表激活函数Sigmoid,Fex表示卷积操作.

将上一步生成权重向量s对特征图U进行权重赋值,得到所需的的特征图,其尺寸大小与特征图完全一样,如式(4)所示.

X˜c=Fscale(Uc,sc)=scUc.

其中,X˜c为所得的特征图集;Fscale为卷积操作.

1.3 小目标检测头

在目标检测任务中,YOLOv5通过引入小目标检测头来增强对小尺度目标的检测能力,其核心原理在于多尺度特征融合和浅层高分辨率检测.传统的YOLOv5模型采用FPN + PAN结构,通常使用步长(stride)为8、16、32的特征层进行检测,而小目标往往在这些较深层次的特征图中丢失了关键信息.为此,本文在原有模型的基础上增加一个步长为4的额外检测层,使得小目标能够在更高分辨率的特征图上进行检测,增强其可见性和检测精度.

1.4 改进模型

为了实现更加高效精准的定位茶叶病害,对YOLOv5模型的backbone网络进行了改进,构建YOLOv5 - SE模型.首先在主干网络中引入SE通道注意力机制,将YOLOv5原有的C3模块替换为融合SE注意力机制的SEC3模块,以优化网络的特征提取能力增强模型对特征通道的自适应加权能力,从而突出关键病害特征、抑制冗余信息,提升特征表示能力.同时,在检测头部分额外增加一个小目标检测头,通过多尺度特征融合,增强对小尺度病害目标的检测能力,提高模型在高分辨率特征图上的表现.YOLOv5结构图如图1所示,YOLOv5 - SE结构如图2所示.

1.5 数据收集和处理方法

数据通过谷歌图片搜索进行搜集,共6 558张图片,包括有被茶蚊虫啃食的病叶a(tea mosquito bug infested leaf),被红蜘蛛啃食的病叶b(red spider infested tea leaf),茶黑煤病c(black rot of tea),茶叶锈病d(leaf rust of tea),茶白星病e(white spot of tea),藻叶斑病f(algal leaf spot),灰枯病g(grey blight),褐枯病h(brown blight)共8种病害以及茶叶(tea leaf),具体分布见图3,单个样本示例见图4.将其预处理裁剪成256×256像素的图片.由于病害发展不同,照片数量不一致,拍摄角度不同,为了避免过拟合或者欠拟合,同时提高模型检测精确度,针对具体的图像进行旋转,拉伸,增加对比度,提升或降低亮度的操作.并使用LabelImg对图像病害进行标定.按照6∶3∶1的比例划分为训练集,验证集,测试集.

2 分析方法和统计技术

2.1 运行环境

实验条件:Windows11、64 位操作系统, CPU 型号为Intel Core i7 - 12700H,运行内存为 16 GB,GPU型号为RTX3060,显存大小为6 GB.模型Python版本为3.11,Pytorch版本为2.2.1,根据硬件条件,参数如下表1.

2.2 评估指标

模型建立和运行完毕后,需对模型进行效果评价,衡量模型的性能和效果,根据评估的效果,可以优化模型的参数,分析模型的优缺点,比较不同模型的优劣.采用精确度(precision)、召回率(pecall)、F1分数(F1 score)、平均精确度均值(mean average precision,mAP)来评价模型.

精确度:又称为精准率,用来预测结果为正例的样本中实际为正例的比例.精确度的计算公式如式(5)所示.

precision=TPTP+FP .

召回率:也称查全率或命中率,表示所有的正样本中,被正确预测的比例,反映了模型对正样本的检测覆盖程度,召回率的计算公式如式(6)所示.

recall=TPTP+FN .

式中,TP为被预测模型为正类的正样本量,FP为被预测为正类的负样本量,FN为被预测为负类的正样本量.

F1分数:F1分数是精确率和召回率的调和平均数,它同时考虑了模型对正例的预测准确性和覆盖程度,F1分数取值在0到1之间,F1分数越高,说明模型分类越好,F1分数的计算公式如式(7)所示.

F1=2×precision × recallprecision + recall.

mAP是所有类别的平均精度的平均值,AP它是P - R曲线下的面积.P - R曲线是根据不同的阈值计算出的精确率和召回率的曲线.mAP反映了模型对不同类别的检测性能和泛化能力.mAP越高,说明模型的检测效果越好,计算公式如式(8)、(9)所示.

AP=01p(r)dr.
mAP=1ni-1nAPi.

式中,p用来计算P - R曲线与坐标轴围成的面积,n为检测类别数.

3 实验结果

3.1 YOLOv5 - SE模型训练结果

使用YOLOv5初始化训练的权重,对数据集进行训练,结果如图5表示,训练精度由图5(a)所示,图中的mAP_0.5表示真实框与预测框的交并比(intersection over union, IoU)为0.5的mAP.mAP 0.5~0.95表示阈值从0.5到0.95上的平均mAP.从图中可以看出迭代次数达到200次左右时,曲线逐渐趋于平稳,没有出现过拟合和欠拟合的现象.最终模型的训练精度为93.2%,召回率为95.0%,mAP_0.5为95.7%.图5(b)为训练值和验证值的损失变化曲线,分类损失越小分类越精准,置信度损失越小判断为目标的能力更准确,从图中可以看出经过60轮的训练,损失趋近于平稳,损失均低于0.05,表示模型具有较好的分类与定位能力.图5(c)为平均F1精度曲线,表示模型对正例的预测准确性和覆盖程度,表中可以看出F1精度在经历200轮后趋于平稳,最终F1精度接近0.9,表明该模型分类效果较好.图5d为PR曲线,从中可以看出模型对不同种类病害曲线的面积都接近于1,表明本模型识别效果较好.

为进一步衡量SE注意力机制对模型性能效果的提升,设计了对照实验,实验结果如表2所示.从表中可以得出,与其他模型相比,YOLOv5 - SE模型相较于其他模型,mAP,召回率与精准度都更高,可以得出YOLOv5 - SE模型效果更好,尤其是对比传统CNN模型,效果更甚.与算力要求更高的YOLOv11模型相比,本文提出的模型使用更少的算力达到了相近的效果.

3.2 消融实验

为了评估各改进模块对模型性能的影响,进行了消融实验,分别测试了YOLOv5s模型、加入小目标检测头的模型以及引入SE注意力机制的模型.实验结果如表3所示.结果表明,加入小目标检测头和SE注意力机制均有效提升了模型性能.小目标检测头使精确度从88.7%提升至91.4%,召回率从92.0%提高到94.1%,主要改善了对小尺度病害的识别能力.SE注意力机制则进一步提升精确度至92.3%,mAP显著提高至87.6%,表明其能增强关键特征提取,减少误检.相比之下,SE注意力机制的mAP提升更显著,而小目标检测头对召回率改善较大.整体来看,两种改进互补,使模型在准确性和检测能力上取得更优平衡.

4 结语

为解决在复杂背景下茶叶病害识别困难,检测效率低的问题,提出了一种基于SE注意力机制改进YOLOv5的检测模型.通过实验证明,本模型可以有效检测病害,在主干网络中加入SE注意力机制可以有效抑制无关信息,提升识别精度.相较于传统的神经模型识别精度得到了极大提高.但是,本文仅有8种常见茶叶病害的数据集,所覆盖的茶叶病害种类仍存在局限性,并且部分样本较少.在后续的研究中,将增加茶叶病害样本和考虑多种病害同时存在的情况.

参考文献

[1]

杜朝东,蒋智钢,杜泽锋,.我国茶产业研究现状[J].安徽农学通报202127(12):41 - 44.

[2]

田甜,程志友,鞠薇,.基于SimAM - ConvNeXt-FL的茶叶病害小样本分类方法研究[J].农业机械学报202455(3):275 - 281.

[3]

孙道宗,刘欢,刘锦源,.基于改进YOLOv4模型的茶叶病害识别[J].西北农林科技大学学报(自然科学版)202351(9):145 - 154.

[4]

芦兵,孙俊,杨宁,.基于荧光透射谱和高光谱图像纹理的茶叶病害预测研究[J].光谱学与光谱分析201939(8): 2515 - 2521.

[5]

胡根生,谢一帆,鲍文霞,.基于轻量型网络的无人机遥感图像中茶叶枯病检测方法[J].农业机械学报202455(4):165 - 175.

[6]

李子茂,徐杰,郑禄,.基于改进DenseNet的茶叶病害小样本识别方法[J].农业工程学报202238(10):182 - 190.

[7]

李汝嘉.基于加权抽样分层分类学习方法的茶叶病害分类[D].昆明:云南农业大学,2023.

[8]

李伟豪,詹炜,周婉,.轻量型Yolov7 - TSA网络在茶叶病害检测识别中的研究与应用[J].河南农业科学202352(5):162 - 169.

[9]

李吴洁,危疆树,王玉超,.基于改进YOLOv5的柑橘病虫害检测[J].南京农业大学学报202447(5):1000 - 1008.

[10]

陈禹,吴雪梅,张珍,.基于改进YOLOv5s的自然环境下茶叶病害识别方法[J].农业工程学报202339(24):185 - 194.

[11]

杨小伟.基于卷积神经网络的自然场景下茶叶病害识别[D].合肥:安徽大学,2021.

[12]

WU WLIU HLI Let al. Application of local fully convolutional neural network combined with YOLO v5 algorithm in small target detection of remote sensing image[J]. PloS one202116(10):e0259283.

[13]

FANG YGUO XCHEN Ket al. Accurate and automated detection of surface knots on sawn timbers using YOLO - V5 model[J].BioResources202116(3):5390.

[14]

刘超阳,范菁,曲金帅,.YOLOv5 - M3:基于轻量级网络的车辆检测模型[J].云南民族大学学报(自然科学版)202433(6):760 - 766.

[15]

HU JSHEN LALBANIE Set al. Squeeze - and - excitation networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition.2017:99.

基金资助

教育部-新一代信息技术创新项目(2023IT077)

云南省教育厅科学研究基金(2025Y0670)

云南省教育科学规划项目(BC24012)

AI Summary AI Mindmap
PDF (2254KB)

89

访问

0

被引

详细

导航
相关文章

AI思维导图

/