基于改进YOLOv5s的三七病害识别

魏科 ,  周平

云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (01) : 93 -99.

PDF (1998KB)
云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (01) : 93 -99. DOI: 10.3969/j.issn.1672-8513.2025.01.012
信息与计算机科学

基于改进YOLOv5s的三七病害识别

作者信息 +

Panax notoginseng disease identification based on improved YOLOv5s

Author information +
文章历史 +
PDF (2045K)

摘要

为快速、准确识别田间环境下的三七叶片病害,提出1种基于改进YOLOv5s算法的三七叶片病害识别方法.以三七的六种典型病害圆斑病、灰霉病、黄锈病、白粉病、炭疽病和病毒病为对象,通过引入SE-Attention(spatial excitation attention)注意力机制,增强了YOLOv5s模型对病害部位关键信息的捕捉能力,提高模型对不同通道特征信息的敏感性.此外,模型采用加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN),提升特征融合的有效性,实现高层次的特征表达,从而提高模型的泛化能力.试验结果表明,改进后的YOLOv5s模型准确率和召回率分别为86.8%和85.3%,mAP0.5和mAP0.5:0.95分别为87.4%和76.4%,相较于原始YOLOv5s模型,准确率、召回率、mAP0.5和mAP0.5:0.95分别提升10.4、13.0、11.0和18.6个百分点,最后通过对比不同深度学习目标检测模型对三七病害进行检测,结果表明本试验所提出的算法可以在保证精度与速度的前提下,实现田间三七病害的智能化检测,为实际应用场景下三七病害自动检测提供理论依据.

关键词

三七病害检测 / YOLOv5s / 注意力机制 / BiFPN

Key words

Panax notoginseng disease detection / YOLOv5s / attention mechanism / BiFPN

引用本文

引用格式 ▾
魏科,周平. 基于改进YOLOv5s的三七病害识别[J]. 云南民族大学学报(自然科学版), 2025, 34(01): 93-99 DOI:10.3969/j.issn.1672-8513.2025.01.012

登录浏览全文

4963

注册一个新账户 忘记密码

三七(Panax notoginseng),为五加科人参属植物,主产于云南、广西、四川等地,是我国名贵的中药材1-2,其主要成分包括三七素、三七总皂苷、氨基酸等有效成份,具有止血、保护心肌细胞、抗血栓等作用,进而引起国内外学者的高度重视,并对三七进行了大量研究3-4.近年来随着医学研究的不断深入,三七种植面积也在逐年上升,三七病害成为制约三七产量和品质的关键因素,给生产者带来巨大的经济损失.且三七病害都属于侵染性病害,传播速度极快5-6,目前对于三七的病害识别技术还局限于专业技术人员人工检测以及生物试剂检测7-10,存在费时费力、主观性强等缺点,容易错过三七病害的最佳防治时期.随着计算机技术的不断进步,国内外研究者开始应用机器视觉算法于农作物病害的图像识别中.在传统的目标检测方法中,多数学者采用基于阀值分割10-12,颜色空间变换13-14等技术应用于农作物的病害检测中,但这些方法依赖于手工提取的特征,如颜色、纹理和空间结构等,存在适应性差、运行成本和时间复杂度高等问题,不能满足农业生产的需要.近年来,随着计算机技术的发展,深度学习越来越多的被应用于植物病害识别,但目前机器视觉技术应用于三七叶片病害检测的案例较少.罗匡男等15使用投影主要边缘分布(PPED)特征法提取三七病斑的特征向量,使用k-means算法进行病斑识别,平均准确率达到85.83%.但该方法是基于人工选取阈值提取病害特征信息,存在工作量大、主观性强的缺点.曹春号16基于Faster-RCNN算法开发了手机App实现三七病害的在线监测,对三七病害的检测和预警具有重要的实际应用价值.但Faster-RCNN的模型参数较多,计算量较大,难以在移动端部署.杨康等17提出基于改进SSD算法的轻量化三七病害检测模型,平均准确率达到82.0%,且模型尺寸仅为原始SSD模型的54.6%,更利于在移动端设备中部署,但模型实现比较复杂,且仅针对4种病害进行检测,缺少普适性.
YOLO系列算法作为目前深度学习主流单阶段算法模型,以其良好的检测精度和检测速度被广泛应用于植物病害识别领域.Liu等18提出基于Mobilenetv2-YOLOv3的轻量化模型,检测精度可以达到90%以上,并且检测速度可以达到246 帧/s.王权顺等19基于改进YOLOv4算法对苹果叶部病害缺陷进行检测,结果表明改进后模型的精度与速度可以满足实际生活中苹果叶部病害检测的需求.Wang等20提出一种基于单阶段深度检测YOLO框架的新型YOLO-Dense,对异常番茄进行检测,单张图像的mAP和检测时间分别为41.20%和28.3 ms.储鑫等21提出1种基于改进YOLOv4算法的轻量化番茄叶部病害识别方法,结果表明改进后模型对8类番茄叶片整体mAP为98.76%.左昊轩等22提出集成改进YOLOv5s的番茄黄化曲叶病检测识别方法,该方法可以在保证精度和速度的同时实现番茄黄化曲叶病的检测.
YOLOv5s作为YOLO系列的代表模型,可以适应不同环境中的目标检测需求,因此更符合实际的多场景应用中.基于此,以圆斑病、灰霉病、黄锈病、白粉病、炭疽病和病毒病6种常见病害作为数据源,选用YOLOv5s作为基线模型,并引入SE-Attention注意力机制与加权双向特征金字塔网络(BiFPN)模块,以全面提升模型的特征提取能力和多尺度特征的融合效果.通过注意力机制,模型能够更加聚焦于三七病害图像的关键区域,减少噪声干扰;而BiFPN模块进一步强化了不同病害特征在不同层级之间的传递与融合,使得模型在复杂场景下具备更强的泛化能力与鲁棒性,为三七病害的早期预警和精准防治提供重要理论支持.

1 材料与方法

1.1 数据采集及预处理

本试验为了符合实际的田间环境要求,分别在不同时间、不同天气条件下采集温室内患病三七植株叶片图像1 500张作为原始数据集,如图1所示,其中包括圆斑病、灰霉病、黄绣病、白粉病、炭疽病和病毒病6种病害数据以及健康叶片数据.

为了防止网络发生过拟合现象,提高训练模型的泛化能力,本试验通过随机裁剪、缩放、垂直和水平翻转等手段对原始数据进行图像增强,得到4 000幅病害图像.将所有数据样本大小裁剪为640 × 640像素大小,并使用LabelImg工具将数据集中的不同病害进行标注并依次标记为0~5,按照比例8∶1∶1划分为训练集、验证集和测试集.

1.2 模型构建

1.2.1 YOLOv5算法

YOLOv5是1种单阶段目标检测算法23,根据网络深度和宽度的不同,可以分为4个版本,分别为YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,区别在于残差结构的数量,模型的检测精度随着残差结构的增加逐渐提高,但检测时间逐渐下降24.YOLOv5s属于YOLOv5的轻量级网络结构,模型尺寸更小,能达到良好的精度与速度,更加符合实际的农业生产需要,达到实时监测的目的,所以本文选择模型结构较为简单的YOLOv5s模型,保证速度与精度并存的同时,缩小模型尺寸,降低计算机资源消耗.

YOLOv5s采用单阶段检测框架,能够在单次前向传播中同时进行物体的定位和分类,从而显著提高检测速度.其主干网络是基于CSPNet(cross stage partial network)结构,该结构通过将特征图分割为多个部分,减少计算复杂度,同时提升模型的学习能力.模型使用锚框机制来预测目标的位置和大小,依靠预定义的锚框生成边界框,并通过回归方式调整这些框以更好地适应真实目标.此外,YOLOv5s具有多个预测头,专门处理不同尺度的物体检测,这种多尺度检测机制确保了模型能够有效识别各种大小的目标.模型训练过程中使用改进的损失函数,结合分类损失、定位损失和置信度损失,以优化性能.最后通过非极大值抑制(NMS)算法去除重复的检测框,确保最终输出的检测结果具有较高的准确性.

1.2.2 注意力机制

注意力机制是一种机器学习和深度学习中常用的技术,其关键思想在于计算资源受限的情况下,模拟人类在处理信息时的关注过程,允许模型能够智能地关注输入数据的不同部分,处理最相关的输入信息,从而提高模型的性能和效果,更适应不同的任务和应用场景25.

SE-Attention是一种增强神经网络对输入特征图关注的注意力机制,使网络能够更好的捕获重要通道的信息26,其网络结构如图2所示.首先对每个通道执行全局平均池化(global average pooling)操作,将每个通道的特征图压缩(squeeze)到特定的标量值,以表示该通道在整个特征图上的平均重要性.其次在激励(excitation)阶段,SE-Attention引入1个小型的前馈神经网络,将多个通道的标量值整合为单个向量后,经过全连接层(FC)的处理之后,再利用sigmoid函数将其变换为0 ~ 1之间的值,并对特征图的通道维度进行重新加权,以强调重要的通道,并抑制不重要的通道.其重要思想在于允许不同通道之间的交互,通过在Squeeze阶段对每个通道进行全局平均池化,网络可以捕获通道之间的关系,从而能够更好地学习到哪些通道在特定任务中更为重要,从而增强模型对特征图的关注,有助于提高模型的表征能力和泛化能力.自适应的学习通道的权重,计算成本较小的优势也使得SE-Attention更便于模型嵌入,从而提高模型性能.

1.2.3 加权双向特征金字塔网络

随着卷积神经网络的发展,网络深度逐渐加深,目标的特征信息也越来越强,模型对于目标的分类信息预测越好,但对于目标的位置信息表现越来越弱,并且在不断的卷积过程中,对小目标的信息容易造成损失,因此需要不同尺度的预测,YOLOv5在Neck阶段提出路径聚合网络(PANet),其结构是自顶向下和自底向上的双向融合骨干网络,但采用该结构网络的信息流动是单向的,只是自顶向下或自底向上的连接,这限制了特征信息的全局传递能力,且非常依赖网络架构的配置以及大量的超参数调优.所以本文采用加权特征金字塔网络(bidirectional feature pyramid network, BiFPN)27替换原有YOLOv5的PANet结构,其网络结构如图3所示.首先,自上而下的路径将高层特征图传递到低层节点,同时自下而上的路径将低层特征图传递到高层节点.在每个融合模块中,来自不同层的特征图通过可学习的加权机制进行加权组合,形成新的特征图再传递到下一个融合模块,形成密集的特征连接和信息流动.每一层的特征融合都能充分利用前一层和后续层的信息,确保特征在不同尺度间的有效整合.

通过引入双向连接,允许特征金字塔上下2个方向上的信息流动,有助于更好的融合多尺度特征;其次由于BiFPN包括多个层级,以便于在多分辨率下处理特征,从而理解图像上不同位置的特征信息;最后通过自适应的权重学习机制,决定特征在不同层级上传播路径,从而根据任务和输入数据的不同进行调整,提高不同尺度下的模型性能.

1.2.4 改进后的网络

以YOLOv5s作为基线模型加以改进,以适应田间实际环境条件下的三七病害的识别检测,针对YOLOv5s模型,将backbone的C3模块中的bottleneck替换为SE-Attention注意力,在不增加计算资源的基础上,增强网络对三七病害特征图像信息的关注能力,使网络能够更好的捕获重要的空间信息.将Neck端的FPN+PAN结构替换为BiFPN,通过加权双向特征金字塔网络在多次融合中强化特征表示,从而提高模型的识别性能.改进后的网络结构图如图4所示.

2 模型训练

2.1 试验环境及参数设置

本试验在window11操作系统上运行,搭载Intel Core i5-10400F CPU,主频2.9 GHz,最高睿频4.3 GHz,64 G机带RAM,Nvidia Geforce RTX 3070显卡.本模型基于PyTorch深度学习框架和Python 3.7编程语言实现,使用CUDA 11.0进行计算加速.通过多次训练进行参数调节后确定最优选择参数:动量为0.926,批量大小为32,初始学习率为0.01,以及总训练轮数设置为400,交互比(IoU)阈值为0.5.

2.2 评价指标

本研究采用精确率(P)、召回率(R)、类别平均精度(mAP0.5)以及mAP0.5∶0.95等指标对实验结果进行评估.精确率(P)衡量模型在所有病害类别中判定正确的比例,召回率(R)反映模型识别病害信息的完整性.mAP0.5表示在IoU阈值为0.5时的平均精度,而mAP0.5∶0.95表征IoU阈值从0.5到0.95(步长为0.05)区间内的平均mAP.计算公式如(1 ~ 2)所示.

P r e c i s i o n = T P T P + F P.
R e c a l l = T P T P + F N.

式中,TP代表预测值和真实值均为正例,FP代表预测值为正例,但真实值为负例,FN代表预测值和真实值均为负例.

2.3 性能结果分析

为了验证本试验改进策略的有效性,3种不同模型在训练集上的准确率变化如图5所示.可以看出,YOLOv5s在训练初始阶段存在较严重的数据震荡,但结合SE模块以及BiFPN模块改进后,数据震荡现象得到明显改善,其中YOLOv5s-SE-BiFPN模型表现最优.所有模型随着迭代次数的增加,准确率均呈稳定上升趋势,并在第300轮训练时趋于稳定,各模型最终准确率均超过75%,表明YOLOv5s及其改进模型在三七病害数据集上具有较强的适应性.

此外,在实验过程中采用消融实验以全面评估模型改进的效果,并对比了原始YOLOv5s和改进后的模型表现.如表1所示,优化后的YOLOv5s在多个评价指标上相较于原始模型有较好提升,精度、召回率、mAP0.5和mAP0.5∶0.95分别提高了10.4、13.0、11.0和18.6个百分点,结果表明通过引入SE注意力机制结合BiFPN模块,使模型能更好的捕捉图像病害关键特征和融合多尺度病害信息.改进后的模型不仅在精度上取得了优异的表现,还在检测速度方面保持了较高水平,帧率达到56帧/s,虽然模型在优化后尺寸增加了2.17 MB,但其整体计算效率未受明显影响.

2.4 不同模型的对比试验分析

为了验证改进模型对自然环境下三七不同病害检测的性能与优势,对比了其他当前经典的目标检测模型,试验采用YOLOv8、YOLOv4、Faster R-CNN、SSD模型,在2.1同参数配置条件下,采用相同训练集和验证集进行训练和测试,最终得到性能测试结果如表2所示.

表2可以看出,本试验提出的YOLOv5s-SE-BiFPN模型在三七6种不同病害数据集上对比所有模型表现最优,识别准确率和召回率可达到86.8%和85.3%,mAP0.5 达到87.4%,mAP0.5:0.95 达到76.4%.综合不同模型性能对比分析后发现,YOLOv5s-SE-BiFPN和YOLOv8模型的准确率、召回率和mAP0.5均能达到80%,且mAP0.5:0.95相对其他模型也能达到70%以上.虽然改进后模型较YOLOv8的模型尺寸较大,但由于YOLOv8采用多个残差单元和多分支的复杂模型结构,在提升精度的同时损失了检测速度,而YOLOv5s-SE-BiFPN更适用于实际的三七病害检测中,且对比所有参数后可得,改进后YOLOv5s模型能够更好的捕获重要的空间信息,提高多尺度信息的流动能力,使模型对于三七不同病害特征更加敏感,同时改善特征的分辨率和多尺度表示,减少噪声对识别效果的干扰,对实际田间环境下三七病害模型的泛化能力更强,整体性能更优.

为进一步验证改进后YOLOv5模型的检测性能,对测试集的三七病害数据进行了推理验证.由图6可知,由于圆斑病和灰霉病的病害特征较为明显,模型对其检测的置信度较高.此外,改进模型在处理小目标时表现较好,能够精准识别三七叶片上不同区域的黄锈病病斑.并且在测试过程中,模型未出现明显的误检和漏检情况,表明其对细微病变区域也具有较强的感知能力.因此,基于改进YOLOv5s的检测方法在复杂田间环境下具备较高的检测精度和可靠性,能够有效满足三七病害检测的实际应用需求.

3 结语

针对三七不同病害检测精度低、实时检测速度慢等问题,提出了1种融合SE-Attention注意力机制,更好的捕获通道中的重要信息,降低实际田间环境对三七病害检测的影响,更换PANet为BiFPN网络后,可以减少模型对计算机资源的消耗,更好的融合多尺度信息,结果表明采用这两种改进措施可以提高模型的检测精度和鲁棒性.

通过构建三七6种不同病害数据集,利用改进的模型进行训练后发现,相较于YOLOv5s算法,准确率和召回率分别为86.8%和85.3%,mAP0.5和mAP0.5:0.95可分别达到87.4%和76.4%,相较于原始YOLOv5模型,准确率提高10.4个百分点,召回率提升13.0个百分点,mAP0.5提升11.0个百分点,mAP0.5:0.95提升18.6个百分点,且复杂外界环境条件下具备更好的泛化能力、鲁棒性和识别能力.

试验结果表明,在模型尺寸仅增加2.17MB的前提下,改进后模型识别帧率达到56.0帧/s,可以满足实际田间三七病害实时监测的目的,可以为实际应用场景下三七病害自动检测提供理论依据.

参考文献

[1]

王莹,禇扬,李伟,三七中皂苷成分及其药理作用的研究进展[J].中草药201546(9):1381-1392.

[2]

杨志刚,陈阿琴,俞颂东.三七药理研究新进展[J].上海中医药杂志2005(4):59-62.

[3]

冯陆冰,潘西芬,孙泽玲.三七的药理作用研究进展[J].中国药师200811(10): 1185-1187.

[4]

鲍建才,刘刚,丛登立,三七的化学成分研究进展[J].中成药200628(2): 246-253.

[5]

BOCK C H POOLE G H PARKER P E, et al. Plant disease severity estimated visually, by digital photography and image analysis, and by hyperspectral imaging[J]. Critical Reviews in Plant Sciences201029(2): 59-107.

[6]

ARNAL BARBEDO J G. Digital image processing techniques for detecting, quantifying and classifying plant diseases[J]. SpringerPlus20132(1): 660.

[7]

杨涛,陈昱君,段承俐,三七黑斑病抗性人工鉴定方法的建立[J].云南农业大学学报2006(5):549-553.

[8]

王志敏,皮自聪,罗万东,三七圆斑病和黑斑病及其防治[J].农业与技术201636(1):49-51.

[9]

李欣. 三七主要病害病原菌的快速检测及叶部病害病原菌的鉴定[D].昆明:昆明理工大学,2020.

[10]

何恒,周平.基于深度学习的三七病害识别方法适应性研究[J].湖北农业科学202463(8):54-60.

[11]

WANG Y DAI Y XUE J, et al. Research of segmentation method on color image of Lingwu long jujubes based on the maximum entropy[J]. EURASIP Journal on Image and Video Processing20172017: 1-9.

[12]

明浩,苏喜友.利用特征分割和病斑增强的杨树叶部病害识别[J].浙江农林大学学报202037(6):1159-1166.

[13]

刘永波,雷波,胡亮 机器视觉在HSV颜色空间下稻瘟病病程分级判定研究[J].农学学报202010(10):83-90.

[14]

BAI X LI X FU Z, et al. A fuzzy clustering segmentation method based on neighborhood grayscale information for defining cucumber leaf spot disease images[J]. Computers and Electronics in Agriculture2017136: 157-165.

[15]

罗匡男,彭琳,齐伟恒.基于机器视觉的三七叶片病斑识别[J].江苏农业科学201745(24):209-212.

[16]

曹春号. 基于卷积神经网络的三七叶片病害手机在线检测与预警装置研制[D].昆明:昆明理工大学,2020.

[17]

杨康,熊凯,周平 基于改进SSD算法的轻量化三七病害检测[J].华南农业大学学报202344(03):447-455.

[18]

LIU J WANG X. Early recognition of tomato gray leaf spot disease based on MobileNetv2-YOLOv3 model[J]. Plant Methods202016: 1-16.

[19]

王权顺,吕蕾,黄德丰 基于改进YOLOv4算法的苹果叶部病害缺陷检测研究[J].中国农机化学报202243(11):182-187.

[20]

WANG X LIU J. Tomato anomalies detection in greenhouse scenarios based on YOLO-Dense[J]. Frontiers in Plant Science202112:634103.

[21]

储鑫,李祥,罗斌,基于改进YOLOv4算法的番茄叶部病害识别方法[J].江苏农业学报202339(5):1199-1208.

[22]

左昊轩,黄祺成,杨佳昊,基于改进YOLOv5s的番茄黄化曲叶病检测方法[J/OL].农业机械学报,2023-09-15 [2023-10-08].

[23]

REDMON J DIVVALA S GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 779-788.

[24]

左昊轩,黄祺成,杨佳昊,基于改进YOLO v5s的作物黄化曲叶病检测方法[J].农业机械学报202354(S1):230-238.

[25]

GUO M H XU T X LIU J J, et al. Attention mechanisms in computer vision: a survey[J]. Computational Visual Media20228(3): 331-368.

[26]

DENG J MA Y LI D, et al. Classification of breast density categories based on SE-Attention neural networks[J]. Computer Methods and Programs in Biomedicine2020193: 105489.

[27]

CHEN J MAI H S LUO L, et al. Effective feature fusion network in BIFPN for small object detection[C]//2021 IEEE International Conference on Image Processing (ICIP). IEEE, 2021: 699-703.

AI Summary AI Mindmap
PDF (1998KB)

153

访问

0

被引

详细

导航
相关文章

AI思维导图

/