改进YOLOv8的输送带损伤检测方法

袁媛 ,  白一超 ,  周利东 ,  孟文俊 ,  王淼 ,  曲文斌

中国机械工程 ›› 2025, Vol. 36 ›› Issue (12) : 2829 -2836.

PDF (3198KB)
中国机械工程 ›› 2025, Vol. 36 ›› Issue (12) : 2829 -2836. DOI: 10.3969/j.issn.1004-132X.2025.12.003
机械基础工程

改进YOLOv8的输送带损伤检测方法

作者信息 +

Conveyor Belt Damages Detection Based on Improved YOLOv8 Algorithm

Author information +
文章历史 +
PDF (3274K)

摘要

提出一种基于改进YOLOv8算法的输送带损伤检测算法:用Focal Modulation模块替换YOLOv8原有的SPPF模块;针对损伤与背景相似度高的问题,引入DySample轻量动态上采样模块,使采样点集中在目标区域而忽略背景部分,实现损伤的有效识别;在颈部网络中加入高效多尺度注意力模块来获取更多细节信息,进一步提高损伤目标的关注度。引入PIoU v2损失函数,通过计算真实框与预测框之间的重叠面积精准定位损伤,同时考虑长宽比以更好地适应不同形状损伤。实验结果表明,改进后的模型对输送带损伤检测的精确度和平均精确度均值分别达到了90.3%和93.2%,相比于基线模型YOLOv8提高了2.3%和2.5%。改进YOLOv8的检测速度达 83帧/s,可充分满足输送带损伤实时检测的需求。

Abstract

A conveyor belt damage detection algorithm was proposed based on improved YOLOv8 algorithm. Focal Modulation module was used to replace the original spatial pyramid pooling-fast(SPPF) module. In view of the high similarity between the damage and the background, a DySample dynamic up-sampling module was introduced to make the sampling points concentrate in the target areas and ignore the background parts, so as to achieve effective damage recognition. The efficient multi-scale attention(EMA) module was added to the neck network to obtain more detailed information and further improve the attention of injury targets. The PIoU v2 loss function was introduced to calculate the overlap areas between the real frame and the predicted frame, and the damage location was more accurate. Considering the aspect ratio might better adapt to the damage of different shapes. Experimental results show that the accuracy and mean average accuracy of the improved model for conveyor belt damage detection reach 90.3% and 93.2% respectively, which are 2.3% and 2.5% higher than the baseline model YOLOv8. The improved detection speed of YOLOv8 algorithm may reach 83 frames /s, which may fully meet the needs of real-time detection of conveyor belt damages.

Graphical abstract

关键词

输送带损伤 / Focal Modulation模块 / 高效多尺度注意力模块 / YOLOv8算法 / DySample模块 / PIoU v2损失函数

Key words

belt damage / Focal Modulation module / efficient multi-scale attention module / YOLOv8 algorithm / DySample module / PIoU v2 loss function

引用本文

引用格式 ▾
袁媛,白一超,周利东,孟文俊,王淼,曲文斌. 改进YOLOv8的输送带损伤检测方法[J]. 中国机械工程, 2025, 36(12): 2829-2836 DOI:10.3969/j.issn.1004-132X.2025.12.003

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

带式输送机作为现代工业物料运输的“大动脉”,广泛应用于矿山、港口、电力、冶金及化工等重工业领域。然而,在复杂工况下,输送带长期承受高负载、尖锐物料冲击、机械磨损及环境腐蚀,极易产生撕裂、表面划痕、局部破损等损伤,若这些损伤未能及时发现并处理,不仅会导致物料泄漏、设备停机等直接经济损失,还可能引发火灾、人员伤亡等严重后果1-3,因此,开发高效、准确的输送带损伤检测技术,对保障生产安全、提高设备维护效率具有重要意义4-5

近年来,随着图像处理、人工智能等先进技术的不断进步,输送带损伤检测领域迎来了全新的发展机遇。传统的损伤检测方法,如漏料检测、触发式检测、测力托辊检测等6-7虽具有结构简洁、部署便利等特性,但在物料成分混杂、工况多变的工业场景中,其检测精度与稳定性显著下降,暴露出抗干扰能力不足的固有缺陷,难以适应智能制造对高精度实时监测的严苛要求8。相比之下,基于机器视觉的在线检测技术等新兴技术,以其非接触、实时性强、检测精度高等优势,逐渐成为输送带损伤检测领域的研究热点9

WANG等10提出了一种新型视觉检测方法,称为辅助分类器光谱归一化生成对抗网络(auxiliary classifier-spectrally normalized generative adversarial network, AC-SNGAN),该方法结合了基于生成对抗网络的数据增强模块,以增强输送带表面损伤样本的特征数据库。GUO等11提出了一种基于CenterNet的输送带损伤检测方法,该方法平衡了深度神经网络的性能和规模。ZHANG等12基于改进的YOLOv3算法提出了一种可同时检测矿用输送带多个故障的新型检测方法,采用 EfficientNet 代替 Darknet53 作为骨干特征提取网络,综合考虑网络深度、宽度和图像分辨率之间的平衡进行网络缩放,以提高算法在有限计算资源下的准确性。沈景轩等13针对多源干扰环境下输送带纵向撕裂图像质量低和损伤特征信息丢失严重的问题,提出了一种图像自适应视觉检测方法——IAE(image-adaptive enhancement)-

YOLOv5。于庆等14针对输送带撕裂检测精度低、抗干扰性不足的缺陷,开发了一种多尺度特征融合检测系统,通过优化特征提取机制提高复杂环境下的识别准确性。

目前对输送带损伤检测方法的研究多数以传统机器视觉的方法对输送带的纵向撕裂进行检测评价,并不能实现对不同种类的损伤准确定位和识别,缺乏对复杂数据和场景的学习能力。为解决上述问题,本文提出一种基于改进YOLOv8的输送带损伤检测方法15,通过改进Backbone、Neck和损失函数部分来增强模型对各种损伤特征的提取能力,以实现对输送带损伤的准确检测。

1 改进YOLOv8网络

针对输送带表面损伤智能识别这一计算机视觉中的多类目标定位问题,现有主流单阶段检测方法虽具备模型轻量化与跨场景适应优势,但在高噪声工业环境中仍面临特征混淆及小尺度损伤漏检等关键瓶颈。为了构建输送带损伤检测神经网络,以YOLOv8网络为基础,对Backbone和Neck部分以及损失函数进行改进,网络结构如图1所示。①针对不同类型输送带损伤的多Scale问题和小型损伤的目标检测问题,将YOLOv8的SPPF模块升级为Focal Modulation16模块以实现对图像中关键区域的聚焦和识别能力的提升。②引入DySample17轻量动态上采样模块,通过自适应聚焦关键区域抑制背景纹理干扰,减少特征信息的损失,提高小目标的检测精度。③在颈部网络中引入高效的多尺度注意力(efficient multi-scale attention, EMA)模块18。④在Head网络中采用双机制融合的PIoU v2损失函数,通过尺寸自适应惩罚与锚框梯度优化实现精准定位。PIoU v219损失函数引导锚框沿着有效路径回归,从而实现比现有的基于CIoU的损失函数更快地收敛。PIoU v2损失函数在聚焦机制中引入了一个非单调注意层,增强了对中等质量锚框的聚焦能力。

将提出的FDEP-YOLOv8模型应用于输送带损伤检测任务,对自制数据集的评估结果表明,与原始的YOLOv8模型相比,检测准确率具有优势。

2 数据集构建

本文构建了专用输送带损伤模拟实验平台,对运行中的输送带表面实施可控损伤模拟。实验系统采用12 V电机驱动输送带运动,空载转速为100 r/min,负载转速为93 r/min,在确保动力稳定输出的同时满足安全操作规范。图像采集模块选用500万像素CCD工业相机与计算机联机,对输送带下表面损伤区域进行同步动态捕捉,最终获取498张高分辨率损伤样本图像。由于拍摄后所产生的数据量较大,不仅占用了大量存储空间,还可能导致模型训练速度的下降,因此将拍摄后的图像统一压缩成840 pixel×840 pixel的图片,方便计算机进行处理。实验照片如图2所示。

使用Make Sense在线图像标注工具对图像进行手动标注,将目标分为四类:轻微划痕,较深划痕,撕裂和破损。研究采用了如镜像翻转,左右翻转,像素亮度的变化,图像的缩放、旋转、平移,椒盐噪声和高斯噪声等技术,以增强图像的质量。损伤区域增强效果如图3实例所示。Python代码按照训练比例rtr=0.7,有效比例rva=0.15和测试比例rte=0.15的比例进行随机划分。扩充后的自建数据集包含1992张图像,其中708张为图像破损,692张为撕裂,232张为深度划痕,360张为轻微划痕。

3 实验结果与分析

3.1 实验环境与实验参数

实验使用AdamW(adaptive moment estimation with weight decay)优化器训练网络,目标种类参数n为4,迭代次数e为300,批处理大小s为8,输入图像尺寸(image)为840 pixel×840 pixel,初始动量β=0.937,配合权重衰减系数λ=5×10-4,学习率η初始化为0.01。模型训练的实验环境详见表1

3.2 评价指标与预测效果

为验证改进算法的合理性,实验选取类平均精度(PA)、精确度(P)、平均精度均值(Pma)、计算量(用GFLOPS表示,即每秒十亿次的浮点运算数)作为模型评价指标来评估改进网络的性能。改进后的模型与相似输送带损伤检测模型在平均精度均值和精确度方面的对比结果分别如图4图5所示。

改进模型在维持模型大小与计算复杂度的前提下,如图4所示展现出持续收敛的平均精度均值优势及稳定性提升。图5实测数据表明,改进模型输送带损伤检测精度达90.3%,显著优于YOLOv3-tiny等对比模型。因此,综合考虑网络性能和精确度,改进后的模型在输送带损伤检测任务上具备更优的综合性能。

改进模型与基线模型YOLOv8预测效果如图6所示。相较于原模型,改进后的模型计算量微增1.2%,对300dpi图像的推理速度达83帧/s,GPU显存占用仅2.3 GB,在NVIDIA GeForce GTX 4060Ti设备上延迟小于12 ms,同时兼容CUDA加速部署。在输送带损伤学习能力方面也有了显著提高,尤其是在处理撕裂和破损时,其识别置信度普遍高于原模型的识别置信度。此外,对较深划痕的精准识别能力也得到了增强,有效缓解了原YOLOv8模型中存在的误检问题。

3.3 对比实验

3.3.1 SPPF模块对比

在YOLOv8模型的基础上进一步对比了SPP、Focal Modulation、Basicrfb、SimSPPF模块的性能,结果见表2,其中,a表示轻微划痕,b表示较深划痕,c表示撕裂,d表示破损。

表2可知,Focal Modulation模块与SPPF模块相比,在模型计算量仅相差0.1GFLOPS的情况下,Pma提高1.7%。与SPP、SimSPPF、Basicrfb模块相比,尽管计算量分别增加0.7GFLOPS、0.7GFLOPS和0.6GFLOPS,但Pma显著增加1.0%、2.9%和0.1%。反观SPPF模块,虽然在PPma上相比SimSPPF有所提高,但相比于Focal Modulation模块仍然较低,与精度提高设计理念相悖。因此选取Focal Modulation模块作为进一步的优化方案最为合适。

3.3.2 注意力机制实验分析

为了更好地说明本文引入EMA注意力机制的优势,进行了注意力机制对比实验,在C2f层之后,Detect检测头之前,分别引入CBAM、COTA、Double attention以及EMA注意力机制模块,表3所示为注意力机制的对比实验结果。

加入注意力模块后,相比于YOLOv8模块,Pma均有效提高了,其中EMA和COTA注意力机制表现更好,Pma分别提高了1.2%和0.5%。但后者计算量增加了0.4 GFLOPS,前者没发生变化。

整体而言,EMA注意力机制具有显著的优势,加入EMA模块提高了网络对损伤目标的关注度,减少了背景中无关信息的干扰,有效提高了损伤检测精度。

3.3.3 损失函数对比

针对边界框回归与分类任务,图7呈现了PIoU v2与基准CIoU损失函数的性能对比。

图7可以看出,相比于CIoU损失函数,PIoU v2损失函数更能减少预测边界框和真实边界框之间的差距,能够对输送带上出现的损伤进行较为准确的定位,降低预测类别与实际类别之间的差异。

3.3.4 采样模块对比

为了了解动态上采样对损伤检测性能的影响,进行了一组对比实验,实验结果见图8。可以看出,对于损伤检测,采用Dysample算子的采样方式效果更好,该方法采用点采样的方法来简化上采样过程,并通过生成偏移量来指导采样位置的选择,从而实现了延迟低、参数少和计算量小的优点,大大提高了模型的召回率。

3.3.5 消融实验

FDEP-YOLOv8模型的消融研究采用迭代式增强策略:首先将主干网络SPPF模块替换为Focal Modulation模块;继而部署动态上采样算子DySample优化特征融合;随后在检测头Detect前加入EMA模块;最终使用PIoU v2损失函数来计算边界框回归的损失。在控制组参数恒定条件下实施对比实验,性能演化数据详见表4,其中a'代表EMA;b'代表PIoUv2;c'代表FocalModulation;d'代表Dysample。)

实验数据表明,四项优化策略均实现了模型性能的增益。引入EMA模块后的模型Pma值提高了1.2%,其核心在于通过多尺度特征融合增强,有效抑制了小目标在Neck结构的特征信息丢失问题。引入PIoU v2损失函数后,Pma仅较引入前提高了0.1%,但精确度提高到88.6%,其原因是PIoU v2损失函数能减少预测边界框和真实边界框之间的差距,使模型快速聚焦到不同的目标。

融入Focal Modulation后,虽然精确度相比引入PIoU v2损失函数没有变化,但总体表现仍优于原始网络,且Pma提高到93.1%。这表明Focal Modulation增强了对目标特征的识别关注度,提高了输送带损伤区分度,减少了错检、漏检,可更好地捕捉图像细节信息,从而提高模型精确度和鲁棒性。引入DySample轻量动态上采样模块则使模型的精确度提高了1.7%,说明模型通过改变上采样模块减少了特征信息的损失,提高了小目标的检测精度。

实验结果表明,通过融合4种改进策略,Pma提高了2.5%,大幅提升了模型对目标微小纹理细节的检测效果,四阶段核心模块优化形成叠加增益效应,验证了模型的合理性,在输送带损伤检测灵敏度与算法鲁棒性层面实现了双重突破。

3.3.6 相似输送带损伤检测模型对比

在采用相同配置和数据集的条件下,在YOLOv3-tiny、YOLOv5、YOLOv6、YOLOv8、YOLOv8s、YOLOv9t、YOLOv9s、YOLOv10n共8种相似输送带损伤检测模型上开展了实验并与改进模型对比,结果见表5

与YOLOv8相比,FDEP-YOLOv8在关键指标PPma上实现了2.3%与2.5%的提高,全面领先主流检测模型。相较于YOLOv9t,在计算量微幅差距下保持精度优势,仍可满足实时性检测要求。FDEP-YOLOv8算法不仅在模型的收敛速度和识别方面占优,而且其他各项性能指标均占据一定优势。

3.3.7 热力图可视化分析

为了更清晰直观地分析模型改进效果,使用Grad-CAM 热力图进行可视化分析20-21图9所示为本文FDEP-YOLOv8改进算法与YOLOv8算法的可视化热力图结果。热力图中红色越深代表关注度越高,黄色代表关注度次之,蓝色代表对图像识别的影响较小,模型视为冗余信息。由图9b可以看出:第一张和第二张图像中YOLOv8模型虽然关注到了轻微划痕和较深划痕的热度信息,但关注的有效区域范围过大。由图9c可看出:第一张图像中,FDEP-YOLOv8模型对轻微划痕进行了精准定位;第二张图像中,较深划痕得到了有效关注;第三张和第四张图像中,撕裂和破损的多个目标区域都能很好地被激活。由此可看出FDEP-YOLOv8模型更加关注目标损伤的图像特征,主要关注区域集中分布在目标损伤位置上,能够避免环境因素的影响,更加贴合目标损伤。

3.4 对比实验结果分析

对比实验验证结果表明,改进后的FDEP-YOLOv8相较于原模型在精度上展现显著优势:EMA注意力机制在不显著增加计算量的前提下,通过多尺度特征聚焦使Pma提高1.2%,优于COTA注意力机制;PIoU v2损失函数联合优化重叠面积与长宽比,推动精确度至88.6%;Focal Modulation模块以仅0.1 GFLOPS计算量为代价,Pma较SPPF提高1.7%,且较其他模块精度优势达0.1%~2.9%;DySample动态采样通过偏移量引导特征定位,使精确度较Focal Modulation提高1.7%;四模块联合优化最终使Pma提高2.5%(从90.7%升高到93.2%),验证改进策略在抑制背景干扰(EMA)、精准回归(PIoU v2)、增强特征敏感性(Focal Modulation)及减少信息损失(DySample)上的递进有效性。

3.5 输送带损伤检测系统设计

本文基于Gradio设计了一个系统,用于对输送带损伤进行检测,系统界面如图10所示。系统主要功能是选择训练好的模型,加载图片后点击检测,系统会显示出损伤类别、检测精度,并支持使用摄像头功能进行检测。

4 结论

1)提出FDEP-YOLOv8模型用于输送带损伤检测。对主干网络中SPPF模块进行改进,替换为Focal Modulation模块,以增强模型的特征提取能力;引入DySample轻量动态上采样模块,使采样点集中在目标区域而忽略输送带表面颜色的干扰,以增强算法的抗干扰能力;采用EMA模块增强模块的全局视觉信息,使模型可适应不同大小的异物目标识别;将CIoU损失函数修改为PIoU v2损失函数,增强网络对小目标损伤的识别能力。

2)实验结果表明:改进YOLOv8的精确度达90.3%,平均精度均值达93.2%,较YOLOv8分别提高了2.3%和2.5%;改进YOLOv8的精确度、平均精度均值均优于YOLOv3-tiny、YOLOv5、YOLOv6、YOLOv8、YOLOv8s、YOLOv9t、YOLOv9s、YOLOv10n等主流目标检测算法。

3)FDEP-YOLOv8模型实现了输送带隐患快速精准定位,检测效率与准确性双提高,未来可通过扩充多工况样本库,构建智能监测系统来强化预警能力。

参考文献

[1]

张梦超,周满山,张媛,.基于深度学习的矿用输送带损伤检测方法[J].工矿自动化202147(6):51-56.

[2]

ZHANG MengchaoZHOU ManshanZHANG Yuanet al.Damage Detection Method for Mine Conveyor Belt Based on Deep Learning[J].Journal of Mine Automation202147(6):51-56.

[3]

胡璟皓,高妍,张红娟,.基于深度学习的带式输送机非煤异物识别方法[J].工矿自动化202147(6):57-62.

[4]

HU JinghaoGAO YanZHANG Hongjuanet al.Research on the Identification Method of Non-coal Foreign Object of Belt Conveyor Based on Deep Learning[J].Journal of Mine Automation202147(6):57-62.

[5]

ALVIARI L PANGGAMAWARTI M FSANJIWANI Yet al. Classification of Impact Damage on a Rubber-textile Conveyor Belt: a Review[J]. International Journal of Mechanical Engineering Technologies and Applications20201(1): 21-27.

[6]

GUO XLIU XZHOU Het al. Belt Tear Detection for Coal Mining Conveyors[J]. Micromachines202213(3): 449.

[7]

KOZLOWSKI TWODECKI JZIMROZ Ret al. A Diagnostics of Conveyor Belt Splices[J]. Applied Sciences202010(18): 6259.

[8]

熊念强,文锋,李清,.带式输送机胶带撕裂检测技术综述[J].煤炭工程202254(7):79-85.

[9]

XIONG NianqiangWEN FengLI Qinget al.Review on Detection Technology of Conveyor Belt Rip[J]. Coal Engineering202254(7):79-85.

[10]

王以娜.基于视觉检测的皮带纵向撕裂检测关键技术研究[D]. 鞍山:辽宁科技大学,2020.

[11]

WANG Yina,Research on Key Technology of Belt Longitudinal Tear Detection Based on Visual Inspection[D].Anshan:University of Science and Technology Liaoning,2020.

[12]

陈希阳,李佳楠,张翼,.基于神经网络的难选夹层磷矿石预分选理论研究[J].有色金属(选矿部分)2023 (6):125-131.

[13]

CHEN XiyangLI JiananZHANG Yiet al.Theoretical Study on Pre-separation of Phosphate Ore with Refractory Interlayer Based on Neural Network[J].Nonferrous Metals(Mineral Processing Section)2023 (6):125-131.

[14]

樊红卫,刘金鹏,曹现刚,.低照度尘雾下煤、异物及输送带早期损伤多尺度目标智能检测方法[J].煤炭学报202449 ():1259-1270.

[15]

FAN HongweiLIU JinpengCAO Xianganget al.Multi-scale Target Intelligent Detection Method for Coal,Foreign Object and Early Damage of Conveyor Belt Surface under Low Illumination and Dust Fog[J].Journal of China Coal Society202449 (S2):1259-1270.

[16]

WANG GYANG ZSUN Het al. AC-SNGAN: Multi-class Data Augmentation for Damage Detection of Conveyor Belt Surface Using Improved ACGAN[J]. Measurement2024224: 113814.

[17]

GUO XLIU XGARDONI Pet al. Machine Vision Based Damage Detection for Conveyor Belt Safety Using Fusion Knowledge Distillation[J]. Alexandria Engineering Journal202371: 161-172.

[18]

ZHANG MSHI HZHANG Yet al. Deep Learning-based Damage Detection of Mining Conveyor Belt[J]. Measurement2021175: 109130.

[19]

沈景轩,王贡献,孙晖,.基于图像自适应增强YOLOv5的输送带纵向撕裂检测[J].仪表技术与传感器2023(12):69-74.

[20]

SHEN JingxuanWANG GongxianSUN Huiet al.Longitudinal Tear Detection Based on Image-adaptive Enhancement YOLOv5 for Conveyor Belt[J].Instrument Technique and Sensor2023(12):69-74.

[21]

于庆,罗明华,向亮,.基于改进YOLOv5的矿用输送带纵向撕裂检测方法[J].矿业安全与环保202451(4):1-8.

[22]

YU QingLUO MinghuaXINAG Lianget al.Longitudinal Tear Detection Method of Mine Conveyor Belt Based on Improved YOLOv5[J].Mining Safety & Environmental Protection202451(4):1-8.

[23]

洪炎,汪磊,苏静明,.基于改进YOLOv8的煤矿输送带异物检测[J].工矿自动化202450(6):61-69.

[24]

HONG YanWANG LeiSU Jingminget al.Foreign Object Detection of Coal Mine Conveyor Belt Based on Improved YOLOv8[J].Journal of Mine Automation202450(6):61-69.

[25]

YANG JLI CDAI Xet al. Focal Modulation Networks[J]. Advances in Neural Information Processing Systems202235: 4203-4217.

[26]

LIU WLU HFU Het al. Learning to Upsample by Learning to Sample[C]∥Proceedings of the IEEE/CVF International Conference on Computer Vision. Paris :2023: 6027-6037.

[27]

OUYANG DHE SZHANG Get al. Efficient Multi-scale Attention Module with Cross-spatial Learning[C]∥ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).Greece: IEEE, 2023: 1-5.

[28]

LIU CWANG KLI Qet al. Powerful-IoU: More Straightforward and Faster Bounding Box Regression Loss with a Nonmonotonic Focusing Mechanism[J]. Neural Networks2024170: 276-284.

[29]

陈腾杰,李永安,张之好,.基于改进YOLOv8n+DeepSORT的带式输送机异物检测及计数方法[J].工矿自动化202450(8):91-98.

[30]

CHEN TengjieLI YonganZHANG Zhihaoet al. Foreign Object Detection and Counting Method for Belt Conveyor Based on Improved YOLOv8n+DeepSORT[J].Journal of Mine Automation202450(8):91-98.

[31]

SELVARAJU R RCOGSWELL M, DAS A, et al. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization[J]. International Journal of Computer Vision2020128: 336-359.

基金资助

国家自然科学基金(52075356)

山西省科技成果转化引导专项(202204021301060)

AI Summary AI Mindmap
PDF (3198KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/