基于YOLOV8的高磁铁矿输送带异物检测技术研究

张紫欣 ,  涂福泉 ,  陈向东 ,  高路萍 ,  王涛 ,  白云

黄金科学技术 ›› 2025, Vol. 33 ›› Issue (01) : 193 -201.

PDF (5181KB)
黄金科学技术 ›› 2025, Vol. 33 ›› Issue (01) : 193 -201. DOI: 10.11872/j.issn.1005-2518.2025.01.214
采选技术与矿山管理

基于YOLOV8的高磁铁矿输送带异物检测技术研究

作者信息 +

A Foreign Object Detection Technology in High Magnetic Ore Conveyor Belt Based on YOLOV8

Author information +
文章历史 +
PDF (5304K)

摘要

在矿山复杂环境中,高磁性矿输送带异物检测面临场景干扰严重、识别难度大的挑战,针对高磁性矿中异物边缘信息易丢失和实时响应难度大的问题,提出了基于YOLOV8的深度学习图像检测方法。首先,建立输送带异物数据集,采用暗通道去雾技术对数据进行预处理,提升图像清晰度;然后,结合YOLOV8的网络特性,引入动态注意力机制,并用蛇形卷积代替普通卷积,允许模型在处理输入数据时动态地分配注意力,同时捕捉到更广泛的局部和全局特征;最后,改进动态检测头来灵活适配多尺度和多方向的检测需求,以提升模型的适应性并降低参数计算量。试验结果表明:基于YOLOV8的异物检测模型平均检测准确率达到96.4%,召回率为91%,平均检测时间仅为29 ms,完全满足矿山皮带运输现场对精准检测和实时性的要求。

Abstract

In the intricate setting of mining operations,identifying foreign objects on conveyor belts transporting high-magnetic ore is hindered by significant scene interference and substantial recognition challenges.To address the issues of frequent loss of foreign object edge information and the considerable difficulty in achieving real-time,high-speed responses in high-magnetic environments,we propose an image recognition and detection methodology grounded in deep learning techniques.Initially,a dataset of foreign objects on conveyor belts is constructed.To address the issue of image blurring,which arises from the high-speed operation of the belt conveyor and the limited data acquisition frequency of industrial cameras,the dark channel defogging technique is employed to preprocess the data,thereby enhancing image clarity.Subsequently,the core architecture of YOLOV8 is refined by incorporating a dynamic attention mechanism and substituting standard convolution with snake convolution.The dynamic attention mechanism enables the model to dynamically allocate focus during input data processing.Concurrently,the integration of snake convolution in place of traditional convolution,in conjunction with C2f,significantly enhances the model’s capacity to process image details.This unique structure facilitates the capture of a broader spectrum of local and global features,thereby substantially reducing the model’s rates of false positives and missed detections concerning buried foreign objects.In conclusion,the YOLOV8 architecture has been enhanced through the integration of a dynamic detection head,which allows for flexible adaptation to multi-scale and multi-directional detection requirements.This modification aims to improve the model’s adaptability and optimize the reduction of computational parameters,thereby significantly enhancing its real-time performance in complex environments.Experimental results demonstrate that the model achieves an average detection accuracy of 96.4%,a recall rate of 91%,and an average detection time of merely 29 milliseconds.The algorithm presented in this paper de-monstrates an enhancement in average detection accuracy and recall by 5.2% and 6.2%,respectively,compared to the original network,thereby confirming its efficacy.This improved algorithm adequately satisfies the demands for precise detection and real-time performance in the context of mine belt transportation,offering substantial support for advancing mine safety management and operational efficiency.

Graphical abstract

关键词

异物检测 / 磁性矿输送带 / 动态监测 / YOLOV8 / 图像去雾 / 蛇形卷积

Key words

foreign object detection / conveyor belts for magnetic ore / dynamic monitoring / YOLOV8 / image dehazing / DySnakeConv

引用本文

引用格式 ▾
张紫欣,涂福泉,陈向东,高路萍,王涛,白云. 基于YOLOV8的高磁铁矿输送带异物检测技术研究[J]. 黄金科学技术, 2025, 33(01): 193-201 DOI:10.11872/j.issn.1005-2518.2025.01.214

登录浏览全文

4963

注册一个新账户 忘记密码

矿业生产涵盖了勘探、开采、破碎与筛选、球磨和浮选等多个步骤,其中皮带运输是不可或缺的环节。传统检测方法难以在高速运转的生产线上对异物作出实时响应,导致设备频繁损坏和生产效率下降(Sotoudeh et al.,2020Luo et al.,2023韩跃新等,2024)。因此,及时、准确地发现和处理输送带上的异物至关重要(Dai et al.,2023)。特别是在破碎前的矿石中,异物的夹带现象尤为突出,这些异物不仅数量大,而且具有材质多样、尺寸差异巨大、空间位置快速变化和形状复杂等特征,导致识别难度大。此外,处理高磁性矿石与异物时,矿石与异物之间的物理相似性增加了误判风险,可能导致设备损坏并进一步加剧安全隐患。
异物识别领域的各类检测技术主要包括图像检测(王伟等,2023)、红外检测(Eshaq et al.,2020阮顺领等,2023)和三维激光扫描检测(Wang et al.,2017)。传统检测技术在泛化性和稳定性方面存在一定的局限,不适合复杂矿山环境的检测需求。随着深度学习的持续发展,图像检测技术凭借检测精度高和处理速度快等优点在异物识别领域得到了广泛应用。例如:任志玲等(2023)提出的基于CenterNet的算法有效降低了目标的误检率和漏检率。Dong et al.(2023)针对部分遮挡和因粉尘干扰难以识别的异物提出的GECA关注模块和重新启动余弦退火技术增强了异物特征提取能力。Zhang et al.(2022)设计的基于Mobilenet的轻量级异物检测框架显著减少了计算量和参数数量,降低了模型的复杂度。程德强等(2022)提出的融合残差信息的网络增强了模型的特征表现力和泛化性。顾清华等(2024)针对露天矿区场景的复杂情况,提出使用GSConv轻量级卷积模块,实现了精度与速度之间的平衡。
虽然现有检测方法在一般环境下表现优异,但在高磁铁矿输送带的复杂环境中,仍存在边缘信息丢失和实时响应不足的问题。为解决这些问题,本文提出了一种基于改进的YOLOV8动态网络结构的高磁铁矿异物识别算法。该算法具有去雾去模糊的特点,通过暗通道提高了图像清晰度,增强了外来物体的轮廓特征,并从网络结构出发,针对异物目标背景复杂且受矿石干扰的问题,结合动态稀疏性提出动态注意力机制,与传统注意力机制不同,该机制允许网络在每次前向传播中动态调整注意力,以适应不同场景下的目标检测需求;为进一步减少检测头模型的参数,通过参数共享和复用,将尺度感知、空间感知和任务感知统一在一起;通过对传统卷积层的优化,结合增强了特征提取能力的DySnakeConv扩展模型的感知范围,动态感知异物的关键特征。

1 数据集构建

1.1 数据采集

为构建用于异物检测的数据集,在某铁矿现场从皮带上方实时采集了681张分辨率为2 560像素 ×1 440像素的异物图像。由于现场数据集中异物图像数量较少,本文采用6种数据增强技术,包括裁剪、镜像翻转、改变亮度、添加噪声、旋转和平移,以扩充数据集并提升模型的泛化性(Liu et al.,2022Yang et al.,2023)。经过数据增强处理后,数据集的图像数量从初始的681张扩充到最终的4 915张。

为了精确评估所提出算法的效果,建立了包括摄像头、计算机、皮带、控制开关和电源在内的输送带异物检测系统,如图1所示。

1.2 数据增强及去雾处理

现场皮带通廊为封闭空间,空气流通有限,在此环境下,皮带运行会产生粉尘,导致拍摄的照片出现模糊或飘散的效果(Chen et al.,2022)。此外,环境深处缺乏自然光,使得拍摄的图像显得昏暗或阴暗。因此,需要进行去雾和去模糊处理,以提升图像的清晰度,从而增强数据识别和分析准确性。

去雾算法通常包括以下步骤:暗通道先验估计、透射率估计、大气光估计、去雾处理和后处理(Xu et al.,2023)。暗通道先验是指利用图像的局部暗区域来估计透射率和大气光,通过选择图像中最亮的像素来估计没有遮挡的光源。然后,根据估计的透射率和大气光对图像进行去雾处理,逐像素地修改图像以减少或消除由粉尘引起的光照衰减效果。去雾效果如图2所示,其中红框代表异物,黑框代表矿石背景。

1.3 数据划分

通过数据采集、预处理和增强操作,成功构建用于矿带异物检测的数据集。将该数据集按照8∶1∶1的比例随机划分为训练集、验证集和测试集(Zhang et al.,2022),以确保在模型训练过程中充分提供数据支持,并在独立的验证和测试集上评估模型的性能和泛化能力。

2 算法改进

2.1 总体算法框架

尽管YOLOV8继承了YOLO系列的优势,但在特殊场景和特殊情况下其检测效果仍然不理想。具体有2个方面的问题:

(1)在光照、阴影和灰尘等复杂环境条件下,异物与矿石重叠且边缘信息易丢失,从而降低了检测的准确性。

(2)在未经优化的情况下,皮带高速运行使得异物检测常常面临实时性挑战,可能导致响应延迟和处理速度不足,影响系统对快速移动的异物或隐蔽异物的及时检测能力。

为了应对这些问题,对YOLOV8的结构进行改进,改进后的部分在图3中以红色虚线框表示。

2.2 主干部分引入动态稀疏注意力

注意力机制能够有效捕获全局和局部的关联性,通过计算和强调基础图像特征,减少在目标小或存在严重遮挡的场景下的特征损失,从而显著提升网络性能(Zhu et al.,2023)。然而,引入注意力机制可能会增加内存消耗和计算开销等问题。因此,本研究结合动态稀疏性提出了一种轻量级且高效的注意机制来应对这些挑战。

图4所示,在主干部分引入注意力模块,首先使用3×3深度卷积对相应位置信息进行隐式编码。随后,应用两层路由注意力模块对跨位置关系进行建模,并通过多层感知器(MLP)模块实现全位置嵌入。

动态稀疏特性是通过两层路由注意力来实现的,动态路由模块采用可学习的权重来调整特征之间的关系。首先,输入数据的特征通过一个或多个卷积层,得到高维特征表示。然后,通过动态路由模块,对这些高维特征进行调整,以确定每个特征图位置的重要性。最后,得到调整后的特征表示,用于目标检测任务的后续处理。

2.3 重构检测头以减少计算量

检测头部分在YOLOV8中负责实现目标检测的核心功能,其设计和性能直接影响着模型的检测效果和计算效率(Dai et al.,2021)。因此,通过优化和改进检测头的设计,能够有效地降低模型的计算负担,提升检测的精度和效率。本文提出的动态头DyHead网络结构可以在不同的输入尺寸和目标尺寸下动态地选择不同的检测头,以适应不同的场景和尺度的目标检测任务。如图5所示,从3个维度将尺度感知、空间感知和任务感知统一在一起。

2.4 集成DySnakeConv模块到C2f模块中

由于异物的种类和结构错综复杂,变化多端,相同的种类在不同的场景下可能会表现出不同的特征。因此,异物识别的根本在于关键特征提取(Qi et al.,2023),如图6所示的动态蛇形卷积,赋予卷积核更多灵活性,使其能够聚焦于目标的复杂几何特征,依次选择每个要处理的目标的下一个位置进行观察,从而确保关注的连续性,不会由于大的变形偏移而将感知范围扩散得太远。

3 试验内容

3.1 试验准备

在目标检测任务中,通常使用精度(P)、召回率(R)、平均精度(AP)、平均精度均值(MAP)和每秒帧率(FPS)等指标来评估算法的分类性能。各评价指标的计算公式如下:

P=TPTP+FP
R=TPTP+FN
AP=ν1pRdR
MAP=1nΣAP
parameters=k2×Cin×Cout

式中:TP为实际阳性样本的数量;FP为错误识别的阳性样本的数量;FN为正确识别的阴性样本的数量;parameters为参数量。MAP通常是通过计算每个类的Precision-Recall曲线(PR曲线),然后对所有类的曲线下面积(AUC)取平均值来获得的。

为了验证本文提出的算法,进行了相关的试验研究。试验平台配置见表1

3.2 试验结果分析

模型中对空间复杂度的评价是基于参数的数量,而对时间复杂度的评价是基于计算量。本试验对SSD、YOLOV5、YOLOV8、YOLOV10这4类模型进行检测对比,由表2可知,YOLOV8网络模型在帧率、参数量和计算量方面均优于SSD、YOLOV5和YOLOV10模型。其中,YOLOV8网络模型的帧率达到527.2帧/s(FPS),超过了其他3类模型,在同一设备上执行时表现出更高的速度。因此,本研究的重点是在这些发现的基础上对YOLOV8模型进行改进。

为评估本文模型的有效性,对不同卷积网络模型进行对比。由图7表3可知,在识别准确率方面,各算法中YOLOV8系列明显高于其他算法。而在YOLOV8系列中,YOLOV8n的参数量为30.0623 MB,计算效率为8.1 GB,与YOLOV8s、YOLOV8m、YOLOV8l和YOLOV8x相比较低,表明YOLOV8n在模型大小和计算资源需求方面更高效,故以下试验均基于YOLOV8n进行。而本文模型的检测精度(mAP50:96.4%)相较于其他模型均有提升。如图7所示,与各种轻量级卷积网络相比,本文模型仍然表现出更高的检测精度、更低的参数量和网络复杂度。

3.3 消融试验

本研究中模型的输入尺寸为640像素×640像素。在训练时,将批处理的大小设置为32,Epochs设置为300。为了验证该模型的性能,本文使用YOLOV8算法及其改进算法对异物数据集进行训练。

YOLOV8改进前后损失函数曲线对比如图8所示,YOLOV8改进不同模块的检测性能结果如表4所示。本研究数据集中的异物主要划分为锚杆、胶管和大块3类,其中A代表动态稀疏注意力模块,B代表动态检测头模块,C代表动态蛇形卷积模块,最终本文模型的召回率达到91%,在阈值为0.50的情况下,平均准确率均值达到96.4%。此外,在0.50~0.75的阈值范围内,平均准确率均值为77.2%,表现出较好的检测效果。

综上所述,对于矿带(高磁铁矿输送带)异物检测任务,本文模型在各项指标上效果最好,将MAP@0.5和矿带异物检测任务的召回率分别提高了5.2%和6.2%,且由于动态检测头的加入而增加的参数数量较小。从试验结果来看,本文模型有效提高了异物检测性能。

异物识别面临的重要挑战之一是异物与矿石重叠且边缘信息易丢失,从而引发误检和漏检问题。将算法应用于矿山异物检测现场,结果如图9所示,其中第一、二、三、四列分别为原图[图9(a)~9(c)]、YOLOV5[图9(d)~9(f)]、YOLOV8[图9(g)~9(i)]和本文模型[图9(j)~9(l)]的识别结果。其中,图9(d)和图9(g)分别为YOLOV5和YOLOV8的识别结果,这2个模型都将一端被掩埋的锚杆误识别为胶管;图9(b)中塑料袋被埋于矿石下只露出边缘部分未能被有效识别;图9(c)中异物与背景颜色相似导致识别精度不高。在应用试验改进的算法之后,由于加入了动态稀疏注意力,可以更充分地融合图像上层的语义信息和底层的轮廓和形状信息,此外,检测头通过降低参数量从而提高了实时性,图像预处理和蛇形卷积使得目标的外来目标特征更加突出,更容易被识别,从而更好地解决了由于目标的遮蔽而导致的漏检或误检的问题。

4 结语

针对高磁铁矿输送带异物检测困难的问题,本文结合YOLOV8设计了一种异物检测模型。采用图像去雾优化方法对数据集进行预处理,得到清晰的图像。改进后的网络模型通过动态检测头来减少参数的数量,在特征层之后嵌入动态稀疏注意模块增强对网络特征的提取,并提出蛇形动态卷积代替3×3普通卷积,优化了模型,提高了检测速度。同一试验环境下多个模型的对比试验表明,本文模型显著提高了检测速度和精度,对于掩埋异物的识别能力较强,能够满足实时工况下的异物检测要求。尽管本研究在异物检测领域取得了一定的成果,但目前的技术仍然面临外界因素和图像噪声的挑战。为此,未来工作将继续探索新的网络结构和数据融合方法,旨在进一步提升检测的效率和准确性。

参考文献

[1]

Chen YSun XXu L,et al,2022.Application of YOLOv4 algorithm for foreign object detection on a belt conveyor in a low-illumination environment[J].Sensors22(18):6851.

[2]

Cheng DeqiangXu JinyangKou Qiqi,et al,2022.Lightweight network based on residual information for foreign body classification on coal conveyor belt[J].Journal of China Coal Society47(3):1361-1369.

[3]

Dai LZhang XGardoni P,et al,2023.A new machine vision detection method for identifying and screening out various large foreign objects on coal belt conveyor lines[J].Complex and Intelligent Systems9(5):5221-5234.

[4]

Dai X YChen Y PXiao B,et al,2021.Dynamic head:Unifying object detection heads with attentions[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).Piscataway,NJ:IEEE.

[5]

Dong XPanpan LJichun W,et al,2023.Mining belt foreign body detection method based on YOLOv4_GECA model[J].Scientific Reports13(1):8881-8881.

[6]

Eshaq R M AHu ELi M,et al,2020.Separation between coal and gangue based on infrared radiation and visual extraction of the YCbCr color space[J].IEEE Access,8:55204-55220.

[7]

Gu QinghuaZhou QiongWang Dan2024.Traveling obstacle detection in open-pit mine area based on improved YOLOv8[J].Gold Science and Technology32(2):345-355.

[8]

Han YuexinZhang XiaolongGao Peng,et al,2024.Development and prospect of iron ore processing technologies in China[J].Metal Mine53(2):1-24.

[9]

Liu XPedersen MWang R2022.Survey of natural image enhancement techniques:Classification,evaluation,challenges,and perspectives[J].Digital Signal Processing,127:103547.

[10]

Luo BKou ZHan C,et al,2023.A “hardware-friendly”foreign object identification method for belt conveyors based on improved YOLOv8[J].Applied Sciences13(20):11464.

[11]

Qi YHe YQi X,et al,2023.Dynamic snake convolution based on topological geometric constraints for tubular structure segmentation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision and Pattern Recognition(CVPR).Piscataway,NJ:IEEE.

[12]

Ren ZhilingZhu Yancun2023.Research on foreign object detection of coal mine belt transportation with improved centernet algorithm[J].Control Engineering of China30(4):703-711.

[13]

Ruan ShunlingRuan YankangLu Caiwu,et al,2023.Detection of ore conveyer roller based on infrared image[J].Gold Science and Technology31(1):123-132.

[14]

Sotoudeh FNehring MKizil M,et al,2020.Production scheduling optimisation for sublevel stoping mines using mathematical programming:A review of literature and future directions[J].Resources Policy,68:101809.

[15]

Wang WZhang C2017.Separating coal and gangue using three-dimensional laser scanning[J].International Journal of Mineral Processing,169:79-84.

[16]

Wang WeiLi QingZhang Dezheng,et al,2023.A survey of ore image processing based on deep learning[J].Chinese Journal of Engineering45(4):621-631.

[17]

Xu Y JZhang H ZHe F L,et al,2023.Enhanced cycleGAN network with adaptive dark channel prior for unpaired single-image dehazing[J].Entropy25(6):856.

[18]

Yang YXu WHuang S,et al,2023.PEN-DS:Progressive enhancement network based on detail supplementation for low-light image enhancement[J].International Journal of Machine Learning and Cybernetics,15:2383-2398.

[19]

Zhang MCao YJiang K,et al,2022.Proactive measures to prevent conveyor belt failures:Deep learning-based faster foreign object detection[J].Engineering Failure Analysis,141:106653.

[20]

Zhu LWang XKe Z,et al,2023.Biformer:Vision transformer with bi-level routing attention[C]//Proceedings of the IEEE/CVF Conference On Computer Vision and Pattern Recognition(CVPR).Piscataway,NJ:IEEE.

[21]

程德强,徐进洋,寇旗旗,等,2022.融合残差信息轻量级网络的运煤皮带异物分类[J].煤炭学报47(3):1361-1369.

[22]

顾清华,周琼,王丹,2024.基于改进YOLOv8的露天矿区行车障碍物检测[J].黄金科学技术32(2):345-355.

[23]

韩跃新,张小龙,高鹏,等,2024.中国铁矿石选矿技术发展与展望[J].金属矿山53(2):1-24.

[24]

任志玲,朱彦存,2023.改进CenterNet算法的煤矿皮带运输异物识别研究[J].控制工程30(4):703-711.

[25]

阮顺领,阮炎康,卢才武,等,2023.基于红外图像的矿石传送带托辊异常检测[J].黄金科学技术31(1):123-132.

[26]

王伟,李擎,张德政,等,2023.基于深度学习的矿石图像处理研究综述[J].工程科学学报45(4):621-631.

基金资助

国家自然科学基金项目“航天用纳米颗粒多相流泵送机理及其分散均匀性主动调控研究”(52375061)

AI Summary AI Mindmap
PDF (5181KB)

518

访问

0

被引

详细

导航
相关文章

AI思维导图

/