基于改进型YOLOv8的木材缺陷检测及分类

刘振 ,  张澎涛 ,  管雪梅 ,  于帅 ,  张宪奇

森林工程 ›› 2025, Vol. 41 ›› Issue (04) : 761 -776.

PDF (6601KB)
森林工程 ›› 2025, Vol. 41 ›› Issue (04) : 761 -776. DOI: 10.7525/j.issn.1006-8023.2025.04.011
木材科学与工程

基于改进型YOLOv8的木材缺陷检测及分类

作者信息 +

Wood Defect Detection and Classification Based on Improved YOLOv8

Author information +
文章历史 +
PDF (6759K)

摘要

针对木材加工业自动化生产场景中传统缺陷检测方法适应性不足的瓶颈问题,开展基于深度学习的智能检测技术研究,构建涵盖多树种特征及典型缺陷类型的数据集。将目标检测技术用于缺陷检测,利用膨胀感知残差(dilation wise residual,DWR)模块优化C2f模块,并提出任务对齐动态检测头(task aligned dynamic detection head,TADDH)和特征聚焦扩散金字塔网络(focusing spread pyramid network,FSPN),用于改进YOLOv8算法(DFT-YOLO)。试验结果显示,经过改进的模型在精度上取得显著提升,达到了96.8%,相较于原始模型提高7.9%;在关键评价指标平均精度mAP50和mAP50-95上,改进后的模型分别达到93.8%和75.2%,分别提高了6.8%和17.5%;在提高检测精度的同时,模型的参数量减少了约1/6 (16.2%)。改进的模型能够为木材缺陷的检测提供一种轻量化的检测方法。

Abstract

Aiming at the bottleneck problem of insufficient adaptability of traditional defect detection methods in automated wood processing industry, research on intelligent detection technology based on deep learning is carried out, and a dataset covering multi-species wood characteristics and typical defect types is proposed. Applying object detection technology to defect detection, using dilation wise residual (DWR) module to optimize C2f module, and proposing task aligned dynamic detection head (TADDH) and feature focusing spread pyramid network (FSPN) to impove YOLOv8 algorithm (DFT-YOLO). The experimental results showed that a significant improvement in accuracy, reaching 96.8%, which was 7.9 higher than the original model. On the average accuracy of the key evaluation indicators mAP50 and mAP50-95, the impoved model reached 93.8% and 75.2%, respectively, increasing by 6.8% and 17.5%, respectively. While improving the detection accuracy, the number of parameters of the model had decreased by approximately 1/6 (16.2%). The impoved model can provide a lightweight detection method for wood defects.

Graphical abstract

关键词

木材缺陷 / 目标检测 / 深度学习 / YOLOv8 / 特征提取 / 多尺度融合 / 算法优化 / 智能识别

Key words

Wood defect / target detection / deep learning / YOLOv8 / feature extraction / multi-scale feature integration / computational optimization / intelligent recognition

引用本文

引用格式 ▾
刘振,张澎涛,管雪梅,于帅,张宪奇. 基于改进型YOLOv8的木材缺陷检测及分类[J]. 森林工程, 2025, 41(04): 761-776 DOI:10.7525/j.issn.1006-8023.2025.04.011

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

中国作为全球木材消费的重要市场,面临环保政策日益严格和公众环保意识提升的双重挑战。木材加工行业正通过技术革新与产品设计,推动人造板、复合材料及高附加值木质产品的多样化发展。然而,木材在生长、加工及运输过程中常出现节疤、裂缝和树脂等缺陷1。这些缺陷显著降低了木材的品质与利用率,导致综合利用率仅维持在50%~70%,资源浪费严重2。因此,有效检测与分类木材缺陷对保障木材质量和资源利用率至关重要。

传统的人工检测方法主观性强、耗时耗力,准确率普遍低于70%3。研究显示,人为错误在木材缺陷检测中造成的浪费高达22%,这使得总产量从63.8%骤降至47.4%。木材潜能未能得到充分释放,综合利用效率低下4。因此,木材加工业正通过技术创新克服传统检测方法的局限性,实现机械化与自动化转型。

面对木材缺陷的传统检测难题,现代科技引入了一系列创新解决方案。超声波检测技术便是其中之一,该检测技术运用了超声波在木材中反射和衰减的物理特性来识别缺陷。研究表明,木材中的缺陷(如节疤)会引起周围纤维的偏离,进而影响声波传播速度,通过对观测到的膨胀特性分析,可以有效地判断内部缺陷的存在5。此外,基于X射线的检测技术通过分析射线在木材中的不同衰减模式来揭示内部缺陷,尽管该技术能够提供较为准确的检测结果,但其潜在的健康风险限制了广泛的应用6。另一方面,应力波技术作为一种新兴的无损评估手段,通过测量应力波在木材中的传播速度来评估机械性能,该方法利用轴向波、横向波和表面波的传播特性,实现无损检测。然而,应力波技术对环境控制要求较高,限制了应力波技术的普及7。尽管上述的方法各自呈现出优势,但这些技术的局限性和特定的应用条件制约了其广泛的工业应用。

近年来,人工智能技术在木材缺陷检测领域的应用日益增长。传统的机器学习方法通过人工选择特征子集来提升模型性能。特征提取是关键步骤,涉及对图像进行维度化处理,以精简数据和防止过拟合增强检测准确性。目前,一系列先进的机器学习技术已被应用于木材表面缺陷的自动化检测,其中包括BP(back propagation)神经网络8、灰度共现矩阵(gray-level co-occurrence matrix,GLCM)9和改进型测地线活动轮廓模型(geodesic active contour,GAC)10。这些算法不仅简化了检测流程,减少了人工干预的需求,还提高了检测效率和准确性。尽管这些方法展示了强大的潜力,但仍存在计算复杂度高、对噪声敏感、参数选择困难以及泛化能力有限等缺点。随着深度学习技术的发展,传统方法的局限性逐渐显现。深度学习方法具有高效性、精确性和较强的鲁棒性,其逐渐成为木材缺陷检测领域的主流技术。

随着深度学习的飞速进步,深度学习已成为木材缺陷检测领域的一个革命性工具,提供了比传统方法更为高效和精确的解决方案。特别是在目标检测领域,单级算法11-14和双级算法15-17的发展显著提升了检测的速度和准确性,使得完全自动化的木材缺陷检测成为现实。相较于传统方法,基于深度学习的算法能够应对复杂背景下的多种缺陷识别,同时避免了直接接触材料的风险,保障了操作人员的安全。将单级目标检测算法用于木材缺陷检测的研究中,Ding等18结合密集卷积网络(DenseNet)与单次多框检测器(single shot multibox detecto,SSD)算法,增强了活节、死节和裂缝的检测能力,尽管活节检测精度达到90%,但检测类型较为有限。Kurdthongmee等19的研究则专注于木材茎干横截面髓部的定位,实现了高达76.3%的准确率,但应用场景较为单一。Wang 等20通过优化YOLOv7算法,引入了动态收缩和全维动态坐标关注机制,成功应用于公共数据集中的木材缺陷检测。Wang等21则通过替换YOLOv3的残余块并改良损失函数,尽管模型复杂度较高,但实现了在线监测。江兴旺等22通过在YOLOv7中嵌入增强通道-空间注意力模块(ECBAM模块),并引入稀疏特征金字塔网络(SFPN网络)以提高对小目标缺陷(如死结和活结)的检测效果,随后,通过将损失函数替换为SIoU,取得了较为成功的检测结果。Wang等23则通过替换YOLOv7骨干网络的部分卷积层,引入Biformer注意力机制,并将损失函数替换为归一化Wasserstein距离损失函数(normalized wasserstein distance,NWD),使得平均精度均值(mean average precision,mAP)相对于原始算法提高了7.4%。然而,这2种方法的模型复杂度均较高。An等24则在YOLOv8n中引入了条件参数卷积(CondConv)和双向层次路由注意力(Biformer),并将损失函数替换为动态聚焦交并比损失函数(Wise-IoU),这种方法在mAP50和mAP50-95指标上相较于YOLOv8算法分别提高了3.5%和5.8%。这些研究虽各有侧重,但均揭示了深度学习在木材缺陷检测中的巨大潜力。然而,模型参数过多和处理时间较长的问题限制了其在实际设备中的部署效率。例如,较大的模型参数量可能导致存储需求增加,而较长的处理时间可能无法满足实时检测的要求。

在木材缺陷检测领域,深度学习技术的应用已经从最初的探索阶段发展到了实际应用的成熟阶段。这一转变得益于深度学习算法在处理复杂模式识别任务上的卓越能力,尤其是在目标检测方面。双级目标检测算法,如R-CNN25、Faster R-CNN和Mask R-CNN26,虽然能够提供较高的检测精度,但这些算法通常伴随着模型复杂度高和处理时间长的缺点,这限制了其在工业实时监控场景中的应用。相比之下,单级目标检测算法,如SSD和YOLO系列27-31,因其较低的模型复杂度和更高的实时性,更符合工业制造场景的需求。

鉴于单级目标检测算法在实时性和模型复杂度方面的优势,其成为了工业应用场景中的首选。特别是在木材缺陷检测这一复杂任务中,单级算法因其快速响应和较低的计算资源需求,显得尤为关键。在众多单级算法中,YOLOv8因其先进的架构设计和优化策略,展现出了超越其他方法的潜力,尤其是在处理木材缺陷这类复杂特征时。因此,本研究选择YOLOv8检测框架作为基准。尽管YOLOv8在一般目标检测任务中表现出色,但在木材缺陷检测这一特定领域,仍面临着一定的挑战。YOLO系列算法在设计上更侧重于深层特征的学习,这可能导致在捕捉木材表面细微缺陷及多尺度特征时出现准确性不足的问题。这些细微缺陷往往需要对图像中的浅层特征和丰富的上下文信息有更精细的理解,而这正是YOLO算法相对薄弱的环节。

针对这些挑战,本研究的主要工作内容为:首先,整合了来自奥卢大学和捷克奥斯特拉发技术大学的公共数据集32,并针对单一缺陷的数据集不足问题提出了解决方案,该方案将单一缺陷的特征轮廓图随机分布在无缺陷木材上,这一方法有效地扩充了训练数据量,提高了模型对木材缺陷的泛化能力;其次,引进了膨胀感知残差(dilation-wise residual,DWR)模块来优化C2f模块,用来降低提取多尺度上下文信息的获取难度;随后,提出了特征聚焦扩散金字塔网络(focusing spread pyramid network,FSPN),可以通过特征扩散机制,将富含上下文语义信息的特征向量自适应分配至不同检测尺度,获取更多的特征信息;最后,提出了任务对齐动态检测头(task align dynamic detection head,TADDH),该检测头通过使用共享卷积,大幅减小参数数量,使得模型实现轻量化。综上所述,通过引入DWR模块、FSPN网络和TADDH检测头等一系列改进,最终构建了DFT-YOLO算法(YOLOv8+DWR+FSPN+TADDH)。DFT-YOLO算法在保持YOLOv8原有优势的基础上,提升了对木材缺陷的检测精度和鲁棒性。

1 材料与方法

1.1 创建数据集

本研究中,使用的数据集来自捷克奥斯特拉发技术大学和奥卢大学的公共数据集。捷克奥斯特拉发技术大学的数据构成了数据集的主要部分,该数据集共计包含20 275张图像,其中,18 283张图像存在单个或多个缺陷,而1 992张图像则完全无缺陷。数据集中涵盖了活结、死结以及其他10种缺陷类型,所有图像的分辨率为2 800×1 024。为了增强模型的适应性,引入了来自奥卢大学的数据集,该数据集包含了839张木材的图像。这些图像含有不同种类的缺陷,具有较好的泛化能力,但其中也存在一定程度的噪声干扰。为了确保试验数据的可靠性和实用性,对原始数据集进行了筛选和预处理。筛选结果选取3 941张包含多种典型缺陷的木材图像,生成了死结、活结、树髓、树脂、裂痕以及带裂痕的节疤的6种缺陷,如图1所示。为了增加数据集的规模,采用了数据增强技术,具体包括像素点移除、锐化、仿射变换、亮度调整、随机色调修改和水平翻转6种方法。每次增强过程随机选取1~5种方法,按随机序列执行,对数据集进行了扩充,最终获得了11 823张图像。这些图像被按照8∶1∶1的比例划分为训练集、验证集和测试集,以确保模型能够在不同的数据子集上进行有效地学习和泛化。

针对带裂缝的节疤类别的识别瓶颈,可以对单一类别(带裂缝的节疤)的数据集进行增强。首先提取原始缺陷样本,模拟木材图像单图小于等于3个缺陷的自然分布规律,构建缺陷组合单元,然后将缺陷单元以1~3个/图的密度随机植入无缺陷木板模板,生成333张基础合成图像,如图2所示。

将上述生成的333张基础合成图像按照1~5倍进行数据扩充,并添加到原有增强后存在的11 823张特征图像中,然后重新按8∶1∶1划分训练集、测试集和验证集,最后利用YOLOv8n原始模型进行训练得出的mAP50。为了确保试验结果的稳定性和可靠性,所有训练和测试试验均进行了3次重复。结果取3次试验的平均值,最终性能指标取均值并进行四舍五入处理,以减少因单次试验产生的偶然性对试验效果的影响。本研究后续的所有试验均遵循这一方法。相关试验结果汇总见表1,数据增强与模型性能之间存在复杂的非线性关系,在本试验中,当数据增强至3倍时,模型性能达到最优状态。试验表明,并非对某一特定类别缺陷的数据进行无限制扩充就能直接提升模型的整体效果。实际上,在本实验中,当过度增强某些类别的数据(如树髓、树脂及裂缝)时,这些类别在mAP50指标上分别下降了0.6%、0.4%、0.8%,说明对单一类别数据集的过度增强可能会以牺牲其他缺陷类别的识别精度为代价。数据集在3~4倍增强范围内时,模型表现相对更为出色,考虑到模型训练的效率,最终选择了3倍增强数据集作为模型训练的基础。

使用labelimg1.8.3软件标注数据增强后的图片。最终数据集中包括12 822张图像,按照8∶1∶1划分训练集、验证集和测试集,但测试集使用未进行单一缺陷增强前的测试集。所以训练集10 257张,验证集1 282张,测试集1 183张,图3为数据集中的缺陷类别分布。

图3(a)为直方图,描述了实例中不同缺陷类型的频率分布。其中,活结和死结出现的次数最多,分别为9 964次和7 946次。相比之下,树脂、树髓、带裂缝的节疤和裂缝出现的次数较少,分别为504、1 499、3 127、1 402次。因此,出现次数最多的2类缺陷在训练过程中表现出最佳的效果。尽管树髓、树脂和裂缝出现的次数较少,但由于其具有明显的特征,训练效果也较为理想。然而,带裂缝的节疤由于出现次数较少,即使在数据增强后,其训练效果仍然较差,但在数据增强后,这类缺陷的表现有所改善。图3(b)的分布热图为边界框的形状分布情况。图3(c)的散点图反映了中心点在xy维度上的集中度,而图3(d)的散点图则显示了数据集中小目标的数量相对较高。这些可视化结果直观展示了不同缺陷类型的数量及大小分布。

1.2 改进YOLOv8模型

1.2.1 YOLOv8模型的基本网络结构

图4为YOLOv8的结构图。骨干网络(backbone)采用多个卷积模块(ConvModules)提取图像特征,使用跨阶段双向特征融合模块(C2f)融合不同大小的特征映射。颈部网络(Neck)通过上采样(Upsample)和连接(Concat)来将不同尺度的特征图进行整合,进一步提取图像特征。头部网络(Head)是算法输出的一部分,检测头(Detect)通过多层卷积和池化操作来输出包括分类和回归结果。

1.2.2 特征聚焦扩散金字塔网络(FSPN)

特征金字塔网络(feature pyramid network,FPN)作为YOLOv8核心架构组件之一,其自上而下路径在整合图像多尺度特征方面发挥着关键作用。但传统FPN中采用的Concat模块进行特征融合,当处理尺度和语义不一致的数据时,Concat模块只是简单地将不同维度的特征向量在某个维度上进行拼接,这种拼接方式没有考虑到不同特征向量所代表的语义信息在融合时的合理性,这就导致融合后的特征不能准确地表述缺陷特性。于是,本研究提出了一种金字塔网络结构——特征聚焦扩散金字塔网络(FSPN),如图5所示。

特征聚焦扩散金字塔网络采用特征扩散机制与特征聚焦模块(focus feature)。特征扩散机制用于确保3个不同尺度P3、P4和P5层的尺度特征包含详细的上下文信息。特征聚焦模块其内部采用了类似于初始模块(Inception)中多尺度特征提取思想的多核尺寸卷积,可以高效捕捉多尺度的信息。特征聚焦模块能够接收3个不同尺度(P3、P4和P5层)的输入,针对不同尺度输入的特征图进行不同操作。

图6可知,对P3特征图利用双路互补下采样器(ADown)进行下采样并减半通道数的操作,有助于提取粗粒度特征以定位目标区域;对P4特征图使用标准卷积(Conv)可以保留原始细节;对P5特征图进行上采样(Upsample)并通过卷积操作(Conv)能够增强细粒度特征辅助精细分类。通过Concat将三路特征融合后,分别采用不同卷积核大小的深度可分离卷积(DWConv)压缩计算量并与原特征图(Identity)进行融合,将融合后的特征图通过点卷积(PWConv)优化特征表达能力。最终,引入残差连接缓解梯度消失,加速模型收敛。

1.2.3 任务对齐动态检测头(TADDH)

为解决模型在不同尺度下的回归预测问题,并便于后续模型的部署,提出了任务对齐动态检测头(TADDH),如图7所示。本研究借鉴了任务对齐单阶段目标检测器(tasks aligned one-stage object detection, TOOD)的核心思想33,不仅在标签分配策略上实现了任务对齐,而且在检测头的设计中融入了定制化的任务对齐结构。传统目标检测器的头部设计,大多将分类与定位视为2个独立的分支,这种设计方式忽略了两者之间潜在的交互关系,限制了模型的整体性能。

在TADDH中,通过利用交互特征,可变形卷积网络v2(deformable convolutional networks v2,DCNV2)能够依据任务需求动态生成合适的动态偏移量(offset)与掩码(mask),这一过程能够更好地适应不同尺度木材缺陷目标的特征变化,显著增强了定位的准确性与灵活性。同时,分类分支利用这些交互特征进行动态特征选择,确保了分类决策的精准与高效。TADDH设计的特征提取模块,能够从多个卷积层中有效地学习并提取任务交互特征,进而形成联合特征表示。

通过特征提取器模块(TaskDecomposition)的输入为Xi,j),可以进行平均池化操作获得gX),其计算方式为

g(X)=1H×Wi=1Hj=1WX(i,j)

式中:H代表特征图的高;W代表特征图的宽;H×W表示特征图的维度大小;(i,j)代表特征图的位置。

计算卷积权重,首先计算2层卷积权重Conv1(式中记为Conv1)和Conv2(式中记为Conv2),计算方式为

Conv1=δ(conv(g(X)))
Conv2=σ(conv(Conv1))

式中:δ表示线性整流函数(ReLU);conv表示1×1的卷积层;σ表示逻辑激活函数(sigmoid),将输入压缩到(0,1)区间内。

利用这2层卷积权重,使得特征图进行线性变换后恢复形状,得到N,最后利用归一化操作和激活得到输出C,其计算方式为

C=δ(GN(N))

式中:δ表示线性整流函数(ReLU);GN表示归一化操作。

针对2个输出C分别开展不同操作以进行分类预测(Conv_Cls)和回归预测(Conv_Reg)。首先,将输出C与经过线性整流函数(如ReLU)和逻辑激活函数(如Sigmoid)等非线性变换处理后的特征进行逐元素相乘(Multiply),用于分类预测任务;最后,把输出C与经过DCNv2模块计算得到的特征相结合。

该检测头引入了动态对齐机制,并通过DCNv2模块对回归特征进行空间对齐;对特征识别任务予以深度解构与细化,明确区分了分类特征与回归特征2大类别,并分别运用了针对性的处理策略。为了增强模型对不同尺度目标的适应能力,引入了一个可学习的缩放因子(scale),该因子能够自适应地调整各尺度下的回归预测结果,从而显著提升了模型在复杂场景下的鲁棒性和预测准确性;此外,采用了共享卷积(Conv-GN)的设计思路,削减了模型的参数数量,使模型更为轻量化,适用于资源受限的嵌入式设备或移动平台。

1.2.4 C2f-DWR模块

本研究引入了膨胀感知残差(dilation wise residual,DWR)模块34,并将DWR模块用来替换掉C2f中原有的瓶颈模块(Bottleneck),原有的Bottleneck模块通常只包含标准卷积,无法有效捕捉多尺度特征,DWR模块通过不同膨胀率(1、3、5)的卷积层,能够捕捉不同尺度的空间信息,增强对不同大小目标的检测能力。同时DWR模块虽然引入了更多的卷积层,但由于采用了膨胀卷积,能够在不显著增加参数数量的情况下捕获更大感受野。如图8所示。

DWR模块是以残差方式设计的,如图9所示。在残差内部,采用两步法有效地获取多尺度上下文信息,进而融合多尺度感受野生成的特征图。在第1步,在区域残差化(RR)过程中,模块依据输入特征生成与之相关的残差特征。这一步由一个普通的3×3卷积层、一个批量归一化(BN)层和一个线性整流函数(ReLU)层来实现。3×3卷积用于预限定特征提取。第2步,在语义残差化(SR)过程中,用多速率扩张深度卷积(DConv),对不同大小的区域特征进行形态过滤,可以获取更全面的特征信息。最后,将所提及的3处改进融入YOLOv8模型中形成了DFT-YOLO模型,如图10所示。

2 试验和结果

分析试验设置、评估指标、改进的YOLOv8消融试验、改进的YOLOv8算法在检测及分类木材缺陷方面的有效性,并与其他算法进行对比讨论。

2.1 试验环境

试验环境和参数设置分别见表2表3,其他未体现的均为开源模型YOLOv8n的默认设置。

2.2 评估指标

试验主要利用精确度、召回率、mAP50和模型参数量4个评价指标,通过比较改进后的网络模型与其他模型在相同试验环境下的检测差异,评估漏检、误检和模型大小情况。

精确度(P)为响应模型的精确度,计算公式为

P=TPTP+FP

式中:FP为假阳性;TP为真阳性。

召回率(R)为反映模型对目标的召回程度,计算公式为

R=TPTP+FN

式中,FN假阴性。

mAP表示对所有类别的平均精度进行算术平均的结果(式中记为mAP),mAP50表示0.5 IoU阈值下平均精度均值,计算公式为

AP=01prdr;mAP=1ci=1cAPi

式中:c为图像中类别的总数;i为图像的数目;p表示精确度;r表示召回率;AP为单个类别的平均识别精度AP50,表示该类别的P-R曲线下的面积。对所有类别的平均识别精度AP50求和,取平均值,得到mAP50。

2.3 对比试验

探讨C2f-DWR的位置对比试验分析,以及本研究算法与当前主流算法的对比试验分析,旨在从理论与实践双重维度,全面剖析本研究算法在相关领域的应用价值与性能表现。

2.3.1 C2f-DWR位置对比试验

为了验证提出C2f-DWR模块的有效性,分别在以下不同位置替换原有的C2f模块进行试验。

1)骨干网络(Backbone)中所包含的全部C2f模块。

2)颈部网络(Neck)中的所包含的全部C2f模块。

3)颈部网络(Neck)中的双向特征金字塔底部通道中的C2f模块。

4)骨干网络(Backbone)和颈部网络(Neck)中的所包含的全部C2f模块。

5)骨干网络(Backbone)中的所包含的全部C2f模块和颈部网络(Neck)中的双向特征金字塔底部通道中的C2f模块。

表4可知,替换更多的C2f模块之后,模型的参数量会大幅度降低,说明所引入的采用膨胀卷积的DWR模块确实具有使模型轻量化的作用,而在将C2f-DWR模块如5)所示的C2f模块替换后,模型精度有较大幅度的提升。所以最终选择在5)中的C2f模块进行模块的替换,使得模型检测精度提升和轻量化。

2.3.2 主流模型的对比试验

为了进一步表明DFT-YOLO模型改进的有效性,与其他主流模型进行了对比,对比结果见表5

在模型精度评估方面(准确率、召回率、mAP50和mAP50-95),与DFT-YOLO模型相比,Faster-RCNN-GIoU、RTMDeT-Tiny、YOLOv5和YOLOv6表现较差。在模型精度评估方面,与实时检测变换器模型(real-time detection transformer,RT-DETR)和YOLOv10n相比,本研究所提出的DFT-YOLO模型仍取得较高的平均精度。RT-DETR在准确率、召回率、mAP50以及mAP50-95关键指标上,分别低于DFT-YOLO 1.2%、2.9%、3.1%、15.4%,在参数量方面,RT-DETR的数值高出DFT-YOLO约一个数量级,这表明其模型结构较为庞大,可能会给计算资源带来较大的负担;YOLOv10n在准确率、召回率、mAP50以及mAP50-95关键指标上,分别低于DFT-YOLO 2.4%、2.1%、2.2%、10.1%,这进一步说明了DFT-YOLOv8模型的优势。

表6表7图3(a)可知,在活结和死结缺陷的检测上,因其具有大量的数据输入,各个模型也均表现出了很好的效果,尤其是本研究模型在mAP50方面达到了95.6%和95.5%,召回率方面达到了90.5%和90.0%。在树髓和树脂缺陷的检测上,因其具有较为明显特征,所有模型均表现出了不错的效果,虽然本研究模型在树髓的召回率方面比RT-DETR低2.7%,但是本研究模型在mAP50方面达到了99.3%和99.7%。而在带裂缝的节疤缺陷检测上,虽然这一缺陷目标小且复杂,但DFT-YOLO的mAP50更是达到了接近78.6%,远高于其他3种模型。此外,在裂缝缺陷的检测上,除了YOLOv5表现得远低于其他模型,其余3种均表现出不错的效果,尤其是本研究模型分别在mAP50和召回率方面更是高达96.9%和93.3%。DFT-YOLO进一步提升了检测效果,尤其在具有较多死结、活结和裂缝的环境中,可以体现模型检测结果的可靠性,但在存在较多带裂缝的节疤的环境中,各个模型包括本研究模型进行处理依然具有挑战性。

图11可知,当YOLOv8在检测树髓缺陷时,YOLOv5及RT-DETR在识别树脂缺陷时出现漏检的情况,DFT-YOLO则展现出全面的检测能力。本研究模型不仅能够准确识别死结,还能检测到树髓和树脂这2种不同类型的缺陷,充分证明了其泛化能力。

图12可以看出,改进后的模型相较于原始模型表现出更好的检测效果。改进后模型在精度方面取得了明显的提升,并且在拟合速度方面也展现出了轻微的加速趋势。虽然RT-DETR模型在准确率方面与本研究模型表现相当,但RT-DETR模型在召回率及mAP050指标上相较于改进模型仍存在较为明显的差距。综上所述,改进模型在精度、拟合速度以及召回率等多个性能指标上均取得较好的表现。

此外,采用层类激活映射热力图(LayerCAM)来体现试验过程中可视化方面的充分性和合理性。图13为3种算法对木材缺陷的空间关注度,较暖的颜色代表较高的关注度。相比之下YOLOv5算法产生了漏检的情况;YOLOv8 算法产生的缺陷关注区域较小,没有覆盖整个缺陷,置信度得分较低。由图13可知,DFT-YOLO算法产生的关注区域最大,几乎完全覆盖了整个缺陷。这种方法检测出的缺陷最多,置信度得分也更高。在木材缺陷检测任务中,DFT-YOLO方法比本研究中提到的其他方法更有效。

以上试验结果表明,本研究提出的模型在检测性能上具有显著优势。具体而言,改进模型在精度指标上优于当前主流模型(如YOLOv5、RT-DETR等),同时其参数量相对较小,这一特性使改进在未来部署中具备更高的效率和灵活性,尤其适用于资源受限的嵌入式设备或移动平台。

2.4 消融试验

为了评估每个模块的功效,通过消融试验对不同模块的缺陷检测结果进行了比较,比较方法包括了YOLOv8、YOLOv8+SI(single class improve,单一类别数据增强)、YOLOv8+SI+FSPN、YOLOv8+SI+FSPN+TADDH和YOLOv8+SI+FSPN+TADDH+DWR。表8为消融试验的结果。评估指标包括P、R、mAP50、mAP50-95和模型参数量大小。

表8可以看出,在进行SI后模型的精度有了明显的提高,准确率提升了4.5%,召回率也相应增长了6.1%;在利用了FSPN网络之后,精度也是有了显著的提高,其中,准确率提高了3.4%,mAP50提升了1.6%。这些改进表明本研究所提出的特征扩散和聚焦机制能够增强模型对特征信息的捕捉能力,不过这在一定程度上增加了模型的参数量;为优化模型的参数量,本研究将原有的检测头替换为TADDH检测头,这一替换使模型的参数量大幅降低,体现出共享卷积在减少模型参数、提升模型效率方面的作用;最后,把DWR模块融入C2f模块中。这一改进使模型的精度得到进一步提升,并降低了参数量。研究结果表明,引入膨胀卷积的DWR模块在提升模型性能的同时,还能够有效减少参数量。

3 结论

本研究针对在传统缺陷检测研究中单一样本缺陷形态同质化导致的模型泛化能力受限问题,提出一种数据增强的解决方案:从已提取的单一缺陷特征轮廓图集合里随机选取小于等于3张轮廓图,同时随机确定其在无缺陷木材背景图上的嵌入位置,从而丰富数据集的多样性。

本研究引入C2f-DWR模块,提高了多尺度上下文特征的提取能力。在此基础上,提出了特征聚焦扩散金字塔网络(FSPN)。其独特扩散机制,能让富含上下文信息的特征在各检测层高效传播,捕获更丰富特征信息。同时,设计任务对齐动态检测头(TADDH),运用共享卷积技术,大幅减少模型参数,使模型更轻量化,利于实际应用与部署。试验表明,经数据增强并集成FSPN、TADDH和DWR模块后,木材缺陷检测与分类性能取得提升。相较于YOLOv8n算法,所提增强方法在精确度(P)、召回率(R)、mAP50和mAP50-95关键指标上,分别提升7.9%、7%、6.8%、17.5%。因替换检测头及部分C2f模块,DFT-YOLO模型参数量减少近1/6。

后续将继续对DFT-YOLO算法进行改进与优化,使算法能更好地检测不同类型的木材缺陷以及减少计算量开支,使模型能更好地进行部署,较好满足实际应用需求。

参考文献

[1]

钟丽辉,程昱之,孙永科,木材缺陷识别方法综述[J].农业技术与装备2020(11):151-152,154.

[2]

ZHONG L HCHENG Y ZSUN Y K,et al.Review of wood defect identification method[J].Agricultural Technology & Equipment2020(11):151-152,154.

[3]

CHEN YSUN CREN Z,et al.Review of the current state of application of wood defect recognition technology[J].BioResources202318(1),2288-2302.

[4]

URBONAS ARAUDONIS VMASKELIŪNAS R,et al.Automated identification of wood veneer surface defects using faster region-based convolutional neural network with data augmentation and transfer learning[J].Applied Sciences20199(22):4898.

[5]

DU XLI JFENG H,et al.Image reconstruction of internal defects in wood based on segmented propagation rays of stress waves[J].Applied Sciences20188(10):1778.

[6]

PUCCINI C TGONÇALVES RMONTEIRO M E A.Avaliação estatística da variação da velocidade de propagação de ondas de ultra-som na madeira em presença de defeitos[J].Revista Brasileira de Engenharia Agrícola e Ambiental20026:499-503.

[7]

LONGUETAUD FMOTHE FKERAUTRET B,et al.Automatic knot detection and measurements from X-ray CT images of wood:A review and validation of an improved algorithm on softwood samples[J].Computers and Electronics in Agriculture201285:77-89.

[8]

LIN W SSHAO L JWU J Z.Study on wood board defect detection based on artificial neural network[J].The Open Automation and Control Systems Journal20157(1):290-295.

[9]

牟洪波,王世伟,戚大伟,基于灰度共生矩阵和模糊BP神经网络的木材缺陷识别[J].森林工程201733(4):40-43.

[10]

MU H BWANG S WQI D W,et al.Wood defects recognition based on gray-level co-occurrence matrix and fuzzy BP neural network[J].Forest Engineering201733(4):40-43.

[11]

WANG DLIU ZCONG F.Wood surface quality detection and classification using gray level and texture features[C]//Advances in Neural Networks–ISNN 2015:12th International Symposium on Neural Networks,ISNN 2015,Jeju,South Korea,October 15-18,2015,Proceedings 12.Springer International Publishing,2015:248-257.

[12]

白雪冰,许景涛,宋恩来,3种不同模型对木材表面缺陷图像分割算法的比较[J].西部林业科学201645(4):27-34.

[13]

BAI X BXU J TSONG E L,et al.Contrast of three image segmentation algorithms for wood surface defects[J].Journal of West China Forestry Science201645(4):27-34.

[14]

LIU WANGUELOV DERHAN D,et al.SSD:Single shot multibox detector[C]//Computer Vision–ECCV 2016:14th European Conference,Amsterdam,The Netherlands,October 11–14,2016,Proceedings,Part I 14.Springer International Publishing,2016:21-37.

[15]

REDMON JFARHADI A.YOLO9000:Better,faster,stronger[C]//Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition.Honolulu,HI,USA,November 9,2017.IEEE,2017:7263-7271.

[16]

BOCHKOVSKIY AWANG C YLIAO H Y M.YOLOv4:Optimal speed and accuracy of object detection[J].arXiv preprint arXiv:2020.

[17]

REDMON JDIVVALA SGIRSHICK R,et al.You only look once:Unified,real-time object detection[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition,Las Vegas,NV,USA,June 27-30,2016.IEEE,2016:779-788.

[18]

REN SHE KGIRSHICK R,et al.Faster R-CNN:Towards real-time object detection with region proposal networks[J].IEEE Transactions on Pattern Analysis and Machine Intelligence201639(6):1137-1149.

[19]

GIRSHICK RDONAHUE JDARRELL T,et al.Region-based convolutional networks for accurate object detection and segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence201538(1):142-158.

[20]

GIRSHICK RDONAHUE JDARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition,Columbus,OH,USA,September 25,2014.IEEE,2014:580-587.

[21]

DING FZHUANG ZLIU Y,et al.Detecting defects on solid wood panels based on an improved SSD algorithm[J].Sensors202020(18):5315.

[22]

KURDTHONGMEE WSUWANNARAT K.Locating wood pith in a wood stem cross sectional image using YOLO object detection[C]//Proceedings of 2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI).Kaohsuing,Taiwan,January 16,2020.IEEE,2019:1-6.

[23]

WANG RLIANG FWANG B,et al.ODCA-YOLO:An omni-dynamic convolution coordinate attention-based YOLO for wood defect detection[J].Forests202314(9):1885.

[24]

WANG BYANG CDING Y,et al.Detection of wood surface defects based on improved YOLOv3 algorithm[J].BioResources202116(4),6766-6780.

[25]

江兴旺,赵兴强.改进YOLOv7的木材表面缺陷检测算法[J].计算机工程与应用202460(7):175-182.

[26]

JIANG X WZHAO X Q.Improved YOLOv7 algorithm for wood surface defect detection[J].Computer Engineering and Applications202460(7):175-182.

[27]

WANG RCHEN YLIANG F,et al.BPN-YOLO:A novel method for wood defect detection based on YOLOv7[J].Forests202415(7):1096.

[28]

AN HLIANG ZQIN M,et al.Wood defect detection based on the CWB-YOLOv8 algorithm[J].Journal of Wood Science202470(1):26.

[29]

GIRSHICK RDONAHUE JDARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition,Columbus,OH,USA,June 23-28,2014.IEEE,2014:580-587.

[30]

HE KGKIOXARI GDOLLÁR P,et al.Mask R-CNN[C]//Proceedings of 2017 IEEE International Conference on Computer Vision.Venice,Italy,October 22-29,2017.IEEE,2017:2961-2969.

[31]

REDMON JFARHADI A.YOLOv3:An incremental improvement[J].arXiv preprint arXiv:2018.

[32]

BOCHKOVSKIY AWANG C YLIAO H Y M.YOLOv4:Optimal speed and accuracy of object detection[J].arXiv preprint arXiv:2020.

[33]

ZHANG YLIU SCAO J,et al.A rapid,automated flaw segmentation method using morphological reconstruction to grade wood flooring[J].Journal of Forestry Research201425(4):959-964.

[34]

CHANG ZCAO JZHANG Y.A novel image segmentation approach for wood plate surface defect classification through convex optimization[J].Journal of Forestry Research201829(6):1789-1795.

[35]

GU I Y HANDERSSON HVICEN R.Wood defect classification based on image analysis and support vector machines[J].Wood Science and Technology201044:693-704.

[36]

KODYTEK PBODZAS ABILIK P.A large-scale image dataset of wood surface defects for automated vision-based quality control processes[J].F1000Research202110:581.

[37]

FENG CZHONG YGAO Y,et al.TOOD:Task-aligned one-stage object detection[C]//2021 IEEE/CVF International Conference on Computer Vision (ICCV).Montreal,QC,Canada,October 10-17,2021.IEEE,2021:3490-3499.

[38]

WEI HLIU XXU S,et al.DWRSeg:Rethinking efficient acquisition of multi-scale contextual information for real-time semantic segmentation[J].arXiv preprint arXiv:2022.

基金资助

国家自然科学基金(32171691)

AI Summary AI Mindmap
PDF (6601KB)

777

访问

0

被引

详细

导航
相关文章

AI思维导图

/