多尺度特征聚合的木材缺陷检测算法

仇长青 ,  朱莉 ,  梁哲熙 ,  王祖然 ,  刘桐睿

森林工程 ›› 2026, Vol. 42 ›› Issue (02) : 387 -401.

PDF (8101KB)
森林工程 ›› 2026, Vol. 42 ›› Issue (02) : 387 -401. DOI: 10.7525/j.issn.1006-8023.2026.02.014
农林智能装备与技术

多尺度特征聚合的木材缺陷检测算法

作者信息 +

A Multi-scale Feature Aggregation Algorithm for Wood Defect Detection

Author information +
文章历史 +
PDF (8294K)

摘要

针对木材表面缺陷检测中存在的多尺度缺陷、复杂背景干扰及小目标漏检等问题,基于YOLOV11n提出一种多尺度特征聚合的木材缺陷检测算法PADDL-YOLO(PADDL是由PMSFA(partial multi-scale feature aggregation)、ADown(average pooling down sampling)、DySample(dynamic upsampler)、DPB(dynamic position bias)与LSDECD(lightweight shared detail-enhanced convolutional detection)首字母拼写)。首先,通过设计部分多尺度特征聚合(partial multi-scale feature aggregation,PMSFA)模块增强多尺度缺陷特征提取能力;其次,采用平均池化下采样(average pooling down sampling,ADown)与动态上采样器(dynamic upsampler,DySample),减少信息丢失,同时降低计算复杂度,提升模型对小目标的检测能力;然后,在注意力机制中引入动态位置偏置(dynamic position bias,DPB)模块改进C2PSA模块,强化空间位置感知能力,有效提升缺陷定位精度。此外,设计轻量级细节增强检测头(lightweight shared detail-enhanced convolutional detection,LSDECD),通过细节增强卷积强化边缘特征的捕获能力。试验表明,PADDL-YOLO在木材缺陷检测任务中表现出色,其精确度为91.5%,召回率为91.4%,mAP@0.5为95.0%,较基准模型YOLOV11n分别提高5.2%、4.9%和3.8%。同时,模型参数量减少25.6%,计算效率显著提升,为高精度实时检测提供有效解决方案。

Abstract

Aiming at the problems of multi-scale defects, complex background interference and small target leakage in wood surface defect detection, a multiscale feature aggregation wood defect detection algorithm PADDL-YOLO is proposed based on YOLOV11n (PADDL is a multiscale feature aggregation algorithm consisting of PMSFA (partial multi-scale feature aggregation), ADown (average pooling down sampling), DySample (dynamic upsampler), DPB (dynamic position bias) and LSDECD (lightweight shared detail-enhanced convolutional detection)). First, a partial multi-scale feature aggregation (PMSFA) module is designed to enhance multiscale defect feature extraction. Second, the use of average pooling down sampling (ADown) with a dynamic upsampler (DySample) reduces information loss while reducing computational complexity and improves the model's ability to detect small targets. Then, the dynamic position bias (DPB) module is introduced into the attention mechanism to enhance the C2PSA module, strengthening spatial position awareness and significantly improving defect localization accuracy. Additionally, a lightweight shared detail-enhanced convolutional detection (LSDECD) is designed, employing detail-enhanced convolution to reinforce edge feature capture. Experiments demonstrate that PADDL-YOLO achieves outstanding performance in wood defect detection, with a precision of 91.5%, recall of 91.4%, and mAP@0.5 of 95.0%, representing improvements of 5.2%, 4.9%, and 3.8%, respectively, over the baseline model YOLOV11n. Meanwhile, the model's parameter count is reduced by 25.6%, and computational efficiency is significantly enhanced, providing an effective solution for high-precision real-time detection.

Graphical abstract

关键词

木材缺陷 / YOLOV11 / 多尺度 / 木材加工 / 轻量化 / PMSFA / LSDECD

Key words

Wood defects / YOLOV11 / multi-scale / wood processing / lightweighting / PMSFA / LSDECD

引用本文

引用格式 ▾
仇长青,朱莉,梁哲熙,王祖然,刘桐睿. 多尺度特征聚合的木材缺陷检测算法[J]. 森林工程, 2026, 42(02): 387-401 DOI:10.7525/j.issn.1006-8023.2026.02.014

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

木材作为重要的天然材料,凭借其优异的机械性能和美学价值,在建筑、家居和艺术领域得到广泛应用。然而,木材在生长、储存和加工过程中易受环境因素影响,产生节子(活节、死节)、虫眼、腐朽和裂纹等多种缺陷,导致其综合利用率仅为50%~70%,严重制约了木材工业的经济效益和资源可持续性1。其中活节、死节和裂纹等常见木材表面缺陷会破坏木材均匀性,降低力学性能,增加加工难度,损害木板质量,从而显著影响装饰效果及商品和使用价值2。传统人工检测方法存在检测精度低、效率不足和人工成本高等问题,且操作员易因疲劳导致误检3,这促使自动化视觉检测(Automatic visual inspection,AVI)技术成为研究热点4

近年来,基于深度学习的方法凭借其自动特征提取和高精度分类的优势,逐渐成为主流研究方向3。卷积神经网络(Convolutional neural networks,CNN)在木材缺陷检测中展现出突出性能。例如,混合全卷积网络(Mix-fully convolutional networks,Mix-FCN)通过结合VGG16模型与双数据集训练策略,实现了99.14%的整体分类准确率(Overall classification accuracy,OCA)和单批次50张图像仅0.368 s的检测速度,显著提升实时性5。迁移学习的应用进一步提高了模型效率,如基于ResNet-34的迁移残差网络(TL-ResNet34)在节疤缺陷检测中达到98.69%的准确率6。此外,目标检测算法的改进推动多任务检测的发展,Faster R-CNN结合ResNet152与数据增强技术,实现96.1%的缺陷综合检测精度7。基于YOLO系列的改进模型通过轻量化设计、引入注意力机制和特征融合策略优化等。在保持实时性的同时,提升了检测精度8-14

尽管基于深度学习的木材缺陷检测取得了显著进展,但仍面临3个主要挑战:一是细小缺陷检测精度不足;二是模型轻量化与性能难以平衡;三是复杂场景下的鲁棒性有待提升4。基于上述问题与挑战,本研究采用YOLOV11n模型作为基础框架,重点针对细小缺陷检测精度不足和复杂场景鲁棒性差等问题进行改进。

1 针对木材缺陷的算法改进策略

木材表面质量检测作为木材加工的重要环节,面临着显著的算法挑战。由于天然材料的异质性特征,木材缺陷在视觉表现上呈现多维度复杂性。其几何形态差异显著,缺陷尺度从毫米级微裂纹至厘米级节疤,纹理特征则表现出非线性变化,如颜色渐变、纤维断裂等复杂特征,导致传统检测方法易出现误检与漏检。为此,本研究基于YOLOV11n提出一种轻量化算法PADDL-YOLO,创新性设计部分多尺度特征聚合(Partial multi-scale feature aggregation,PMSFA)、动态位置偏置注意力(Dynamic position bias,DPB)、轻量级细节增强检测头(Lightweight shared detail-enhanced convolutional detection,LSDECD)模块,引入了平均池化下采样(Average pooling down sampling,ADown)、动态上采样器(Dynamic upsampler,DySample)模块,目的是在提高检测精度减少误检和漏检。PADDL-YOLO网络结构如图1所示。

1.1 C3k2模块改进

C3k2模块是YOLO11模型中用于增强特征提取能力的重要组件,其设计基于传统C3模块的改进,结合了可变卷积核和通道分离策略。C3k2模块将输入特征一部分通过普通的卷积操作直接传递,另一部分则通过多个C3k(当C3k参数设置为True时)或Bottleneck结构进行深度特征提取。最终两部分特征进行拼接,并通过1×1卷积进行融合。此结构既能保持轻量化,又能有效提取深层次特征。C3k子模块结构如图2所示。

针对木材缺陷呈现多尺度复杂性问题,借鉴GhostNet15、FasterNet16的思想,设计了部分多尺度特征聚合(Partial multi-scale feature aggregation)模块,替换YOLOV11n Backbone中所有C3k2模块,相较于C3k2在多尺度下的特征提取能力更好。其结构如图3所示。

该模块由3个并行卷积层构成,分别对输入信息进行不同尺度的特征提取。这3个卷积层输出的特征图具有相同的空间尺寸但不同的通道数。模块通过通道维度拼接实现多尺度特征融合,随后采用1×1卷积进行通道压缩和跨通道信息整合,以增强特征表达能力。为保留原始输入的浅层特征并提升训练稳定性,模块采用残差连接结构,将1×1卷积的输出与原始输入相加。这种设计既避免了梯度消失问题,又实现了多尺度特征与原始信息的融合,使最终输出同时包含细节特征和全局语义信息。

1.2 采样模块改进

1.2.1 ADown模块

Wang等17在YOLOv9中提出的平均池化下采样(ADown)模块。ADown模块是一种兼顾轻量化和特征保留的高效下采样结构,其核心采用多分支并行设计,结合传统卷积与混合池化策略来减少信息损失。该模块通过最大池化抑制木材表面噪声干扰,同时利用平均池化平滑背景纹理,这种双池化协同机制能有效应对木材复杂的纹理背景。结构如图4所示。

1.2.2 DySample模块

动态上采样器(Dynamic upsampler,DySample)18是一种资源效率更高的上采样方法。该方法仅需使用PyTorch内置函数即可实现,无须定制统一计算设备架构(Compute unified device architecture,CUDA)包,大大提升部署便利性。DySample通过从点采样的角度重新定义上采样过程,避免了动态卷积的复杂计算,显著降低了计算资源的需求,同时在多个密集预测任务中表现出色。

DySample的工作原理如图5所示。给定一个大小为C×H×W的特征图 X,以及一个大小为2g×Hs×Ws的采样集 S,其中第一个维度的2表示xy坐标,grid_sample函数使用 S 中的位置将给定的双线性插值 X 重新采样,生成一个新的大小为C×Hs×Ws特征图 X',其工作过程为

X'=grid_sampleX,S

采样集 S 由采样点发生器(sampling point generator)生成,如图6所示。DySample引入了“静态偏移范围”和“动态偏移范围”的概念,通过乘以静态因子(0.25)或动态因子(0.5σ)来局部限制采样位置的移动范围,从而减少重叠和预测误差。工作过程为

O=linearX
S=G+O

1.3 C2PSA模块改进

C2PSA块是YOLOV11提出的新模块,其增强了特征图中的空间注意力。这种空间注意力机制使模型能够更有效地关注图像中的重要区域。通过在空间上汇集特征,C2PSA模块使YOLO11能够专注于特定的感兴趣区域,从而提高不同大小和位置物体的检测精度19。C2PSA模块结构如图7所示。

在C2PSA中Attention操作的计算复杂度为 On2),其中n是序列长度。对于长序列,这可能导致计算成本显著增加。由于Attention没有内置的位置信息处理能力,若输入序列中2个元素的位置交换,其计算的注意力权重和输出结果不会发生变化。

为解决这些问题,引入一个基于多层感知机(MLP)的模块,称为动态位置偏差(Dynamic position bias,DPB)20。DPB旨在为Transformer中的注意力机制提供动态生成的相对位置偏差(Relative position bias,RPB),解决RPB仅支持固定图像尺寸的限制。将DPB模块与PSABlock中Self-Attention结合,形成新的模块C2DPB,结构如图8所示。

RPB通过在注意力中添加偏差来指示嵌入的相对位置。在形式上,带有RPB的长短距离注意力(long short distance attention,LSDA,式中记为Attention)为

Attention=SoftmaxQKT/d+BV

式中:Q,K,VRG2×D分别为自注意力模块中的查询、键、值,D为嵌入度;d为一个常量归一化因子;BRG2×G2为相对位置偏差矩阵,Bij=B^Δxij,Δyij,其中B^是一个固定大小的矩阵,Δxij,Δyijij嵌入之间的坐标距离。

DPB通过一个多层感知机(MLP)动态生成位置偏置,输入是相对坐标Δxij,Δyij,输出是标量Bij。即

Bij=DPBΔxij,Δyij

DPB模块通过3个全连接层(MLP)动态学习从相对坐标到偏置值的映射关系,避免了依赖预定义的固定尺寸偏置矩阵。其结构简洁,中间层维度为嵌入维度D的1/4,并采用层归一化(layer normalization,LN)和ReLU激活函数。DPB能够适应任意尺寸的输入,特别适用于输入尺寸可变的任务,并在固定尺寸场景下可转换为RPB,保持与RPB相同的测试效率。

1.4 检测头模块改进

YOLOV11的检测对遮挡目标或小目标检测效果较差。针对该问题,设计出轻量级细节增强检测头(lightweight shared detail-enhanced convolutional detection,LSDECD),提高检测头的细节捕获能力,进一步改善检测精度。结构如图9所示。

LSDECD检测头接收来自颈部的多尺度特征图(P3、P4、P5)后,每个特征图先通过一个1×1卷积层进行特征变换,同时归一化特征图以提高网络的训练稳定性。1×1卷积层的主要作用是调整特征图的通道数并进行特征融合,同时保持特征图的分辨率不变。然后,通过3×3细节增强卷积(DEConv)扩大感受野,聚合空间上下文和多尺度信息,同时减少参数量。最后,通过2个1×1卷积层分别进行回归和分类任务。回归任务的输出通过Scale层进行缩放,该层包含一个可学习的动态因子λ,用于动态调整目标尺度以应对不同检测头检测目标尺寸不一致的问题。λ通过梯度下降算法在训练过程中实时更新,确保检测框尺寸的自适应优化。这一设计在降低计算资源消耗的同时,显著提升了检测精度和效率。

DEConv(detail-enhanced convolution)21是一种专为图像处理任务设计的卷积操作,旨在通过增强局部细节特征来提升模型表现。其核心是差分卷积(differential convolution,DC),通过计算相邻像素之间的差异来捕捉图像的局部细节特征。DEConv网络结构如图10所示。

其中,中心差卷积(CDC)和角度差卷积(ADC)通过计算中心或角度方向的像素差,捕捉复杂局部特征;水平差卷积(HDC)和垂直差卷积(VDC)分别计算水平/垂直相邻像素差,强化边缘和轮廓信息。DEConv通过5个并行卷积核对输入特征进行卷积,并将结果相加得到输出。公式为

Fout=DEConvFin=i=15Fin*Ki=Fin*i=15Ki=Fin*Kcvt
Kcvt=i=15Ki

式中:FinFout分别为输入和输出特征;Ki 为5个并行的卷积核(VC、CDC、ADC、HDC、VDC);*为卷积操作;Kcvt为5个卷积核叠加后的等效标准3×3核。

2 结果与分析

2.1 数据集收集与预处理

本研究使用来自捷克共和国奥特斯拉发理工大学2022年更新的用于自动化视觉质量控制过程的大规模木材表面缺陷图像的公开数据集的子集22,该数据集包含10种典型木材表面缺陷的图像,共4 000张图像,图片大小为2 800×1 024像素。经过重新标注,发现大量空标签以及无缺陷的图片,最终保留了7种具有足够样本量的流行缺陷类型,用于所提出模型的训练和评估,共选取3 623张图像。缺陷类型包括活节(live knot)、树髓(marrow)、树脂(resin)、死节(dead knot)、裂纹节(knot with crack)、缺失节(knot missing)、裂缝(crack)。数据集的缺陷样本示例如图11所示。

数据集中部分缺陷样本数量不足及数据不均衡问题,为避免过拟合并增强模型泛化能力,对图像进行数据增强。本研究通过随机翻转(包含垂直翻转与水平翻转,概率均为0.5)、添加高斯噪声(均值为0,方差为0.1)和随机亮度调整(亮度变化因子范围为0.5)图像增强方法扩展数据集,以提升模型训练效果。经过数据增强后的数据集共6 972张图像,每种缺陷类型所对应的标签数量见表1。按8∶1∶1划分训练集(5 577张)、验证集(697张)和测试集(698张)。

2.2 试验环境与参数配置

本试验基于Windows 11 24H2操作系统搭建,CPU采用英特尔i7-12800HX,GPU采用NVIDIA RTX 4070 Laptop GPU(8 GB显存),运行内存32 GB,采用CUDA 12.6加速计算。开发环境依赖Python 3.12.9编程语言和PyTorch 2.6.0深度学习框架,确保GPU算力与深度学习库的兼容性,为模型训练提供稳定的计算支持。

模型训练配置为:迭代次数(epoch)设为300次,批量大小(batch size)为32,采用随机梯度下降优化器(SGD)进行参数更新,初始学习率(lr0)设置为0.01。输入图像分辨率调整为2 800×1 024像素,数据加载使用4线程(workers)并行预处理以提升效率。该配置旨在平衡显存占用与训练稳定性,同时通过高分辨率输入捕捉更丰富的特征信息。

2.3 评估指标

在本试验使用准确度(precision,P)、召回率(recall,R)、平均精度(average precision,AP,式中记为AP)、平均精度均值(mean average precision,mAP,式中记为mAP)、参数量(params)、计算量(FLOPs)共6个指标来评估模型的准确性和轻量性。其准确度、召回率、平均精度、平均精度均值计算公式为

P=TPTP+FP
R=TPTP+FN
AP=01PRdR
mAP=1ni=1nAPi

式中:TP为真正例,即模型正确预测为正类的样本数量;FP为假正例,即模型错误地预测为正类的样本数量;FN为假负例,即模型错误地预测为负类的样本数量;n为木材缺陷类别的总数。

2.4 消融试验

为验证各改进模块的有效性,首先对各个模块单独测试,确保所选模块对比YOLOV11n基准模型均有不同程度提升,然后在YOLOV11n基准模型上依次叠加PMSFA(部分多尺度特征聚合)、采样模块、动态位置偏置注意力(C2DPB)和轻量级细节增强检测头(LSDECD)模块,对比分析其对检测性能的影响。试验结果见表2

表2可知,引入PMSFA模块后,准确率提升1.7%,平均精度均值50增加0.6%,验证了多尺度特征聚合对木材复杂纹理缺陷的表征能力。参数量仅增加0.05 M。引入采样模块后,召回率显著提升2.6%,平均精度均值50增加2.9%,计算量降低19.0%,说明Adown与DySample的协同设计有效缓解了多尺度缺陷的漏检以及精度低问题,同时减少计算冗余。模块LSDECD检测头通过差分卷积增强边缘特征捕获,平均精度均值50提升1.8%,参数量减少12.4%,表明轻量化检测头在降低复杂度的同时,可有效提升细微型缺陷的定位精度。

全模块组合Model H也就是PADDL-YOLO实现最优性能。平均精度均值50达95.0%,较基准模型提升3.8%,参数量压缩25.6%,验证了模块间的互补性。PADDL-YOLO在参数量和计算量低于大多数模型,证明改进策略实现了计算效率与检测精度的平衡,适用于边缘设备部署。

2.5 对比试验

2.5.1 C2PSA不同改进对比试验

本研究对比了C2PSA模块的不同改进方案,在C2PSA基础上分别加入双层路由注意力(bi-level routing attention,BRA)23、信道门控注意力(channel-wise gated attention,CGA)24、可变形注意力(deformable attention,DA)25、令牌统计自注意力(Token statistics self-attention,TSSA)、DPB,得到C2BRA、C2CGA、C2DA、C2TSSA、C2DPB模块。试验结果见表3

本研究提出的C2DPB模型在目标检测任务中展现出显著优势。其召回率达87.7%,为所有方案最高。表明,该模型能有效降低漏检率并准确捕捉实际目标;同时,以92.8%的平均精度均值50领先其他改进模块。这一性能提升得益于动态位置偏置(DPB)模块的创新设计,通过多层感知机(MLP)生成空间位置偏置,显著增强了木材纹理与缺陷的空间关联性建模能力。与C2PSA、C2CGA等模块相比,DPB模块不仅避免了传统动态卷积的参数冗余,还以较低的参数量实现了更精准的检测效果,在保持高精度的同时提升了模型稳定性。

为了更直观体现DPB效果,选择2张测试集图片。分别使用这些改进模块的权重生成热力图,如图12所示。在C2PSA中加入DPB与加入其他注意力机制对比,明显C2DPB注意力更加集中,定位更精准,说明背景噪声对其影响很小。综合来看,C2DPB在召回率、检测精度、模型轻量化3个维度达成最佳平衡,为实际应用提供了兼具高效性和可靠性的解决方案。

2.5.2 检测头不同改进对比试验

为验证轻量级细节增强检测头(LSDECD)的检测效果,本研究对多种检测头进行对比,包括注意力检测头(AttHead)、高效检测头(EfficientHead)和自集成注意力机制检测头(SEAMHead)等。试验结果见表4

表4的检测头改进对比结果可以看出,LSDECD在多个关键指标上均表现出显著优势。相较于基准模型V11Head,LSDECD的准确率从86.3%提升至89.3%,召回率从86.5%提升至87.3%,平均精度均值50从91.2%提升至93.0%,展现了更强的缺陷检测能力。同时,LSDECD的参数量仅为2.26 M,较V11Head的2.58 M减少了12.4%,计算量保持在6.0 G,与基准模型接近,体现了其在轻量化方面的优化。

与其他改进方案相比,LSDECD在综合性能上表现最优。例如,SEAMHead虽然准确率略高,但其召回率和平均精度均值50低于LSDECD,且参数量和计算量并未显著降低。AttHead的召回率虽略高于LSDECD,但其准确率和平均精度均值均50低于LSDECD,且计算量更高。EfficientHead的计算量最低,但其平均精度均值50和准确率均不及LSDECD,说明其在轻量化的同时牺牲了一定的检测精度。

总体而言,LSDECD在检测精度、轻量化和计算效率之间实现了最佳平衡,使其成为木材缺陷检测任务中最具竞争力的检测头改进方案。

2.5.3 主流算法对比试验

为了全面评模型性能,本研究设计了PADDL-YOLO与多个目标检测模型进行了对比,包括轻量化模型(FastestDet、YOLO-FastestV2、NanoDet-Plus-m)、经典YOLO系列(从YOLOv3-tiny到YOLOV11n)、高性能模型(RT-DETR)。试验结果见表5

表5可知,PADDL-YOLO在准确率、召回率和平均精度均值50均取得最高值,分别为91.5%、91.4%和95.0%。其准确率比RT-DETR高出0.4%,召回率比RT-DETR高出1.0%,而平均精度均值50更是大幅领先RT-DETR 3.9个百分点。此外,PADDL-YOLO的参数量虽略高于部分轻量级模型FastestDet、NanoDet-Plus-m和YOLO-FastestV2,但远低于RT-DETR,且计算量与YOLOV11n相当,表明其在保持轻量化的同时实现了更高的检测精度。

进一步分析其他模型的表现,RT-DETR虽然精度较高,但其参数量和计算量分别达到19.8 M和57.0 G,资源消耗过大;而轻量级模型FastestDet、NanoDet-Plus-m和YOLO-FastestV2,虽然参数量和计算量极低,但其准确率召回率和平均精度均值50表现较差,难以满足高精度检测需求。相比之下,PADDL-YOLO在性能与效率之间取得了更好的平衡,其平均精度均值50较基准模型YOLOV11n提升了3.8%,同时参数量减少了25.6%,使其成为实际应用中的优先选择。

2.6 模型效果分析

首先,通过对比不同YOLO模型的精度(Precision)、召回率(Recall)及平均精度均值(mAP)曲线,验证模型的检测能力与训练稳定性;其次,结合热力图,直观呈现模型在缺陷定位中的注意力分布特征;最后,进行鲁棒性分析,充分展示改进算法在面对复杂背景干扰时的检测性能。

PADLL-YOLO在多个性能指标上表现出显著优势,如图13所示。在精度率、召回和平均精度等方面,均达到或接近最高值,并且在训练后期表现尤为稳定。较其他YOLO模型,PADLL-YOLO在训练过程中展现出更快的收敛速度和更高的性能。

图14图15为木材缺陷检测任务中使用YOLOV11n和PADDL-YOLO生成的热力图与检测结果。图14中YOLOV11n的热力图显示,在一些小的且与周围区分度不大的缺陷上,颜色很浅甚至没有颜色。这表明,YOLOV11n在小的缺陷上面注意力集中不足,小目标特征丢失,发生漏检。在一些纹理扭曲且颜色深的无缺陷表面出现注意力集中。这表明,YOLOV11n受到背景噪声干扰,出现误检。相比之下,由图15可以清楚地看出,PADDL-YOLO在木材缺陷检测过程中更精确地关注缺陷的关键区域。生成的热力图颜色更深,表明对目标区域的关注更强,注意力集中在缺陷的关键特征上。这种差异反映了PADDL-YOLO模型在特征提取和缺陷定位方面的显著优势,能够更准确地识别和捕获木材缺陷细节,从而提高检测精度和可靠性。

为进一步验证模型的鲁棒性,采用图像风格转移SaMam26模型,选取不同纹理特征的图片作为风格图像,生成新测试集,模拟模型在复杂背景干扰下的检测结果。风格图像如图16所示。

使用基准模型YOLOV11与PADDL-YOLO对新测试集进行检测,检测结果如图17所示。在对生成的3种风格图片检测时,YOLOV11n与PADDL-YOLO的检测性能均有影响。由图17可以看出,YOLOV11n对风格1图像进行检测时,检测效果非常差,甚至存在图中没有检测出缺陷状况。对风格2和风格3检测时,会把边缘误检成树髓,说明YOLOV11n在面对风格迁移产生复杂背景干扰下会出现漏检与误检。但改进算法PADDL-YOLO在对3种风格图片检测时要比YOLOV11n更优秀,改进算法在风格1的图片检测时可以检测到大多数的缺陷,对风格2和风格3检测时,基本能检测到所有缺陷,说明改进算法在面对复杂背景干扰时仍然有良好的检测性能,相较于YOLOV11n具有较强的鲁棒性。

3 结论

为了应对木材表面缺陷检测中存在的多尺度缺陷、复杂背景干扰及小目标漏检等问题,本研究提出了基于YOLOV11n改进的多尺度特征聚合的木材缺陷检测算法PADDL-YOLO。通过引入部分多尺度特征聚合(CSP-PMSFA)、平均池化下采样(ADown)与超轻量级动态上采样(DySample)模块、动态位置偏置注意力(C2DPB)和轻量级细节增强检测头(LSDECD)模块,显著提升了模型的检测性能和计算效率。PADDL-YOLO与主流模型对比,准确率、召回率和平均精度均值50均为最高,尤其在树髓、裂缝等复杂缺陷类型上优势显著。热力图与鲁棒性分析进一步表明,该模型对小尺寸缺陷和低对比度区域的注意力聚焦更精准,对复杂背景干扰有效减少漏检与误检。

然而,该模型在极端光照条件下的鲁棒性以及进一步轻量化模型仍存在改进空间,未来研究将围绕多多模态数据融合技术和自适应计算优化展开,以进一步提升模型的泛化能力和实用性。目前检测仍受限于样本多样性不足,需引入生成对抗网络(GAN)合成极端样本。

参考文献

[1]

DING F LZHUANG Z LLIU Yet al.Detecting defects on solid wood panels based on an improved SSD algorithm[J].Sensors202020(18):5315.

[2]

贺春光,李璐芳,高峰,.基于核主成分分析的GSA-SVM木材单板缺陷识别研究[J].森林工程202339(2):91-99.

[3]

HE C GLI L FGAO Fet al.Study on GSA-SVM wood veneer defect identification based on kernel principal component analysis[J].Forest Engineering202339(2):91-99.

[4]

CHEN Y TSUN C SREN Z Ret al.Review of the current state of application of wood defect recognition technology[J].BioResources202218(1):2288-2302.

[5]

CHUN T HHASHIM U RAHMAD Set al.A review of the automated timber defect identification approach[J].International Journal of Electrical and Computer Engineering (IJECE)202313(2):2156-2166.

[6]

HE TLIU YXU C Yet al.A fully convolutional neural network for wood defect location and identification[J].IEEE Access20197:123453-123462.

[7]

GAO M YQI D WMU H Bet al.A transfer residual neural network based on ResNet-34 for detection of wood knot defects[J].Forests202112(2):212.

[8]

URBONAS ARAUDONIS VMASKELIŪNAS Ret al.Automated identification of wood veneer surface defects using faster region-based convolutional neural network with data augmentation and transfer learning[J].Applied Sciences20199(22):4898.

[9]

张茹,杨昊,王钰圣,.基于深度学习的轻量化木材表面缺陷检测系统研究[J].林业工程学报202510(4):107-117.

[10]

ZHANG RYANG HWANG Y Set al.Deep learning-based lightweight system for detection of surface defects in timber[J].Journal of Forestry Engineering202510(4):107-117.

[11]

荣强,田启川,谭润.改进Yolov5s的木材表面缺陷实时检测方法[J].林产工业202562(1):64-71.

[12]

RONG QTIAN Q CTAN R.Improved Yolov5s wood surface defect real-time detection method[J].China Forest Products Industry202562(1):64-71.

[13]

江兴旺,赵兴强.改进YOLOv7的木材表面缺陷检测算法[J].计算机工程与应用202460(7):175-182.

[14]

JIANG X WZHAO X Q.Improved YOLOv7 algorithm for wood surface defect detection[J].Computer Engineering and Applications202460(7):175-182.

[15]

WANG BWANG R JCHEN Y Set al.FDD-YOLO:A novel detection model for detecting surface defects in wood[J].Forests202516(2):308.

[16]

ZHENG Y CWANG M FZHANG Bet al.GBCD-YOLO:A high-precision and real-time lightweight model for wood defect detection[J].IEEE Access202412:12853-12868.

[17]

ZHANG Q YLIU L PYANG Z Yet al.WLSD-YOLO:A model for detecting surface defects in wood lumber[J].IEEE Access202412:65088-65098.

[18]

WANG R JCHEN Y SLIANG F Let al.BPN-YOLO:A novel method for wood defect detection based on YOLOv7[J].Forests202415(7):1096.

[19]

HAN KWANG Y HTIAN Qet al.GhostNet:More features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 13-19,2020,Seattle,WA,USA.IEEE,2020:1580-1589.

[20]

CHEN J RKAO S HHE Het al.Run,don’t walk:Chasing higher FLOPS for faster neural networks[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 17-24,2023,Vancouver,BC,Canada.IEEE,2023:12021-12031.

[21]

WANG C YYEH I HMARK LIAO H Y.YOLOv9:Learning what you want to learn using programmable gradient information[M]//Computer Vision – ECCV 2024.Cham:Springer Nature Switzerland,2024:1-21.

[22]

LIU W ZLU HFU H Tet al.Learning to upsample by learning to sample[C]//2023 IEEE/CVF International Conference on Computer Vision (ICCV).October 1-6,2023,Paris,France.IEEE,2023:6027-6037.

[23]

KHANAM RHUSSAIN M.Yolov11:An overview of the key architectural enhancements[J].arXiv preprint arXiv:2024.

[24]

WANG W XCHEN WQIU Q Bet al.CrossFormer++:A versatile vision transformer hinging on cross-scale attention[J].IEEE Transactions on Pattern Analysis and Machine Intelligence202346(5):3123-3136.

[25]

CHEN Z XHE Z WLU Z M.DEA-Net:Single image dehazing based on detail-enhanced convolution and content-guided attention[J].IEEE Transactions on Image Processing202433:1002-1015.

[26]

KODYTEK PBODZAS ABILIK P.A large-scale image dataset of wood surface defects for automated vision-based quality control processes[J].F1000Research202110:581.

[27]

ZHU LWANG X JKE Z Het al.BiFormer:Vision transformer with bi-level routing attention[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 17-24,2023,Vancouver,BC,Canada.IEEE,2023:10323-10333.

[28]

KHAN BMUMTAZ AZAFAR Zet al.CGA-Net:Channel-wise gated attention network for improved super-resolution in remote sensing imagery[J].Machine Vision and Applications202334(6):128.

[29]

XIA Z FPAN X RSONG S Jet al.Vision transformer with deformable attention[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 18-24,2022,New Orleans,LA,USA.IEEE,2022:4794-4803.

[30]

LIU H DWANG L GZHANG Yet al.SaMam:Style-aware state space model for arbitrary image style transfer[C]//2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition Conference (CVPR).June 10-17,2025,Nashville,TN,USA.IEEE,2025:28468-28478.

AI Summary AI Mindmap
PDF (8101KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/