基于改进YOLOv8的无人机影像小目标检测算法

汪琦 ,  云利军 ,  潘继军 ,  陈载清

云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (04) : 464 -472.

PDF (2280KB)
云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (04) : 464 -472. DOI: 10.3969/j.issn.1672-8513.2025.04.011
信息与计算机科学

基于改进YOLOv8的无人机影像小目标检测算法

作者信息 +

An improved YOLOv8 - based small object detection algorithm for UAVs

Author information +
文章历史 +
PDF (2334K)

摘要

针对无人机影像小目标检测中存在的性能低、漏检与误检问题,提出了一种基于改进的YOLOv8小目标检测模型:YOLOv8 - CAS.通过构造轻量化C2f_CAS特征提取模块,模型对小目标细节的捕捉能力得到增强,同时减少了计算复杂度.引入SimAM注意力机制,通过其自适应特征选择能力增强模型对关键区域的关注,从而提升小目标检测的精度.引入DyHead检测头,通过其动态路由机制有效融合多尺度特征,提升模型对小目标的定位精度.最后加入P2小目标检测层,通过增强浅层高分辨率特征图的利用,进一步优化多尺度特征融合.改进模型在VisDrone数据集上相比原始模型的精确率、召回率、mAP@50、mAP@50∶95分别提升了10.1、8.1、10.2和6.7个百分点.实验结果表明,YOLOv8 - CAS模型在小目标检测任务中表现出显著的性能提升,适用于复杂场景下的无人机目标检测应用.

Abstract

In response to the issues of low performance, missed detection, and false detection in UAV small target detection, an improved YOLOv8 - based model, YOLOv8 - CAS, is proposed. By constructing a lightweight C2f - CAS feature extraction module, the model enhances its ability to capture small target details while reducing computational complexity. The SimAM attention mechanism is introduced to adaptively select features, thereby enhancing the model′s focus on key areas and improving small target detection accuracy. The DyHead detection head is incorporated, which uses a dynamic routing mechanism to effectively fuse multi - scale features and improve the model′s small target localization accuracy. Finally, a P2 small target detection layer is added, which optimizes multi - scale feature fusion by enhancing the utilization of shallow high - resolution feature maps. Experimental results on the VisDrone dataset show that the improved model achieves increases of 10.1, 8.1, 10.2, and 6.7 percentage points in precision, recall, mAP@50, and mAP@50∶95, respectively, compared to the original model. The results demonstrate that the YOLOv8 - CAS model shows significant performance improvements in small target detection tasks and is suitable for UAV target detection applications in complex scenarios.

Graphical abstract

关键词

无人机 / 小目标检测 / YOLOv8 / DyHead / 多尺度特征融合

Key words

UAV / small target detection / YOLOv8 / DyHead / multi - scale feature fusion

引用本文

引用格式 ▾
汪琦,云利军,潘继军,陈载清. 基于改进YOLOv8的无人机影像小目标检测算法[J]. 云南民族大学学报(自然科学版), 2025, 34(04): 464-472 DOI:10.3969/j.issn.1672-8513.2025.04.011

登录浏览全文

4963

注册一个新账户 忘记密码

无人机(UAV)航拍巡检技术在城市安防、自然资源监测及灾害应急等场景得到广泛应用,其中,集成计算机视觉技术进行目标检测是无人机平台的核心任务1.相较于固定视角的监控设备,无人机可快速覆盖大范围区域并获取多角度航拍图像的能力,为复杂场景的目标识别开辟了全新数据来源.然而,受限于飞行高度与摄像头分辨率,航拍图像中的目标常呈现微小尺寸,此外,光照条件、背景干扰及遮挡现象进一步加剧了图像模糊问题,这对现有目标检测算法提出了双重挑战2.无人机航拍图像的小目标检测普遍存在漏检与误检现象,显著制约了无人机技术在实际场景中的应用效果3.
在目标检测领域,以Faster R - CNN4为代表的2阶段模型通过区域建议网络生成候选框,然后再对其进行精细化分类与回归.但是其复杂的双阶段流程无法满足无人机实时检测的需求5.相比之下,单阶段模型凭借端到端架构实现了检测效率与精度的有效平衡.其中YOLO(you only look once)系列模型通过持续迭代已成为工业界主流方案.该系列从YOLOv3引入多尺度预测机制6,到YOLOv5优化特征金字塔结构7,直至YOLOv8采用C2f模块强化梯度传播8,逐步提升了模型性能.然而在无人机小目标检测任务中,YOLOv8仍存在显著局限:首先,深层特征提取模块(C2f)对小目标的细节捕捉能力不足,导致细微特征难以有效保留;其次,传统注意力机制(如SE9、CBAM10)因较高计算复杂度,在轻量化模型部署中面临效率瓶颈;此外,模型对浅层高分辨率特征的利用尚不充分,致使小目标在下采样过程中容易出现特征退化现象.
近年来,围绕无人机场景下的小目标检测任务,研究者们提出了多种改进YOLO方案来提升检测性能和效率.例如,范江霞等11通过改进YOLOv5的锚框配置并引入通道注意力机制,在提升检测精度方面取得了一定成效,然而该方法显著增加了模型参数量;潘玮等12则在YOLOv8中融合了通道与空间双重注意力机制,虽有效增强了模型在复杂背景下的鲁棒性,但由于引入了多重卷积结构,导致推理速度有所下降;梁秀满等13提出减少深层检测模块并加强浅层特征融合路径的设计,成功降低了模型整体参数规模,但其方法对极小目标(尺寸小于16 × 16像素)的召回能力仍有不足.此外,李岩超等14设计的SPM(self - position module)通过引入坐标注意力机制提高了位置感知能力,但未能有效解决多尺度特征动态融合的问题;沈学利等15提出的SFE - YOLO(shallow feature enhancement - YOLO)通过强化浅层特征提取提升了检测性能,然而其所依赖的ECA - Net注意力机制在建模通道间关系方面仍存在一定局限性.
综上所述,针对无人机小目标检测任务,当前的研究成果在检测精度、推理效率与模型复杂度之间的平衡仍未达到理想状态,亟需探索一种兼顾轻量化与高精度的小目标检测架构.为了进一步优化YOLO模型性能,特别是在无人机小目标检测和复杂场景中的表现,提出YOLOv8 - CAS(YOLOv8 - convolutional additive self - attention)模型.
实验19表明,YOLOv8 - CAS在VisDrone2019数据集上的检测性能显著优于主流YOLO系列模型,同时保持较低的参数量与计算开销.与YOLOv8n模型相比YOLOv8 - CAS的mAP@50和mAP@50∶95分别提高了10.1和6.7个百分点,可有效应用于无人机小目标检测任务.

1 YOLOv8模型

YOLOv8模型依据网络宽度与深度的差异划分为YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l、YOLOv8x 5个版本,其模型复杂度按n、s、m、l、x层级递进.针对无人机平台算力资源有限的特点,本研究选取计算负载最低的YOLOv8n作为基线架构进行优化设计.该模型的骨干网络基于CSPDarknet - 53架构改进,将原C3模块替换为C2f模块20.C2f模块通过引入跨阶段梯度分流机制,在保留浅层细节特征的同时,利用多分支并行结构增强特征复用效率,显著提升了小目标的边缘与纹理信息捕获能力21.颈部网络部分沿用C2f模块替代传统C3结构,通过参数精简的轻量化设计优化多尺度特征融合过程.其特征融合采用双向金字塔架构(PAN + FPN),首先对骨干网络输出的最小尺度特征图(P5层,分辨率20 × 20)进行上采样,逐级与中层(P4,40 × 40)及浅层(P3,80 × 80)高分辨率特征图进行通道拼接与卷积融合,形成自顶向下的语义增强路径;随后通过自底向上的空间细化路径,将浅层特征下采样并与深层特征融合,构建多尺度协同感知能力.融合后的P3至P5层特征图分别输入解耦检测头,该检测头采用任务分离设计,通过独立回归分支预测目标边界框坐标与宽高比例,分类分支则输出目标类别概率,有效缓解分类与定位任务的参数耦合问题22.损失函数采用CIoU,其在传统IoU基础上引入中心点距离惩罚项与宽高比一致性约束,相较于GIoU能更精确地量化预测框与真实框的空间对齐误差,尤其在处理密集小目标场景时表现出更强的收敛稳定性23.

2 YOLOv8 - CAS模型

YOLOv8 - CAS模型的网络结构如图1所示.针对原始YOLOv8在无人机小目标检测任务中存在的深层特征提取能力不足、注意力机制冗余以及浅层细节信息丢失等问题,本文提出系统性改进方案:首先,为解决C2f模块对小目标特征表达能力较弱的问题,设计轻量化C2f_CAS模块,通过堆叠AdditiveBlock融合卷积操作与加性自注意力机制(convolutional additive self - attention,CAS),在降低计算复杂度的同时增强多尺度细节特征的捕获能力;其次,为优化特征选择效率,在SPPF层后嵌入SimAM注意力模块,利用自信息最大化策略动态增强关键区域特征响应,有效抑制复杂背景噪声干扰;此外,针对传统检测头多尺度特征融合能力不足的缺陷,引入DyHead模块,通过尺度感知、空间感知与任务感知的三重注意力机制动态调整特征权重,提升模型对微小目标的定位精度;最后,为缓解浅层特征在下采样过程中的信息丢失,新增P2小目标检测层,构建“P2 + P3 + P4 + P5”四级检测体系,通过跨层连接融合浅层高分辨率细节与深层语义信息,显著强化小目标的边界回归性能.上述改进模块通过梯度协同优化与参数共享机制实现高效集成:C2f_CAS模块强化骨干网络的特征提取能力,SimAM机制优化颈部网络的特征选择,DyHead提升多尺度动态融合效率,P2检测层则通过高分辨率特征保留增强定位精度.

2.1 C2f模块改进

YOLOv8在结构设计上对YOLOv5进行了若干改进,旨在提高模型的训练效率.具体而言,YOLOv8将YOLOv5中的C3模块替换为更为高效的C2f模块,通过优化梯度流动路径、减少计算资源消耗,从而整体提升训练效率24.但是C2f模块结构相对简化,在处理小目标图像细节时表现不佳,影响模型对复杂特征的学习能力.为此,本文提出了C2f_CAS模块,如图2所示.

C2f_CAS模块的核心在于通过堆叠多个AdditiveBlock单元,将卷积运算与自注意力机制深度融合,从而实现对深层特征的高效提取与建模.在输入处理阶段,模块采用1 × 1卷积层对输入特征图进行通道维度压缩,将通道数缩减至原规模的一半,以此显著降低后续计算负载.随后,这些被压缩的特征图被划分为多个子区域,分别输入至多个并行的AdditiveBlock中进行特征增强处理.作为该模块的关键构建单元,AdditiveBlock采用多分支混合网络架构,其内部由3个具有残差连接的子模块构成:集成子网(integration)、卷积加性自注意力机制(convolutional additive self - attention, CAS)以及多层感知机(MLP).其中集成子网负责基础特征融合,CAS模块通过引入加性相似度函数重构空间-通道注意力关系,而MLP则承担特征重构与非线性增强的双重任务.

在具体实现中,CAS机制展现出独特的设计优势.相较于传统自注意力机制依赖的矩阵乘法与Softmax操作,该机制通过摒弃计算密集型步骤,采用轻量化架构显著提升了运算效率.其核心创新在于构建了基于加性相似度函数的双路径注意力框架:一方面通过Query - Key向量交互建立空间关联性,另一方面结合通道维度注意力权重实现多维特征筛选.这种双重约束机制既保证了特征表达的丰富性,又有效控制了模型复杂度.其数学表达式详见公式(1)公式(2).

Sim(Q,K)=Φ(Q)+Φ(K).
Φ(Q)=C(S(Q)).

其中Φ()为上下文映射函数,用于提取特征的重要性权重;S(Q)C(S(Q))分别表示空间注意力和通道注意力机制,其计算公式如式(3)式(4)所示.

S(Q)=SigmoidConv3×3(Q).
C(S(Q))=SigmoidFC(AvgPool(S(Q))).

得到空间注意力S(Q)和通道注意力C(S(Q))后,CAS 会使用加性相似度函数对QK的特征进行融合.如式(5)所示.

O=Γ(Sim(Q,K))V.

其中V表示值(Value),Γ()为线性变换,用于整合上下文信息.

2.2 SimAM注意力机制

本文引入了SimAM注意力机制,该机制基于自我信息最大化策略,通过动态增强特征图中的关键区域,在复杂背景下的小目标检测任务中展现出显著优势.YOLOv8架构中,SPPF(spatial pyramid pooling fast)层原本通过多尺度池化操作实现跨尺度特征融合,从而提升模型对多尺度目标的识别能力.然而,受限于其结构设计,该模块在实际应用中存在2个关键缺陷:(1)多尺度池化可能导致特征冗余;(2)注意力聚焦能力不足,尤其在处理小目标或复杂场景时,易造成关键细节信息的丢失.针对这一局限性,本文提出将SimAM机制嵌入SPPF模块输出端,通过优化特征表达路径强化关键区域建模能力.

引入SimAM的目的是为了提升YOLOv8在复杂场景下的检测性能.具体而言,该机制通过自适应特征增强策略,使模型能够更精准地聚焦于小目标区域,从而将检测精度提升至新高度;其动态权重分配机制可实时调整特征图各空间位置的权重分布,有效抑制冗余信息干扰,使模型对关键视觉线索的敏感度显著增强;此外,SimAM采用轻量化设计架构,在几乎不增加计算负载的前提下,实现了检测性能与稳定性双重优化.

2.3 DyHead 模块

在目标检测任务中,尽管YOLOv8原有的检测头部具备较高的计算效率,但其结构设计仍存在若干局限性.为此,本研究提出在YOLOv8的检测头部引入DyHead(dynamic head)模块.DyHead通过动态路由机制自适应地调整各特征层的重要性权重,实现信息的有效整合与优化,同时增强了模型在多尺度条件下的特征提取能力,可提升对目标的空间位置及其语义信息的理解深度,从而显著改善整体检测性能25.它的核心设计理念在于融合动态路由与注意力机制,以统一框架处理尺度感知、空间结构以及任务特性.具体而言,该模块针对输入特征张量FRL×S×C(其中LSC分别表示特征的尺度、空间位置和通道维度),依次通过以下3个子模块逐步优化特征表达:

1) 尺度感知注意力模块(scale - aware attention, πL·

尺度感知模块为不同尺度的特征分配动态权重,增强模型对多尺度目标的适应能力.具体计算公式如式(6)所示.

FL=πLF=σWL*F.

其中,WL表示动态生成的尺度感知权重,*为卷积操作,σ表示激活函数.

2) 空间感知注意力模块(spatial - aware attention,πS·

空间感知模块对特征图中的每个位置进行动态加权,突出关键信息区域,同时抑制背景噪声.其计算公式如式(7)所示.

FS=πSFL=SoftmaxQSKSVS.

其中,QSKSVS分别表示特征图的查询、键和值矩阵,Softmax操作确保权重归一化.

3) 任务感知注意力模块(task-aware attention, πC·

任务感知模块为分类和回归任务分配不同的特征权重,从而优化两种任务的性能.其计算公式如式(8)所示.

FC=πCFS=σWC*FS.

其中,WC为任务特定的权重.

DyHead模块通过上述3个注意力模块的顺序叠加,动态优化输入特征,最终得到优化后的输出,计算公式如式(9)所示.

Fout=πCπSπLF.

2.4 小目标检测层P2

小目标检测在复杂场景下面临严峻挑战.YOLOv8虽引入FPN结构以增强多尺度识别能力,但在处理特征模糊、尺寸微小的目标时仍存在明显盲区26.为此,本文在检测头部新增P2层,专门强化小目标的特征建模能力.该层直接作用于网络前端输出的高分辨率浅层特征图——因其保留了更丰富的空间细节与纹理信息,成为捕捉小目标的关键来源27.

P2层通过3阶段机制实现特征优化.首先,采用卷积模块对输入特征进行初步增强,在提升小目标表达能力的同时有效抑制噪声干扰.紧接着,针对浅层特征语义抽象能力不足的问题,提出跨层次特征融合策略:将深层网络提取的高级语义特征上采样后,与浅层特征在通道维度拼接,使高分辨率细节与高层语义形成互补.这样不仅弥补了单一层次特征的信息缺失,也显著提升了模型在复杂背景中对小目标的感知与判别能力.

3 实验结果与分析

3.1 实验数据集

采用VisDrone2019数据集作为实验的数据来源,是目前主流的用于无人机视角下目标检测与跟踪任务的基准数据集之一.该数据集由天津大学AISKYEYE团队发布,包含复杂场景下的多目标检测与分类任务.使用的VisDrone2019数据集共包含10 209张图像,其中训练集包含6 471张图像,验证集包含578张图像,测试集包含3 190张图像,约260万个目标实例.数据集目标类别包括行人、骑行者、车辆等共计10类.

3.2 实验环境及参数配置

本文采用ubuntu22.04操作系统作为测试平台,实验采用Python3.9作为语言环境、Pytorch2.2作为深度学习框架.实验所用计算机GPU为RTX 3090,CUDA版本为12.1 CPU为Intel(R) Xeon(R) Platinum 8362,24 GB运行内存.实验参数的批量大小为16,训练轮数为300,线程数量为8,学习率为0.001,动量因子设置为0.937,衰减系数设置为0.000 5,输入图片尺寸为640 × 640,选择SGD作为优化器.训练从0开始,不采用任何预训练权重.

3.3 实验评价指标

为了全面评估改进模型的性能,本文选用准确率(precision,P)、召回率(recall,R)、平均精度均值(mAP)、模型参数量(params)和模型大小(mb)作为评价指标.

准确率(rrecision)是指模型预测为正类的样本中,实际为正类的比例;召回率(recall)则反映了模型识别出所有真实正类样本的能力.mAP(mean average precision)表示所有类别平均精度(AP)的平均值.其中,mAP@50表示在交并比(IoU)阈值设为0.5时计算得到的平均精度均值.上述各指标的具体数学表达式如公式(10)、(11)和(12)所示:

P=TPTP+FP.
R=TPTP+FN.
mAP=1ni=1n01P(R)dR.

其中,TP表示正确预测的正样本个数;FN表示实际是正样本但错误预测为负样本的个数;FP表示实际是负样本但预测为正样本的个数;TN表示正确将负样本判断为负样本的个数.模型的参数量反映模型的大小,随模型结构的规模增大而增加.

3.4 实验结果及分析

3.4.1 注意力机制对比实验

对几种不同的注意力机制开展了对比实验,具体包括EMA、SimAM、LSKA、CAA、EffectiveSEModule和DAttention,以探讨这些机制在目标检测任务中的表现差异.实验结果表明,各个机制在PR、mAP等指标上存在一定的差距,进而影响了目标检测模型的整体性能,如表1所示.

表1中可以看到,SimAM在准确率(0.460)、mAP@50(0.332)及mAP@50∶95(0.193)3项关键指标上均占据绝对优势.这一表现凸显了其在特征增强方面的独特能力,尤其对微小目标的识别效率显著提升.相比之下,DAttention虽在准确率上略逊一筹,但其召回率(0.336)展现出多任务场景下的平衡性优势,在复杂背景中仍能保持稳定的小目标检测能力.CAA与EffectiveSEModule的性能呈现微弱差距,准确率分别为0.443和0.444,二者在精度稳定性上表现均衡,但整体效能未达SimAM与DAttention的水平.值得注意的是,EMA机制在本任务中的表现最为薄弱,其准确率与召回率均低于其他方法,暴露出特征提取能力的局限性.这种性能差异可能源于EMA对上下文信息的建模不足,导致关键特征被稀释.最终,基于实验数据的显著优势,SimAM被确立为最具潜力的注意力机制改进方案.

3.4.2 模型消融实验

为了验证各个模块及其组合对原有模型性能的提升效果,本文设计了消融实验.在原有模型的基础上,逐步引入不同改进措施并进行实验,实验结果见表2.

模型A为YOLOv8n基准模型,未加入任何改进措施,性能较低.模型B引入SimAM模块后,精确率略有提升至0.460,但在其他指标上的变化不大.模型C引入C2f_CAS模块,精确率提升至0.460,mAP@50∶95略有改进,但性能提升有限.模型D结合了SimAM和C2f_CAS模块,精确率和mAP@50∶95进一步提升,表现优于模型C.模型E在D的基础上加入DyHead模块,精确率、召回率和mAP均有提升,尤其在小目标检测上表现更好.模型F将SimAM、C2f_CAS和DyHead组合后,精确率和mAP@50进一步提升.最终,模型G结合了所有改进模块,相较原始模型A,模型G的精确率、召回率、mAP@50和mAP@50∶95分别提升了10.1、8.1、10.2和6.7个百分点.

3.4.3 对比实验

为了评估本文改进算法的性能,在同样的数据集和实验环境下,将本文算法模型与目前主流的YOLO系列算法进行对比,实验结果见表3.

表3的结果显示,YOLOv8 - CAS在多项性能指标上均展现出显著的优势.其中P达到0.545,R为0.417.与YOLOv8n模型相比,在参数量略微增加的情况下,YOLOv8 - CAS的mAP@50和mAP@50∶95分别提高了10.2%和6.7%;相较于PVswin - Yolov8s,YOLOv8 - CAS模型在精度基本持平且参数量锐减72.7%的前提下,不仅实现mAP@50指标0.4%的提升,同时将模型体积压缩63.4%,展现出更优的精度 - 效率平衡特性.

为系统评估 YOLOv8 - CAS 与原始模型在各类目标检测任务中的性能差异,本文对两者的mAP@50指标进行了统计分析,相关结果如图7所示.其中,图3(a)与3(b)分别对应原始模型与YOLOv8 - CAS的检测输出,数据对比揭示,YOLOv8 - CAS在所有检测类别中均显著超越原始模型,复杂场景下的性能增益尤为突出.面对小目标检测、遮挡干扰及目标重叠等挑战性任务时,YOLOv8 - CAS展现出卓越的鲁棒性与环境适应力.具体而言,“行人”类目标的mAP@50提升了24.1%,“人群”类目标的mAP@50则提升了11.7%.这种性能跃迁不仅体现在单类目标的优化,更反映出模型对复杂环境的全局适应能力.实验结果印证了YOLOv8 - CAS在复杂环境、微小目标及高密度遮挡场景中的检测稳定性,其泛化能力与工程应用价值得到显著提升.

3.4.4 改进算法可视化分析

在VisDrone2019 的测试集中进行可视化对比,图4为部分可视化结果展示,其中第1列为原始图片,第2列为YOLOv10n的检测结果,第3列为本文模型的检测结果.在第一行远距离视角的场景中,YOLOv10n出现了漏检现象,没有检测到图像左边围栏旁边的电动车和树荫下的红色轿车;第二行在车辆重叠的情况下没有检测到绿色轿车后面的红色轿车,在车辆密集的图像右侧也存在些许漏检;在第四行对只被遮挡对象进行检测时,本文算法相较YOLOv10n算法也能正确检测到目标.

4 结语

针对目标检测任务中的小目标检测、复杂背景下的目标特征表达及多尺度融合问题,提出了一种改进的YOLOv8 - CAS算法模型.通过引入卷积加性自注意力机制CAS构造C2f_CAS模块、SimAM注意力机制、DyHead检测头以及小目标检测层P2,本文从模型的特征提取能力、多尺度融合和注意力机制的优化等多方面对原始YOLOv8算法进行了提升.

实验结果表明,YOLOv8 - CAS在VisDrone数据集上的多项性能指标上均表现出显著的优势.其中,mAP@50和mAP@50∶95分别较YOLOv8n提升了10.2和6.7个百分点,较YOLOv8s提升了4.1和2.3个百分点.此外,通过可视化对比分析,YOLOv8 - CAS在处理复杂场景的小目标检测以及被遮挡目标检测任务中展现了很好的鲁棒性与准确性,能够更好地适应无人机目标检测等实际场景的需求.

参考文献

[1]

王正科,李来金.智能无人机遥感技术概述及其在农业植保中的广泛应用[J].种子世界2025(2):126 - 128.

[2]

ZEGGADA AMELGANI FBAZI Y. A deep learning approach to UAV image multilabeling[J]. IEEE Geoscience and Remote Sensing Letters201714(5):694 - 698.

[3]

SUN KLI DSONG Y. Improved multi - scale small target detection by UAV[J]. Multimedia Tools and Applications202584(22):24789 - 24803.

[4]

REN SHE KGIRSHICK Ret al. Faster R - CNN: towards real - time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence201639(6):1137 - 1149.

[5]

CHENG BWEI YSHI Het al. Revisiting rcnn: on awakening the classification power of faster rcnn[C]//Proceedings of the European conference on computer vision (ECCV), 2018(v1): 453 - 468.

[6]

ZHAO LLI S. Object detection algorithm based on improved YOLOv3[J]. Electronics20209(3):537.

[7]

KIM J HKIM NPARK Y Wet al. Object detection and classification based on YOLO - V5 with improved maritime dataset[J]. Journal of Marine Science and Engineering202210(3):377.

[8]

WANG GCHEN YAN Pet al. UAV - YOLOv8: a small - object - detection model based on improved YOLOv8 for UAV aerial photography scenarios[J]. Sensors202323(16):7190.

[9]

HU JSHEN LSUN G. Squeeze - and - excitation networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition, 2018: 7132 - 7141.

[10]

WOO S, PARK JLEE J Yet al. Cbam: convolutional block attention module[C]//Proceedings of the European conference on computer vision (ECCV), 2018:3 - 19.

[11]

范江霞,张文豪,张丽丽,.改进YOLOv5的无人机影像车辆检测方法[J].遥感信息202338(3):114 - 121.

[12]

潘玮,韦超,钱春雨,.面向无人机视角下小目标检测的YOLOv8s改进模型[J].计算机工程与应用202460(9):142 - 150.

[13]

梁秀满,赵佳阳,于海峰.基于YOLOv8的轻量化水下目标检测算法[J].红外技术202446(9):1015 - 1024.

[14]

李岩超,史卫亚,冯灿.面向无人机航拍小目标检测的轻量级YOLOv8检测算法[J].计算机工程与应用202460(17):167 - 178.

[15]

沈学利,王灵超.基于YOLOv8n的无人机航拍目标检测[J].计算机系统应用202433(7):139 - 148.

[16]

ZHANG TLI LZHOU Yet al. Cas - vit: convolutional additive self - attention vision transformers for efficient mobile applications[J]. arXiv preprint arXiv:2024.

[17]

YANG LZHANG R YLI Let al. Simam: a simple, parameter - free attention module for convolutional neural networks[C]//International conference on machine learning. PMLR, 2021:11863 - 11874.

[18]

DAI XCHEN YXIAO Bet al. Dynamic head: unifying object detection heads with attentions[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2021:7373 - 7382.

[19]

ZHU PWEN LDU Det al. Detection and tracking meet drones challenge[J]. IEEE transactions on pattern analysis and machine intelligence202144(11):7380 - 7399.

[20]

张利丰,田莹.改进YOLOv8的多尺度轻量型车辆目标检测算法[J].计算机工程与应用202460(3):129 - 137.

[21]

张秀再,沈涛,许岱.基于改进YOLOv8算法的遥感图像目标检测[J].激光与光电子学进展202461(10):298 - 308.

[22]

张德银,赵志恒,谢逸戈,.基于改进YOLOv8的遥感图像飞机目标检测研究[J].自动化应用202465(2):193 - 195.

[23]

赵志宏,郝子晔.改进YOLOv8的航拍小目标检测方法:CRP - YOLO[J].计算机工程与应用202460(13):209 - 218.

[24]

孙佳宇,徐民俊,张俊鹏,.优化改进YOLOv8无人机视角下目标检测算法[J].计算机工程与应用202561(1):109 - 120.

[25]

DAI XCHEN YXIAO Bet al. Dynamic head: unifying object detection heads with attentions[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2021:7373 - 7382.

[26]

王斌,徐洪华,孙兜成,.基于YOLOv8算法改进的小目标交通标志检测[J].计算机应用202444(S2):274 - 279.

[27]

齐向明,严萍萍,姜亮.基于YOLOv8n的航拍图像小目标检测算法[J].计算机工程与应用202460(24):200 - 210.

基金资助

国家自然科学基金(62165019)

云南省中青年学术和技术带头人后备人才项目(202305AC160084)

AI Summary AI Mindmap
PDF (2280KB)

248

访问

0

被引

详细

导航
相关文章

AI思维导图

/