PDF
摘要
针对民族服饰检测中模型精度与轻量化难以协同优化、粒度特征识别不足等问题,本文提出了一种改进YOLO v11n的民族服饰检测方法。首先,创新性设计了一种轻量型的上下文锚点注意力高级筛选路径聚合网络(context anchor attention-high-level screening path aggregation network, CAA-HSPAN),其核心机制是通过上下文锚点注意力机制捕捉特征间长距离依赖关系,同时结合双向路径聚合策略提升跨尺度特征融合能力。其次,引入动态上采样(dynamic sampling, DySample)模块,通过动态学习偏移量优化特征图重构过程,解决固定插值采样导致的特征图边缘失真问题,显著提升服饰纹样等细节的定位精度。最后,构建轻量级的C3k2RVB(C3k2-RepViT Block)模块,通过重参数化技术融合多分支结构,减少计算冗余并增强民族服饰特有的复杂纹理特征提取能力。实验结果表明,相较基准模型YOLO v11n(258万参数,6.3 G FLOPs),改进模型在民族服饰数据集NFD-5上平均精度值mAP@0.5提高了2.0%,参数量Params下降了24.8%,计算量FLOPs降低至5.8 G FLOPs,有效解决了民族服饰检测轻量化部署与细粒度识别难题,为民族服饰数字化保护提供了关键技术支撑。
关键词
Key words
基于改进YOLO v11n的轻量级民族服饰检测算法[J].
北京服装学院学报(自然科学版), 2025, 45(04): 84-96 DOI:10.16454/j.cnki.issn.1001-0564.2025.04.010