基于混合CNN-Transformer的堆垛纸箱检测方法

肖志涛, 王宇

天津工业大学学报 ›› 2026, Vol. 45 ›› Issue (2) : 94 -100.

PDF
天津工业大学学报 ›› 2026, Vol. 45 ›› Issue (2) : 94 -100.

基于混合CNN-Transformer的堆垛纸箱检测方法

    肖志涛, 王宇
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对卷积神经网络(CNN)多层卷积和池化操作导致的空间信息处理不足和全局上下文信息缺乏的问题,提出了一种基于CNN与Transformer的多尺度密集堆垛纸箱检测方法。设计特征提取融合模块,结合窗口自注意力机制,增强模型对全局特征的建模能力;引入跨尺度连接,融合更多不同层级的语义信息,使模型具备更大的感受野和更好的特征融合能力;提出BoxIoU损失函数用于边界框回归,通过计算边界框的最小点距和宽高比评估边界框相似性,提高模型的检测精度。实验结果表明:在密集堆垛纸箱数据集(SCD)上,该方法的mAP50达到了99.36%,mAP50-95达到了95.09%,具有良好的检测性能以及泛化能力。

关键词

深度学习 / 堆垛纸箱 / 目标检测 / 自注意力机制

Key words

引用本文

引用格式 ▾
基于混合CNN-Transformer的堆垛纸箱检测方法[J]. 天津工业大学学报, 2026, 45(2): 94-100 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/