PillarTNet:基于Transformer的三维目标检测模型

韩建栋, 苏佳

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (09) : 2168 -2175.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (09) : 2168 -2175. DOI: 10.20009/j.cnki.21-1106/TP.2024-0358

PillarTNet:基于Transformer的三维目标检测模型

    韩建栋, 苏佳
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性.

关键词

三维目标检测 / 点云 / Transformer / 双重注意力融合 / 空体素关注

Key words

引用本文

引用格式 ▾
PillarTNet:基于Transformer的三维目标检测模型[J]. 小型微型计算机系统, 2025, 46(09): 2168-2175 DOI:10.20009/j.cnki.21-1106/TP.2024-0358

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

50

访问

0

被引

详细

导航
相关文章

AI思维导图

/