基于单目相机的复杂场景深度估计网络

陈占国, 陈振军, 薛晨霞, 王国亮, 李金峄, 李玉廷, 于保才

辽宁工程技术大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 505 -512.

PDF
辽宁工程技术大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 505 -512.

基于单目相机的复杂场景深度估计网络

    陈占国, 陈振军, 薛晨霞, 王国亮, 李金峄, 李玉廷, 于保才
作者信息 +

Author information +
文章历史 +
PDF

摘要

为提升复杂多变场景下深度估计的精度,提出一种基于U型编码器-解码器的单目深度估计网络。采用Swin Transformer架构作为编码器核心,实现对输入数据多层级、多尺度的精细化特征提取。采用逐层扩张卷积提取多尺度局部特征,通过特征交互模块交互局部和全局特征,实现对复杂场景的更全面理解。采用对称式Transformer解码器并结合图像块扩展层将相邻维度的特征图重塑为更高分辨率的特征图,最终输出像素级深度预测结果。在NYU Depth v2数据集和KITTI数据集上进行定量实验。研究结果表明:该网络在复杂多变场景中具有高效性和实用性。研究方法突破了传统方法在复杂多变场景下的局限性,为深度估计的理论研究提供新的视角和方法。

关键词

单目深度估计 / U型编码器-解码器 / 逐层扩张卷积 / 特征交互模块 / 对称式Transformer解码器

Key words

引用本文

引用格式 ▾
基于单目相机的复杂场景深度估计网络[J]. 辽宁工程技术大学学报(自然科学版), 2025, 44(04): 505-512 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

111

访问

0

被引

详细

导航
相关文章

AI思维导图

/