改进DDPG导航实现的双机器人编队在限制区域内的运输

汤亮, 牛一森, 马荣庚

重庆理工大学学报(自然科学版) ›› 2025, Vol. 39 ›› Issue (11) : 130 -137.

PDF
重庆理工大学学报(自然科学版) ›› 2025, Vol. 39 ›› Issue (11) : 130 -137.

改进DDPG导航实现的双机器人编队在限制区域内的运输

    汤亮, 牛一森, 马荣庚
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对机器人编队在协同运输中出现导航路径不佳,以及编队通过狭窄区域时出口被挡住无法驶离的问题,提出一种基于深度确定性策略梯度(deep deterministic policy gradient, DDPG)的优化导航方法,实现领航者-跟随者双机器人编队在完成杆件物体搬运任务中生成优化的导航路径,同时设计DDPG的调换决策奖励函数,解决编队通过狭窄区域时出口被挡无法驶离的问题。首先,在DDPG网络中优化奖励函数模块,设计调换决策奖励机制,训练编队的导航能力;其次,采用无迹卡尔曼滤波(untraced Kalman filter, UKF)估计编队位置状态实现跟随者轨迹跟踪;最后,在随机环境中对比A*-DWA和RRT*算法轨迹,基于DDPG实现的轨迹平均角度分别降低了64.03%和38.65%。另外,在多任务环境的实物实验结果表明,训练后的DDPG导航算法在多任务环境下能够实现自主离开调头限制区域,并且对狭窄通道具有适应性,同时减小编队碰撞率。

关键词

移动机器人导航 / 双机器人运输 / 深度确定性策略梯度 / 限制环境区域 / 避障

Key words

引用本文

引用格式 ▾
改进DDPG导航实现的双机器人编队在限制区域内的运输[J]. 重庆理工大学学报(自然科学版), 2025, 39(11): 130-137 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

57

访问

0

被引

详细

导航
相关文章

AI思维导图

/