基于改进TD3算法的机器人路径规划

方立平, 陈远明, 杨哲, 谭德坤

齐鲁工业大学学报 ›› 2024, Vol. 38 ›› Issue (04) : 1 -9.

PDF
齐鲁工业大学学报 ›› 2024, Vol. 38 ›› Issue (04) : 1 -9. DOI: 10.16442/j.cnki.qlgydxxb.2024.04.001

基于改进TD3算法的机器人路径规划

    方立平, 陈远明, 杨哲, 谭德坤
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对机器人路径规划中深度强化学习方法训练时间长、收敛速度慢的问题,提出一种改进双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient, TD3)。该算法引入人工势场中的引力场和斥力场优化TD3的奖励函数,引导机器人合理的避开障碍物前往目标点,从而提高算法的收敛速度和准确率;同时运用运动约束规则对机器人的运动方向进行约束,使得运动轨迹更加平滑流畅。仿真实验结果表明,在多障碍物环境中,所提算法能有效地使机器人避开障碍物并规划出合理的路径。与其他方法相比,改进后的算法规划成功率更高,规划路径更短。

关键词

机器人 / 路径规划 / TD3 / 人工势场 / 运动约束

Key words

引用本文

引用格式 ▾
基于改进TD3算法的机器人路径规划[J]. 齐鲁工业大学学报, 2024, 38(04): 1-9 DOI:10.16442/j.cnki.qlgydxxb.2024.04.001

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

211

访问

0

被引

详细

导航
相关文章

AI思维导图

/