用于移动机器人路径规划的改进强化学习算法

张威; 初泽源; 杨玉涛; 王伟

中国民航大学学报 ›› 2024, Vol. 42 ›› Issue (05) : 59 -65.

张威, 初泽源, 杨玉涛, 王伟

作者信息 +

Author information +

文章历史 +

PDF (835K)

摘要

针对传统Q-learning算法规划出的路径存在平滑度差、收敛速度慢以及学习效率低的问题，本文提出一种用于移动机器人路径规划的改进Q-learning算法。首先，考虑障碍物密度及起始点相对位置来选择动作集，以加快Q-learning算法的收敛速度；其次，为奖励函数加入一个连续的启发因子，启发因子由当前点与终点的距离和当前点距地图中所有障碍物以及地图边界的距离组成；最后，在Q值表的初始化进程中引入尺度因子，给移动机器人提供先验环境信息，并在栅格地图中对所提出的改进Q-learning算法进行仿真验证。仿真结果表明，改进Q-learning算法相比传统Q-learning算法收敛速度有明显提高，在复杂环境中的适应性更好，验证了改进算法的优越性。