基于深度强化学习的AUV路径规划研究

张一博, 高丙朋

东北师大学报(自然科学版) ›› 2025, Vol. 57 ›› Issue (01) : 53 -62.

PDF
东北师大学报(自然科学版) ›› 2025, Vol. 57 ›› Issue (01) : 53 -62. DOI: 10.16163/j.cnki.dslkxb202312260002

基于深度强化学习的AUV路径规划研究

    张一博, 高丙朋
作者信息 +

Author information +
文章历史 +
PDF

摘要

对于海洋环境下的自主水下航行器(AUV)路径规划,除了规划路径长度和安全避障外,还需要关注洋流对规划路径的影响.因此,提出了改进的D3QN路径规划算法.首先将包含洋流信息的连续状态序列输入LSTM中,提取状态随时间变化规律及洋流对AUV移动的影响;其次设计综合奖励函数,同时考虑路径长度、避障、步数和利用洋流降低能耗不同因素;最后为了能学习到更长期的规划和探索,采用N-step TD更新网络参数.仿真实验结果表明,所提算法在考虑避障和利用洋流双重作用的路径规划任务中,具有高效的路径规划能力.

关键词

强化学习 / 路径规划 / 自主式水下航行器 / LSTM / D3QN

Key words

引用本文

引用格式 ▾
基于深度强化学习的AUV路径规划研究[J]. 东北师大学报(自然科学版), 2025, 57(01): 53-62 DOI:10.16163/j.cnki.dslkxb202312260002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

254

访问

0

被引

详细

导航
相关文章

AI思维导图

/