基于ATMADDPG算法的多水面无人航行器编队导航

王思琪, 关巍, 佟敏, 赵盛烨

吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (04) : 588 -599.

PDF
吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (04) : 588 -599. DOI: 10.19292/j.cnki.jdxxp.20240605.001

基于ATMADDPG算法的多水面无人航行器编队导航

    王思琪, 关巍, 佟敏, 赵盛烨
作者信息 +

Author information +
文章历史 +
PDF

摘要

为提高多无人船编队系统的导航能力,提出了一种基于注意力机制的多智能体深度确定性策略梯度(ATMADDPG:Attention Mechanism based Multi-Agent Deep Deterministic Policy Gradient)算法。该算法在训练阶段,通过大量试验训练出最佳策略,并在实验阶段直接使用训练出的最佳策略得到最佳编队路径。仿真实验将4艘相同的“百川号”无人船作为实验对象。实验结果表明,基于ATMADDPG算法的队形保持策略能实现稳定的多无人船编队导航,并在一定程度上满足队形保持的要求。相较于多智能体深度确定性策略梯度(MADDPG:Multi-Agent Depth Deterministic Policy Gradient)算法,所提出的ATMADDPG算法在收敛速度、队形保持能力和对环境变化的适应性等方面表现出更优越的性能,综合导航效率可提高约80%,具有较大的应用潜力。

关键词

多无人船编队导航 / MADDPG算法 / 注意力机制 / 深度强化学习

Key words

引用本文

引用格式 ▾
基于ATMADDPG算法的多水面无人航行器编队导航[J]. 吉林大学学报(信息科学版), 2024, 42(04): 588-599 DOI:10.19292/j.cnki.jdxxp.20240605.001

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

61

访问

0

被引

详细

导航
相关文章

AI思维导图

/