基于深度强化学习算法的多无人水面航行器编队构造

关巍, 张诚, 崔哲闻, 韩虎生

大连海事大学学报 ›› 2025, Vol. 51 ›› Issue (01) : 11 -20+42.

PDF (20258KB)
大连海事大学学报 ›› 2025, Vol. 51 ›› Issue (01) : 11 -20+42. DOI: 10.16411/j.cnki.issn1006-7736.2025.01.002

基于深度强化学习算法的多无人水面航行器编队构造

    关巍, 张诚, 崔哲闻, 韩虎生
作者信息 +

Author information +
文章历史 +
PDF (20744K)

摘要

针对传统多智能体深度确定性策略梯度算法(MADDPG)收敛速度较慢的问题,本文通过在值函数阶段引入注意力机制来提升多无人水面航行器系统编队决策模型的收敛速度,并通过编队模型与编队避碰和编队构造奖励函数的配合,提升了多无人水面航行器完成编队构造任务的效率。仿真结果验证了本文方法可有效完成多种环境下的多无人水面航行器编队构造任务,为未来多无人船编队构造应用提供了理论研究基础。

关键词

多无人水面航行器 / 编队构造 / MADDPG算法 / 深度强化学习 / 注意力机制

Key words

引用本文

引用格式 ▾
基于深度强化学习算法的多无人水面航行器编队构造[J]. 大连海事大学学报, 2025, 51(01): 11-20+42 DOI:10.16411/j.cnki.issn1006-7736.2025.01.002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (20258KB)

159

访问

0

被引

详细

导航
相关文章

AI思维导图

/