基于深度强化学习的无人驾驶船舶避碰行为决策方法

关巍, 罗文哲, 崔哲闻

大连海事大学学报 ›› 2024, Vol. 50 ›› Issue (01) : 11 -19.

PDF (11621KB)
大连海事大学学报 ›› 2024, Vol. 50 ›› Issue (01) : 11 -19. DOI: 10.16411/j.cnki.issn1006-7736.2024.01.002

基于深度强化学习的无人驾驶船舶避碰行为决策方法

    关巍, 罗文哲, 崔哲闻
作者信息 +

Author information +
文章历史 +
PDF (11899K)

摘要

为解决无人驾驶船舶的多船避碰问题,结合船舶领域知识、国际海上避碰规则(COLREGs)及船舶操纵特性,提出一种基于深度确定性策略梯度(DDPG)算法的多船会遇避碰行为决策方法。采用门控循环单元(GRU)构建神经网络模型,并进行层归一化处理,可有效处理高维观测数据,提高了行为决策的效率。本文设计的奖励函数符合国际海上避碰规则,并考虑了尽量使用小舵角进行避让的船舶操纵习惯。多船会遇的仿真实验验证了本文避碰决策方法在灵活性和有效性方面的优势。

关键词

多船避碰 / 行为决策 / 国际海上避碰规则(COLREGs) / 深度强化学习 / 门控循环单元(GRU)

Key words

引用本文

引用格式 ▾
基于深度强化学习的无人驾驶船舶避碰行为决策方法[J]. 大连海事大学学报, 2024, 50(01): 11-19 DOI:10.16411/j.cnki.issn1006-7736.2024.01.002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (11621KB)

244

访问

0

被引

详细

导航
相关文章

AI思维导图

/