基于MATD3算法的多智能体避碰控制

郭雷, 梁成庆

计算技术与自动化 ›› 2024, Vol. 43 ›› Issue (01) : 9 -15.

PDF
计算技术与自动化 ›› 2024, Vol. 43 ›› Issue (01) : 9 -15. DOI: 10.16339/j.cnki.jsjsyzdh.202401002

基于MATD3算法的多智能体避碰控制

    郭雷, 梁成庆
作者信息 +

Author information +
文章历史 +
PDF

摘要

使用多智能体双延迟深度确定性策略梯度(Multi-agent Twin Delayed Deep Deterministic Policy Gradient, MATD3)算法研究了多无人机的避障和到达目标点问题,首先,利用MATD3算法的优越性提高训练效率。其次,基于人工势场法的思想设计了稠密碰撞奖励函数,使得智能体在没有找到最优解决方案时也能得到积极的反馈,加快学习速度。最后,在仿真实验阶段,通过设计的三组对比实验和泛化实验验证了算法的有效性。

关键词

多智能体 / 强化学习 / 人工势场法 / 避障

Key words

引用本文

引用格式 ▾
基于MATD3算法的多智能体避碰控制[J]. 计算技术与自动化, 2024, 43(01): 9-15 DOI:10.16339/j.cnki.jsjsyzdh.202401002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

17

访问

0

被引

详细

导航
相关文章

AI思维导图

/