基于MATD3算法的多智能体避碰控制

郭雷; 梁成庆

doi:10.16339/j.cnki.jsjsyzdh.202401002

计算技术与自动化 ›› 2024, Vol. 43 ›› Issue (01) : 9 -15. DOI: 10.16339/j.cnki.jsjsyzdh.202401002

基于MATD3算法的多智能体避碰控制

郭雷, 梁成庆

作者信息 +

Author information +

文章历史 +

PDF

摘要

使用多智能体双延迟深度确定性策略梯度(Multi-agent Twin Delayed Deep Deterministic Policy Gradient, MATD3)算法研究了多无人机的避障和到达目标点问题，首先，利用MATD3算法的优越性提高训练效率。其次，基于人工势场法的思想设计了稠密碰撞奖励函数，使得智能体在没有找到最优解决方案时也能得到积极的反馈，加快学习速度。最后，在仿真实验阶段，通过设计的三组对比实验和泛化实验验证了算法的有效性。