干扰生成对抗强化学习位置跟踪控制器

田大江, 吴志刚, 曾庆华, 叶宵宇, 任恩泽, 宋甫俊, 郭运伟

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (05) : 1032 -1041.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (05) : 1032 -1041. DOI: 10.20009/j.cnki.21-1106/TP.2024-0081

干扰生成对抗强化学习位置跟踪控制器

    田大江, 吴志刚, 曾庆华, 叶宵宇, 任恩泽, 宋甫俊, 郭运伟
作者信息 +

Author information +
文章历史 +
PDF

摘要

为应对环境变化和外界干扰下的四旋翼位置跟踪控制问题,本文提出了一种对抗强化学习方法以增强控制系统的鲁棒性.该方法通过引入干扰非线性动态逆转换弥补了现有对抗学习在干扰水平估计及多样性处理上的不足.研究首先构建了四旋翼的动力学模型和干扰生成模型,将位置跟踪问题转化为干扰抑制问题,再将其转换为迭代求解Hamilton-Jacobi-Bellman(HJB)方程的过程.采用HJB-PPO算法将四旋翼物理特性融入强化学习,精确估计价值函数,训练出适应多种干扰的鲁棒控制策略.本文通过数学证明确立了控制策略的稳定性和鲁棒性,最终通过鲁棒参数计算和非生成式干扰验证了所设计策略的有效性和优越性.

关键词

对抗强化学习 / 干扰生成 / 鲁棒性

Key words

引用本文

引用格式 ▾
干扰生成对抗强化学习位置跟踪控制器[J]. 小型微型计算机系统, 2025, 46(05): 1032-1041 DOI:10.20009/j.cnki.21-1106/TP.2024-0081

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

53

访问

0

被引

详细

导航
相关文章

AI思维导图

/