PDF
摘要
针对单连杆柔性关节机械臂系统,提出了一种基于强化学习策略的优化反步跟踪控制方法。首先,在每个反步步骤中利用Actor-critic结构来执行强化学习策略,进而得到每个子系统的最优虚拟控制器,最终得到系统的最优控制器。然后基于设定的李雅普诺夫函数,推导出单连杆柔性关节机械臂系统的所有信号是有界的,证明了所设计控制方法的稳定性。最后,仿真实验验证了基于强化学习策略的优化反步跟踪控制在单连杆柔性关节机械臂系统中的有效性。
关键词
强化学习
/
单连杆柔性关节机械臂
/
稳定性分析
Key words
单连杆柔性关节机械臂系统的优化反步跟踪控制[J].
聊城大学学报(自然科学版), 2026, 39(2): 183-191 DOI:10.19728/j.issn1672-6634.2025070001