基于强化学习的仿蠕虫机器人驱动排布优化研究

俞云潇, 张舒

动力学与控制学报 ›› 2025, Vol. 23 ›› Issue (10) : 35 -44.

PDF
动力学与控制学报 ›› 2025, Vol. 23 ›› Issue (10) : 35 -44.

基于强化学习的仿蠕虫机器人驱动排布优化研究

    俞云潇, 张舒
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对多单元仿蠕虫机器人驱动优化问题,本文提出了一种基于强化学习的智能配置方法.首先建立多单元仿蠕虫机器人的动力学模型,并将驱动排布问题形式化为马尔可夫决策过程.通过设计多重离散动作空间,显著降低了计算成本.提出融合运动速度和能耗约束的奖励函数,有效平衡了探索与开发矛盾.针对驱动器受限条件,提出的动作掩蔽机制实现了硬性约束下的高效策略搜索.研究发现:(1)全驱动时中部对称激活最优;(2)约束条件下呈现“后部优先、向心聚集”的排布规律.

关键词

仿蠕虫机器人 / 驱动优化 / 强化学习 / 动作掩码 / 多单元系统

Key words

引用本文

引用格式 ▾
基于强化学习的仿蠕虫机器人驱动排布优化研究[J]. 动力学与控制学报, 2025, 23(10): 35-44 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

51

访问

0

被引

详细

导航
相关文章

AI思维导图

/