基于强化学习的冠豪猪优化算法

卢宇, 刘昊

辽宁科技大学学报 ›› 2025, Vol. 48 ›› Issue (5) : 358 -373.

PDF
辽宁科技大学学报 ›› 2025, Vol. 48 ›› Issue (5) : 358 -373. DOI: 10.13988/j.ustl.2025.05.006

基于强化学习的冠豪猪优化算法

    卢宇, 刘昊
作者信息 +

Author information +
文章历史 +
PDF

摘要

冠豪猪优化算法具有原理简单、搜索能力强等优点,但存在随机性大、收敛精度不足和参数可调整性差的问题。为提升冠豪猪优化算法的性能,本文提出了一种改进算法RLCPO。该算法使用自适应状态因子判断探索与开采阶段,利用强化学习精确指导动作,以提升算法的收敛速度和精度。通过均衡学习策略,改变个体更新方向,降低陷入局部最优的风险。并加入自适应收敛因子,判断算法是否陷入局部最优,引入双向逃逸算子帮助算法跳出局部最优,增加种群的多样性。通过CEC2022基准测试函数实验,验证了RLCPO的有效性,与十三种对比算法相比,RLCPO具有更好的收敛性和更可靠的稳定性。Wilcoxon符号秩检验和Friedman检验进一步证实了RLCPO的竞争优势,为解决复杂优化问题提供了有力工具。

关键词

强化学习 / 自适应收敛因子 / 自适应状态因子 / 均衡学习 / 双向逃逸算子

Key words

引用本文

引用格式 ▾
基于强化学习的冠豪猪优化算法[J]. 辽宁科技大学学报, 2025, 48(5): 358-373 DOI:10.13988/j.ustl.2025.05.006

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/