基于强化学习的冠豪猪优化算法

卢宇; 刘昊

doi:10.13988/j.ustl.2025.05.006

辽宁科技大学学报 ›› 2025, Vol. 48 ›› Issue (5) : 358 -373. DOI: 10.13988/j.ustl.2025.05.006

基于强化学习的冠豪猪优化算法

卢宇, 刘昊

作者信息 +

Author information +

文章历史 +

PDF

摘要

冠豪猪优化算法具有原理简单、搜索能力强等优点，但存在随机性大、收敛精度不足和参数可调整性差的问题。为提升冠豪猪优化算法的性能，本文提出了一种改进算法RLCPO。该算法使用自适应状态因子判断探索与开采阶段，利用强化学习精确指导动作，以提升算法的收敛速度和精度。通过均衡学习策略，改变个体更新方向，降低陷入局部最优的风险。并加入自适应收敛因子，判断算法是否陷入局部最优，引入双向逃逸算子帮助算法跳出局部最优，增加种群的多样性。通过CEC2022基准测试函数实验，验证了RLCPO的有效性，与十三种对比算法相比，RLCPO具有更好的收敛性和更可靠的稳定性。Wilcoxon符号秩检验和Friedman检验进一步证实了RLCPO的竞争优势，为解决复杂优化问题提供了有力工具。