基于优先经验回放的生成式SAC算法及其应用

张伟, 李玉俊, 谢雯雯, 许耘嘉, 孙庚

吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (06) : 1713 -1722.

PDF
吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (06) : 1713 -1722. DOI: 10.13413/j.cnki.jdxblxb.2025064

基于优先经验回放的生成式SAC算法及其应用

    张伟, 李玉俊, 谢雯雯, 许耘嘉, 孙庚
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对传统柔性演员-评论家算法在探索能力和复杂环境中状态表征不足的问题,提出一种改进的柔性演员-评论家算法.首先,该算法通过引入优先经验回放机制,利用时序差分误差对经验样本进行动态优先级评估,从而提高关键经验的利用率,进而提升学习效率;其次,该算法将生成式Transformer架构集成到演员网络中以增强对状态特征的动态捕捉能力,从而显著提升其在复杂优化任务中的性能;最后,在高校后勤人员动态调度优化问题上进行应用实验.实验结果表明,与原始柔性演员-评论家算法及经典深度Q网络算法相比,改进的柔性演员-评论家算法在人力需求动态拟合方面误差更小,从而有效验证了其在实际应用中的优势和实用性.

关键词

深度强化学习 / 柔性演员-评论家算法 / 优先经验回放 / Transformer架构 / 后勤管理

Key words

引用本文

引用格式 ▾
基于优先经验回放的生成式SAC算法及其应用[J]. 吉林大学学报(理学版), 2025, 63(06): 1713-1722 DOI:10.13413/j.cnki.jdxblxb.2025064

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

128

访问

0

被引

详细

导航
相关文章

AI思维导图

/