基于改进深度强化学习的SCR脱硝系统复合控制研究

赵征, 全家乐, 刘子涵

电力科学与工程 ›› 2024, Vol. 40 ›› Issue (11) : 70 -78.

PDF
电力科学与工程 ›› 2024, Vol. 40 ›› Issue (11) : 70 -78.

基于改进深度强化学习的SCR脱硝系统复合控制研究

    赵征, 全家乐, 刘子涵
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对选择性催化还原(Selective catalytic reduction, SCR)脱硝系统延迟大、扰动多等特点,提出了一种基于改进双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)的SCR脱硝系统复合控制策略。首先,提出了一种融合多步时序差分(Muti-step temporal-difference,MSTD)和优先经验回放(Prioritized experiencereplay,PER)的改进TD3算法。该算法在策略更新时使用MSTD计算回报,同时利用PER选择重要的经验进行学习,以此提高TD3算法的策略学习能力并加速算法的学习过程。其次,通过设计多维状态观测,综合考虑SCR脱硝系统的前馈信号和验证反馈信号来实现SCR脱硝系统的复合控制,进而维持出口NOx浓度的稳定性。最后,进行仿真实验验证,结果表明基于MSTD-PER-TD3算法的复合控制策略能更有效地克服入口NOx浓度波动对出口NOx浓度的影响,并具有优秀的抗干扰能力和鲁棒性。

关键词

TD3算法 / 多步时序差分 / 优先经验回放 / SCR脱硝系统 / 复合控制策略

Key words

引用本文

引用格式 ▾
基于改进深度强化学习的SCR脱硝系统复合控制研究[J]. 电力科学与工程, 2024, 40(11): 70-78 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

15

访问

0

被引

详细

导航
相关文章

AI思维导图

/