基于深度强化学习的柑橘黄龙病智能动态防控策略

张勇威, 骆智聪, 邓小玲, 兰玉彬

华南农业大学学报 ›› 2026, Vol. 47 ›› Issue (01) : 74 -85.

PDF
华南农业大学学报 ›› 2026, Vol. 47 ›› Issue (01) : 74 -85.

基于深度强化学习的柑橘黄龙病智能动态防控策略

    张勇威, 骆智聪, 邓小玲, 兰玉彬
作者信息 +

Author information +
文章历史 +
PDF

摘要

【目的】柑橘黄龙病(Citrus Huanglongbing, HLB)传播受多重动态因素耦合影响,传统最优控制方法因计算复杂度高且依赖精确模型,导致其在实际应用中存在局限性。为解决这一问题,本文提出了一种基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)的HLB智能动态防控方法。【方法】首先,构建融合宿主-媒介交互机制的HLB传播控制动力学模型,并通过离散化处理将其转化为马尔科夫决策过程环境;随后,引入TD3算法,设计生物约束兼容的多目标奖励函数;最后,提出HLB防控策略。【结果】仿真试验结果表明,与DDPG、PPO等传统算法相比,本文提出的基于TD3的HLB动态防控策略在多项关键指标上均呈现出明显优势,系统状态收敛至无病平衡点的速度分别提升了26.59%和20.99%;累计控制成本分别降低了23.79%和19.90%;杀虫剂峰值使用量减少了约35.57%。数值分析结果进一步表明,在HLB爆发初期,及时喷洒杀虫剂干预对阻断HLB传播链具有关键作用;动态防控策略相较于恒定控制策略,在抑制病害扩散效果和降低实施控制的成本方面更具优势。【结论】本研究提出的基于TD3的HLB防控方法为高效控制HLB传播提供了新的视角,展示了深度强化学习方法在农业病害防控中的潜力。

关键词

柑橘黄龙病 / 深度强化学习 / 双延迟深度确定性策略梯度 / 最优控制 / 防控策略

Key words

引用本文

引用格式 ▾
基于深度强化学习的柑橘黄龙病智能动态防控策略[J]. 华南农业大学学报, 2026, 47(01): 74-85 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

2

访问

0

被引

详细

导航
相关文章

AI思维导图

/