基于深度强化学习的柑橘黄龙病智能动态防控策略

张勇威; 骆智聪; 邓小玲; 兰玉彬

华南农业大学学报 ›› 2026, Vol. 47 ›› Issue (01) : 74 -85.

张勇威, 骆智聪, 邓小玲, 兰玉彬

作者信息 +

Author information +

文章历史 +

PDF

摘要

【目的】柑橘黄龙病(Citrus Huanglongbing, HLB)传播受多重动态因素耦合影响，传统最优控制方法因计算复杂度高且依赖精确模型，导致其在实际应用中存在局限性。为解决这一问题，本文提出了一种基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient, TD3)的HLB智能动态防控方法。【方法】首先，构建融合宿主-媒介交互机制的HLB传播控制动力学模型，并通过离散化处理将其转化为马尔科夫决策过程环境；随后，引入TD3算法，设计生物约束兼容的多目标奖励函数；最后，提出HLB防控策略。【结果】仿真试验结果表明，与DDPG、PPO等传统算法相比，本文提出的基于TD3的HLB动态防控策略在多项关键指标上均呈现出明显优势，系统状态收敛至无病平衡点的速度分别提升了26.59%和20.99%；累计控制成本分别降低了23.79%和19.90%；杀虫剂峰值使用量减少了约35.57%。数值分析结果进一步表明，在HLB爆发初期，及时喷洒杀虫剂干预对阻断HLB传播链具有关键作用；动态防控策略相较于恒定控制策略，在抑制病害扩散效果和降低实施控制的成本方面更具优势。【结论】本研究提出的基于TD3的HLB防控方法为高效控制HLB传播提供了新的视角，展示了深度强化学习方法在农业病害防控中的潜力。