基于模型反演的深度强化学习黑盒迁移攻击

陈晋音; 翟建乐; 陈思毅; 王诚熠

doi:10.20009/j.cnki.21-1106/TP.2025-0029

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (3) : 743 -750. DOI: 10.20009/j.cnki.21-1106/TP.2025-0029

基于模型反演的深度强化学习黑盒迁移攻击

陈晋音, 翟建乐, 陈思毅, 王诚熠

作者信息 +

Author information +

文章历史 +

PDF

摘要

近年来，深度强化学习(Deep Reinforcement Learning, DRL)技术在自动驾驶、智能机器人、金融交易等领域得到了广泛应用.然而，针对DRL智能体的黑盒对抗攻击仍然面临诸多挑战，例如计算成本高和迁移性有限等问题.为了解决上述问题，本文提出了一种新型的黑盒迁移攻击方法.首先，通过行为克隆技术对目标智能体进行模型反演，得到影子智能体；随后，针对影子智能体设计并生成对抗样本；最后，将这些对抗样本应用于目标智能体，实现对目标的高效攻击.相比现有方法，本文的攻击方法具有以下显著优势：1)计算成本低：通过专家轨迹数据集训练影子智能体，无需复杂模型生成伪装数据；2)迁移性优越：生成的对抗样本可直接作用于未知目标模型，在不同任务和环境中均表现出稳定的攻击效果.通过在自动驾驶网络场景和OpenAI Gym仿真环境中进行大量实验，验证了所提方法的有效性和鲁棒性.本研究不仅揭示了DRL智能体潜在的安全威胁，也为提升黑盒攻击技术提供了新的思路和方向.