基于模型反演的深度强化学习黑盒迁移攻击

陈晋音, 翟建乐, 陈思毅, 王诚熠

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (3) : 743 -750.

PDF
小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (3) : 743 -750. DOI: 10.20009/j.cnki.21-1106/TP.2025-0029

基于模型反演的深度强化学习黑盒迁移攻击

    陈晋音, 翟建乐, 陈思毅, 王诚熠
作者信息 +

Author information +
文章历史 +
PDF

摘要

近年来,深度强化学习(Deep Reinforcement Learning, DRL)技术在自动驾驶、智能机器人、金融交易等领域得到了广泛应用.然而,针对DRL智能体的黑盒对抗攻击仍然面临诸多挑战,例如计算成本高和迁移性有限等问题.为了解决上述问题,本文提出了一种新型的黑盒迁移攻击方法.首先,通过行为克隆技术对目标智能体进行模型反演,得到影子智能体;随后,针对影子智能体设计并生成对抗样本;最后,将这些对抗样本应用于目标智能体,实现对目标的高效攻击.相比现有方法,本文的攻击方法具有以下显著优势:1)计算成本低:通过专家轨迹数据集训练影子智能体,无需复杂模型生成伪装数据;2)迁移性优越:生成的对抗样本可直接作用于未知目标模型,在不同任务和环境中均表现出稳定的攻击效果.通过在自动驾驶网络场景和OpenAI Gym仿真环境中进行大量实验,验证了所提方法的有效性和鲁棒性.本研究不仅揭示了DRL智能体潜在的安全威胁,也为提升黑盒攻击技术提供了新的思路和方向.

关键词

深度强化学习 / 模仿学习 / 对抗攻击 / 黑盒攻击

Key words

引用本文

引用格式 ▾
基于模型反演的深度强化学习黑盒迁移攻击[J]. 小型微型计算机系统, 2026, 47(3): 743-750 DOI:10.20009/j.cnki.21-1106/TP.2025-0029

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/