PDF
摘要
为解决深度神经网络(Deep Neural Network,DNN)对抗防御方法在提升防御效力的同时牺牲干净样本分类精度的问题,提出一种基于随机多分布噪声与多目标梯度的对抗防御(Random Noise-Defense,RN-Defense)方法。该方法的核心思想是在模型的每一层引入可训练的多分布噪声,且噪声的强度和分布可通过梯度信息动态调整,以增强模型对多样化输入的适应能力。此外,结合多目标梯度对抗训练,控制每个像素点在梯度方向上进行低阶灰度扰动,以生成对抗样本用于对抗训练。实验结果表明,在CIFAR-10(Canadian Institute for Advanced Research-10)和MNIST(Modified National Institute of Standards and Technology)数据集上,与投影梯度下降(Projected Gradient Descent,PGD)对抗训练相比,RN-Defense方法在PGD攻击下的分类精度分别提升6.4%和7.7%,干净样本的分类精度分别提高6.4%和6.9%,有效提升了模型对抗样本的防御能力,同时保证了干净样本的分类精度。
关键词
深度神经网络
/
对抗样本
/
对抗防御
/
随机多分布噪声
/
多目标梯度
Key words
基于随机多分布噪声与多目标梯度的对抗防御方法[J].
西安邮电大学学报, 2026, 31(1): 112-119 DOI:10.13682/j.issn.2095-6533.2026.01.012