文档名:基于主特征归因的对抗样本生成方法研究
摘要:为提高对抗训练的样本质量,本文对深度学习模型内部的特征识别过程进行了探究,并提出了一种基于主特征归因的迁移性对抗样本生成方法.算法在提取样本的主要特征后对目标层神经元进行特征归因,并利用独立性假设简化梯度计算,通过抑制积极神经元的识别作用,更加高效地得到更具迁移性的对抗样本.经过大量实验验证,相比于已有方法,在针对多模型的攻击中,本文算法的攻击成功率提高了5%以上,为后续研究如何提高模型的鲁棒性奠定了基础.
Abstract:Inordertoimprovethequalityofadversarialtrainingsamples,thisarticleexploresthefeaturerecognitionprocesswithindeeplearningmodelsandproposesatransferabilityadversarialsamplegenerationmethodbasedonmainfea-tureattribution.Afterextractingthemainfeaturesofthesamples,thealgorithmattributesthefeaturesofthetargetlayerneurons,andsimplifiesthegradientcalculationbyusingtheindependenceassumption.Byinhibitingtherecognitionofac-tiveneurons,thealgorithmcanmoreefficientlyobtainmoretransferableadversarialsamples.Throughalargenumberofexperiments,comparedtoexistingmethods,thesuccessrateofouralgorithminattacksagainstmultiplemodelshasbeenimprovedbyatleast5%,itlaysafoundationforfurtherresearchonhowtoimprovetherobustnessofthemodel.
作者:王硕 徐茹枝 关志涛Author:WANGShuo XURu-zhi GUANZhi-tao
作者单位:华北电力大学控制与计算机工程学院,北京102206
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(11)
分类号:TP391.4
关键词:深度学习 图像识别 特征提取 特征归因 对抗样本
Keywords:deeplearning imagerecognition featureextraction featureattribution adversarialsample
机标分类号:TP393.08TP18TP273.4
在线出版日期:2024年2月1日
基金项目:基于主特征归因的对抗样本生成方法研究[
期刊论文] 电子学报--2023, 51(11)王硕 徐茹枝 关志涛为提高对抗训练的样本质量,本文对深度学习模型内部的特征识别过程进行了探究,并提出了一种基于主特征归因的迁移性对抗样本生成方法.算法在提取样本的主要特征后对目标层神经元进行特征归因,并利用独立性假设简化梯度计...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于主特征归因的对抗样本生成方法研究 Research on the Generation of Adversarial Samples Based on the Attribution of Principal Features
基于主特征归因的对抗样本生成方法研究.pdf
- 文件大小:
- 1.8 MB
- 下载次数:
- 60
-
高速下载
|
|