对抗样本会的存在严重威胁到机器学习模型的输出准确性。目前最常用的对抗样本生成方法是FGSM,其通过在沿着损失函数梯度方向添加一个细小的扰动,来“增大”损失,进而改变目标函数的输出。而我们通过FGSM基于目标模型生成对抗样本,并将其与原始样本组合去训练一个二分类器,最终将对抗样本从原始样本中“剔除”出去。
原创文章,作者:BFS,如若转载,请注明出处:https://www.isclab.org.cn/2018/10/17/%e7%ae%80%e8%bf%b0%e5%af%b9%e6%8a%97%e6%a0%b7%e6%9c%ac%e6%a3%80%e6%b5%8b%e6%96%b9%e6%b3%95/