对抗训练作为一种启发式防御方法,在提升深度学习模型鲁棒性方面已被广泛研究和应用。然而,现有的对抗训练方法大多局限于图像空间的对抗样本生成,这导致了对抗样本的多样性显著不足。传统对抗训练方法通过在图像空间内引入微小的扰动来生成对抗样本,这些样本虽然在视觉上与原始图像相似,但在语义层面上的变化相对有限。这种局限性使得模型在面对复杂和多样化的攻击时,其鲁棒性表现不尽如人意。
为了解决这一问题,隋晨红副教授团队设计开发了图像-语义双对抗训练技术框架 (ISDAT)。ISDAT 的基本思想是通过构建图像和语义双路径机制,分别生成对抗图像和对抗语义。具体而言,图像路径通过传统的对抗训练方法生成对抗图像,同时语义路径则通过对抗语义生成对原始图像进行了更深层次的扰动,从而增加了对抗样本的多样性。通过这种双路径的结合,ISDAT能够更全面地训练模型,使其在面对不同类型的攻击时表现出更强的鲁棒性。
研究成果以“ISDAT: An Image-Semantic Dual Adversarial Training Framework for Robust Image Classification”为题发表在国际权威期刊《Pattern Recognition》(中科院一区Top,影响因子8.4)上。该工作第一作者为隋晨红副教授,第二作者是物理与电子信息学院2021级硕士研究生王奥,烟台大学为第一单位。该工作受到了国家重点研发计划项目、国家自然科学基金项目和中国博士后科学基金项目的资助。
来稿时间:9月24日 审核:刘希斌 责任编辑:安兴爽