- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
评估评估者:对对抗鲁棒性测试的信任
1,∗,†212
AntonioEmanueleCinà,MauraPintor,LucaDemetrio,AmbraDemontis,
BattistaBiggioandFabioRoli21
1DIBRIS-DepartmentofInformatics,Bioengineering,RoboticsandSystemsEngineering,UniversityofGenoa
2DepartmentofEnvironmentalSciences,InformaticsandStatistics,Ca’FoscariUniversityofVenice
Abstract
尽管在设计强大的对抗逃避攻击以进行鲁棒性验证方面取得了显著进展,但这些方法的评估往往仍然不一致且不可靠。许多
评估依赖于模型不符、未经过验证的实现以及不均匀的计算预算,这可能导致有偏的结果和虚假的安全感。因此,建立在这
种缺陷测试协议上的鲁棒性声明可能会误导,并给人一种虚假的安全感。作为提高评估可靠性的一个具体步骤,我们提出了
AttackBench,这是一个开发出来的基准框架,用于在标准化和可重复条件下评估基于梯度的攻击的有效性。AttackBench作为
一个评估工具,根据一个新的最优性指标对现有的攻击实现进行排名,这使研究人员和实践者能够识别出最可靠且有效的攻
击方法,以便在其后续的鲁棒性评估中使用。该框架强制执行一致的测试条件,并允许持续更新,使其成为鲁棒性验证的一
个可靠基础。
Keywords
对抗鲁棒性,鲁棒性评估,对抗样本,安全基准测试,机器学习安全,可信机器学习,机器学习,人工智能
本
译1.介绍
中近年来,对抗鲁棒性日益重要,这导致了众多规避攻击的开发[1,2],旨在制作越来越精确和高效
的对抗样本[3,4,5,6,7,8]。这些攻击是评估模型抵抗最坏情况下的外部恶意用户扰动能力的重要工
1
v具。因此,它们已成为评估机器学习系统稳健性的重要组成部分,特别是在新兴监管框架(如欧洲
0人工智能法案[9])的背景下,该法规为高风险的人工智能系统引入了严格的网络安全和稳健性要
5求。然而,尽管规避攻击算法迅速发展,用于评估它们的方法在严谨性和一致性方面却没有跟上步1
4伐。这些评估方法常常存在方法论上的缺陷,从而削弱了其可靠性。具体来说,我们识别了三个反
3
0复出现且关键的问题:(i)评估依赖于目标模型和指标的不一致选择,范围从固定预算的成功率[10]
.到中位扰动大小[11,6],这使得跨论文比较不可靠;(ii)公共库中的攻击实现经常被重写而没有验证
7
0原始代码,导致了错误或无声的性能下降[12,13];以及(iii)计算预算执行不一致——例如,某些攻
5击利用内部重启[14]或进行额外的超参数调整[3,4],这给资源密集型方法带来了不公平的优势。
2这些不一致性共同引入了可能导致稳健性评估严重失真、妨碍可重复性和产生虚假的安全感的
:
v方差。这引导我们提出一个核心且紧迫的问题:
i
x我们可以多大程度上信任用于认证对抗鲁棒性的评估测试?
r
a
如果用于评估机器学习系统的工具存在缺陷或无效,那么从它们得出的任何稳健性保证或认证都可
能是无效的,可能会使用户暴露于现实世界的漏洞之中。
作为解决当前鲁棒性评估不可靠问题的具体步骤之一,我们介绍了Att
您可能关注的文档
- 声源方向估计使用麦克风阵列和信号强度-计算机科学-声源跟踪-机器学习.pdf
- 学习变量节点选择以改进多轮置信传播解码-计算机科学-神经网络-算法.pdf
- 深度伪造在刑事调查中的应用-跨学科研究方向的 CMC 研究-计算机科学-深度伪造-机器学习.pdf
- 使用仅螺旋桨反馈进行无人机的空速估计-计算机科学-无人机空速估计-算法.pdf
- 埃利奥特代理-一个用于股市分析和预测的自然语言驱动多智能体系统-计算机科学-大语言模型-多智能体系统-股市分析.pdf
- MASKBEAT-可循环鼓点生成-计算机科学-神经网络-音乐生成.pdf
- 关于游戏过程中情感状态的动态变化及困惑的作用-计算机科学-视频游戏-情感动态.pdf
- 2025年智能控制器公司发展战略和经营计划.docx
- 疾病教学课件.ppt
- 病理学基础教学课件.ppt
- 白天晚上教学课件.ppt
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题带答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解一套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及完整答案详解1套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解1套.docx
- 2025年山东菏泽市事业单位招聘急需紧缺岗位目录(第一批)笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及答案详解1套.docx
- 画西瓜教学课件.ppt
最近下载
- JB-T7752-2005_滚动轴承密封深沟球轴承技术条件.pdf VIP
- 装配式混凝土结构部品部件吊装监理实施细则(标准化格式文本).doc VIP
- 萧山区地图杭州市萧山区乡镇街道地图高清矢量可填充编辑地图PPT模板.pptx
- 全国初中物理竞赛试题专项(力)精编(2024版)(附答案).pdf VIP
- 人教版七年级数学上册试题 第6章 几何图形初步 章节检测卷 (含详解).docx VIP
- 装配式混凝土结构施工监理实施细则(标准化格式).doc VIP
- 绿色智能船舶制造基地项目可行性研究报告.pptx VIP
- 船舶制造基地可行性研究报告.doc VIP
- 第八节 伏安法测电动势内阻-2024-2025学年高二上学期物理专项训练.pdf VIP
- 节能分部工程监理研究细则.doc VIP
文档评论(0)