- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
LLM固有指纹:继续训练不足以窃取模型!
Do-hyeonYoon,MinsooChun,ThomasAllen,HansMüller,MinWang,andRajeshSharma
HonestAGICommunity
honestagi@
Abstract的资产,保护知识产权和防止未经授权的模型
重用已成为商业实体和研究机构面临的重大挑
大型语言模型(LLMs)在训练成本增加和
战(Samuelson,2023;Zengetal.,2024)。训练最
本模型复用变得普遍的情况下,面临着显著先进的LLMs所需的巨大投资为模型盗窃、未
译的版权和知识产权挑战。虽然已经提出了经授权的复制以及可能侵犯原始创作者权益的
中水印技术来保护模型的所有权,但这些技衍生作品提供了强烈的动机(Yaoetal.,2024)。
术可能不适用于持续培训和发展,对模型
1归属和版权保护构成严重威胁。本研究提
v传统的模型保护方法主要依赖于在训练或
4出了一种基于内在模型特征的简单而有效
1的稳健LLM指纹方法。我们发现,在不同推理阶段嵌入的水印技术(Kirchenbaueretal.,
0
3层中注意力参数矩阵的标准差分布展现出2023;Kuditipudietal.,2023)。然而,当面对持
0
.独特的模式,并且即使经过广泛的继续训续训练、微调或模型修改时,这些方法面临重
7
0练,这种模式仍然保持稳定。这些参数分大漏洞。对手可能通过额外的训练迭代移除或
5布签名作为可靠的指纹,能够可靠地识别模糊水印,使得传统保护机制不足以实现强大
2
:模型谱系并检测潜在的版权侵权行为。我
v的版权执行。这一限制产生了对更耐用指纹识
i们的实验验证了这种方法在多个模型家族
x别方法的迫切需求,这些方法能够在各种形式
r中的有效性,用于模型认证。值得注意的
a是,我们的调查发现了证据表明华为最近的模型操作和适应中存活。
发布的PanguProMoE模型是通过升级技
在这项工作中,我们提出了一种简单而有
术从Qwen-2.514B模型衍生出来的,而不
效的LLM指纹识别方法,该方法利用了内在
是从零开始训练,这突显了潜在的模型剽
窃、版权侵犯和信息伪造案例。这些发现参数特征而不是外部施加的水印。我们的关键
强调了在大规模模型开发中保护知识产权见解是注意力参数矩阵的简单统计特性,即它
的关键重要性,并指出仅靠故意继续培训们在各层之间的标准差分布,形成了非常稳定
不足以完全掩盖模型起源。
您可能关注的文档
- 基于动态 LSTM 的长期 LLM 交互记忆编码器-计算机科学-大语言模型-记忆存储.pdf
- 广义自适应传输网络-增强跨领域强化学习中的迁移学习-计算机科学-迁移学习-强化学习-神经网络.pdf
- 无标记步长估计在运动中使用单目视觉的姿态估计算法-计算机科学-计算机视觉-视频分析.pdf
- 超越过度矫正-用 DivBench 评估文本到图像模型的多样性-计算机科学-文本到图像-大语言模型.pdf
- 通过焦点点进行的颠覆-调查大型语言模型监控中的勾结行为-计算机科学-大语言模型-深度防御.pdf
- PDFMathTranslate-保留布局的科学文档翻译-计算机科学-机器翻译-数学翻译-大语言模型.pdf
- 超越欧几里得的学习-流形上神经网络的曲率自适应泛化-计算机科学-神经网络-黎曼流形-深度学习.pdf
- 2013年9月全国计算机等级《二级C++》上机临考冲刺试卷(1).docx
- 书法课教学课件pp硬笔.ppt
- 变电一次考试7.3(带答案A3带密封线普通页面下载打印就用).doc
- 2013年9月全国计算机等级《二级C++》上机临考冲刺试卷(5).docx
- 2013年9月全国计算机等级《二级C++》上机临考冲刺试卷(3).docx
- 2013年9月全国计算机等级《二级C++》上机临考冲刺试卷(6).docx
- 2013年9月全国计算机等级《二级Access》上机模考试卷(2).docx
- 2025年公安业务考试真题(附答案).docx
- 变电一次考试7.3(带答案A3普通页面下载打印就用).doc
- 2013年9月全国计算机等级《二级C++》上机临考冲刺试卷(7).docx
- 乳腺结节教学课件.ppt
- 2025年公共基础知识考试题及答案解析.docx
- 荟聚B2B企业市场与销售协同之跨部门线索传递18页.pdf
文档评论(0)