- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
外科知识重写在紧凑型大语言模型中:一种带有((IA))的
“先忘后学”策略,用于局部事实调节和灾难性遗忘缓解
StanleyNgugi
2025年8月13日
摘要
大型语言模型(LLMs)在动态知识更新方面存在困难,尤其是在新信息与已深深嵌入的事实发生冲
突时。这种事实上的矛盾编辑通常会导致两个关键问题:对新事实的采纳阻力和无关知识的严重灾难性
遗忘。本文介绍了并评估了一种新颖的“先取消学习再学习”策略,用于大型语言模型中的精确知识编
本辑,利用参数高效的微调(PEFT)技术——通过抑制和放大内部激活来注入适配器(IA)。至关重要
译的是,这种两阶段方法由一个初始电路定位阶段提供动力,该阶段识别并针对负责编码矛盾事实的具体
中内部组件。通过对microsoft/Phi-3-mini-4k-instruct进行严格的实验方法,我们证明了这一机制指
导的两阶段方法对于新的、调制过的事实实现了接近完美的准确率(98.50%),同时有效抑制原始矛盾
1的事实(遗忘率为96.00%)。我们的策略表现出前所未有的定位能力(72.00%F_control准确率),极
v
5大地减轻了直接微调方法中观察到的灾难性遗忘问题(后者F_control准确率低至20%),这是我们
7目标导向的可解释性干预的直接益处。此外,定性分析揭示了一种“软遗忘”的细微机制,其中原始知
0识从默认检索中被抑制但仍处于潜在且有条件可访问的状态,增强了模型的安全性和控制能力。这些发
7
0现代表了在紧凑型LLMs中的精确、局部和安全的知识管理方面的重要进展。
.
8
0
51介绍
2
:
v大型语言模型(LLMs)彻底改变了人工智能,展示了在各种任务中的卓越能力,包括高级理解、生
i
x成、推理,甚至代码创作[1]。这种深刻的多功能性使它们成为众多应用中的基础技术。然而,一个基本的
r
a限制依然存在:它们的知识是静态的,反映了训练时的数据。动态编辑或更新LLM知识的能力对于纠正
错误信息、融入新的现实世界信息以及确保模型保持准确、相关和安全至关重要。这一挑战在目标知识
需要修改且深深根植于模型参数中或直接与现有强大关联冲突时尤为突出,这种挑战在Phi-3-mini等紧
凑型LLMs中往往更为明显,因为它们的参数空间受限,可能导致知识编码不冗余,信息传递更加瓶颈。
传统知识编辑方法通常涉及完全微调(计算成本高、资源密集且容易发生灾难性遗忘[6])或专门的
编辑算法(如ROME、MEMIT[2,3]),这些算法修改特定权重。虽然在添加或更改不冲突的事实方面有
效,但这些手术方法通常难以处理复杂且相互冲突的覆盖操作。这主要是因为它们可能被设计用于添加
事实而不是积极抑制现有强关联,并且可能无法提供足够的关于广义知识保持或在哪里进行编辑以实现
最大局部化的见解。参数高效的微调(PEFT)方法,如低秩适应(LoRA)[4]和通过抑制和放大内部激
活注入适配器(IA)[5],通过向模型中注入少量可训练的参数提供了有希望的替代方案,从而降低计
算成本并减轻与完全微调相比的遗忘。然而,即使这些方法也经常难以处理根深蒂固且相互冲突的事实
编辑,表现出对新矛盾事实的高度抵抗以及对无关知识的重大附带损害。这通常导致
您可能关注的文档
- GAN 和扩散模型生成 X 光图像的感知评估.pdf
- 分布稳健控制约束于线性一维投影.pdf
- 物理设计探索用于埃米时代的线友好型领域专用处理器.pdf
- 基于阻抗的 RIS 建模的实际评估:实用见解与应用.pdf
- ScamDetect:面向一个稳健、无关紧要的框架以揭露智能合约中的威胁.pdf
- SEF-MK:通过多 k 均值量化实现无说话人嵌入的声音匿名化.pdf
- 利用混合 Transformer-自编码器框架改进实时概念漂移检测.pdf
- 增强饮食问题多目标进化优化中的决策空间多样性.pdf
- 平衡隐私与效率:通过加法同态加密实现音乐信息检索.pdf
- K-密集分析家:迈向完全自动化的科学研究分析.pdf
- SAGCNet: 面向空间的图补全网络在人群 CMR 成像中缺失切片插补的应用.pdf
- 3DGS-基准测试:一个全面的视频质量评估基准用于 3DGS 压缩.pdf
- 大型语言模型评估独立注意力辅助图神经网络结合空间和结构信息交互用于精准内镜图像分割.pdf
- TurboBias:通用 ASR 上下文偏置由 GPU 加速的短语增强树支持的.pdf
- 基于时空条件扩散模型的未来多发性硬化病变掩模预测模型及其治疗条件下的应用.pdf
- 特征选择在 Tsetlin 机器中的比较研究.pdf
- 固定时间电压调节用于升压转换器通过单位安全饱和函数.pdf
- SSD 卸载对 LLM 混合专家权重有害于能源效率.pdf
最近下载
- 成考真题政治题目及答案.docx VIP
- 大家的日语(第二版)(初级)2(第26-50课)习题解答.pdf
- 2025年事业单位工勤技能-甘肃-甘肃电工四级(中级工)历年参考题典型考点含答案解析(5卷版).docx VIP
- 2018寒假托管招生广告.docx VIP
- GB55020-2021《建筑给水排水与节水通用规范》废止的现行工程建设标准相 精品.pdf VIP
- 《油气管道安全管理》课件.ppt VIP
- DB37∕T 3489-2019 山东省农产品质量安全监测抽样技术规范.docx VIP
- 新解读《GB_T 4340.2-2012金属材料 维氏硬度试验 第2部分:硬度计的检验与校准》.docx VIP
- GB/T 12706.3-2020 额定电压1kV(Um1.2 kV)到35kV(Um40.5 kV)挤包绝缘电力电缆及附件 第3部分:额定电压35kV(Um40.5kV)电缆.pdf
- 《主体结构工程检测》PPT课件.pptx VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)