- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
推理微调重新定义了基础模型中的潜在表示
*1*23
JakeWardChuqiaoLinConstantinVenhoffNeelNanda
Abstract能力来提升在推理密集型基准上的性能(Weietal.,
2022;Guoetal.,2025;Yeoetal.,2025;Yangetal.,
回溯,一种由推理微调引发的新兴行为,
2025;Yeetal.,2025)。这些模型往往会表现出一种被
已被证明是推理模型能力增强的关键机
称为回溯的新兴行为,在沿着一个推理路径前进或
制。先前的研究成功地通过引导矢量操纵
提出候选答案之后,模型会探索替代策略(Venhoff
了这种行为,但其底层机制仍未被充分理
etal.,2025)。实证研究表明,回溯的存在解释了基
解。在本研究中,我们展示了DeepSeek-R1-
础模型及其经过推理微调的对应模型之间的准确率
本Distill-Llama-8B中的回溯现象部分是由一差距的很大一部分(NiklasMuennighoff,2025)。
译个重新利用的方向已经在基础模型激活中
中存在驱动的。具体而言,我们在基础Llama-先前的工作表明,这种行为可以使用从被分类为回
3.1-8B的残差流中确定了一个方向,在用溯的句子中激活差异派生的控制向量可靠地诱导
1
v于引导蒸馏推理模型时系统地引发回溯,(Venhoffetal.,2025)。虽然Venhoff等人。已经
8并发现使用该方向进行引导的效果不能简表明,转向向量可以用来控制回溯行为,但这种行
3
6单地通过词元级别的属性来解释。我们进为背后的基本机制仍然知之甚少。
2
1一步发现这个方向不在基础模型中也能引在这项工作中,我们对回溯导向矢量进行了更深入
.
7起回溯,这表明推理微调过程重新利用了的研究,并探讨了它们在模型激活中的出现方式和
0
5现有表示以形成新的行为电路。此外,我位置。具体来说,我们发现可以通过(1)在偏移标
2们假设这个方向是几个可能协同工作的方记位置之前的回溯事件的激活,捕捉上游的相关概
:
v向之一,用于调节回溯现象。我们的研究结念;以及(2)仅从基础模型中采样的激活来计算一
i
x果提供了一个有说服力的图景,即推理微个回溯导向矢量,这表明回溯机制的部分基础来源
r
a调模型重新利用现有的基础模型表示,而于已经在基本模型激活中表示的概念(图1)。至关
不是从零开始学习新能力。重要的是,虽然这种表示同时被基本模型和推理模
型共享,但它只会在推理模型中引起回溯现象,暗
1.介绍示了它在推理微调过程中已被重新用于回溯机制的
您可能关注的文档
- 针对任务的机器音频编码: 机器学习的潜在特征是该机器的代码-计算机科学-人工智能-神经音频编解码器.pdf
- Pixel Perfect MegaMed: 一个兆像素级的视觉-语言基础模型,用于生成高分辨率医学图像-计算机科学-医学图像合成-机器学习.pdf
- TRIQA:通过有序失真三元组的对比预训练进行图像质量评估-计算机科学-机器学习-对比学习.pdf
- 第一款针对车臣语的开放机器翻译系统-计算机科学-大语言模型-机器翻译-多语言翻译.pdf
- 关于通过基于身份的签名生成虚荣地址的考虑-计算机科学-区块链-基于身份的签名.pdf
- 飞、失败、修复:使用强化学习和大型多模态模型的迭代游戏修复-计算机科学-机器学习-强化学习-AI辅助游戏设计.pdf
- 项目成功的模糊方法: 测量重要的内容-计算机科学-模糊逻辑-机器学习.pdf
- 快速近似秩确定与分组检测选择-计算机科学-机器学习-秩确定-随机化算法.pdf
- 鲁棒资源分配用于捏合天线系统下的不完美信道状态信息-计算机科学-鲁棒资源分配-通信系统-优化.pdf
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
最近下载
- 2024新沂市中小学教师招聘考试题库及答案.docx VIP
- 新人教版三年级数学上册教学课件《因数中间有0的乘法》.pptx VIP
- 田家四季歌教案.doc VIP
- 《GB 27955-2020过氧化氢气体等离子体低温灭菌器卫生要求》(2025版)深度解析.pptx
- 高级碳排放监测员理论考试复习题库资料(含答案).pdf VIP
- 外科学(总论) 清创术 清创术.pptx VIP
- 《文献检索》课程教学大纲.pdf VIP
- 前置胎盘临床诊断与处理指南课件.ppt VIP
- 事业单位考试公共基础知识考试试题精选3000题.pdf VIP
- 人教版四年级上册数学《平行四边形》(说课课件).pptx VIP
文档评论(0)