动量辅助的自然语言梯度下降用于提示优化-计算机科学-大语言模型-自然语言处理.pdf

动量辅助的自然语言梯度下降用于提示优化-计算机科学-大语言模型-自然语言处理.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
提示优化对于提高大型语言模型(LLMs)的输出质量至关重要,但许多现有方法效率低下,需要大量的计算和手动调整。我们提出了Momentum-AidedPromptOptimization(MAPO),它在ProTeGi(Pryzantetal.,2023)的基础上通过加入正面的自然语言“梯度”和基于动量的记忆机制来优化提示,同时避免陷入局部最小值和振荡。它还使用了束有哪些信誉好的足球投注网站和上置信界(UCB)算法来进行平衡候选扩展

动量辅助的自然语言梯度下降用于提示优化

AnthonyCui*PranavNandyalamAndrewRufailEthanCheung

AidenLeiKevinZhuSeanO’Brien

AlgoverseAIResearch

anthonycui@,kevin@algoverse.us

Abstract出错,并受人类局限性的制约(Linetal.,2024)。

这突显了对一个无需人工干预即可提高提示质

提示优化对于提高大型语言模型(LLMs)的

量的自动化系统日益增长的需求。

本输出质量至关重要,但许多现有方法效率

译低下,需要大量的计算和手动调整。我们提

中出了Momentum-AidedPromptOptimization

(MAPO),它在ProTeGi(Pryzantetal.,2023)

3

v的基础上通过加入正面的自然语言“梯

9度”和基于动量的记忆机制来优化提示,

9

4同时避免陷入局部最小值和振荡。它还

9使用了束有哪些信誉好的足球投注网站和上置信界(UCB)算法来

1

.进行平衡候选扩展和选择。MAPO实现

0

1了更快的收敛时间、较少的API调用次

4数以及比ProTeGi更高的性能,证明其作

2

:为LLMs中自动化提示优化的健壮且可

v

i扩展解决方案的有效性。我们的代码在

x

r线可用,网址为/Anthony-

a

Cui7/momentum-aided-prompt-optimization。

1介绍

大型语言模型(LLMs)自ChatGPT(Ope-

nAI,2022)发布以来获得了显著的关注,促成了

新的提示技术的发展,这些技术极大地提高了

LLM的性能(Schulhoffetal.,2024)。虽然已经表

明给予LLM的提示对其性能有很大影响(Paw-图1:MAPO的高级概述

lik,2025),但提示仍然可能不清楚、有偏见或不

完整,限制了LLM的能力(Sahooetal.,2024)。最近的研究探讨了将传统机器学习算法以

由于这些原因,提示工程已成为充分利用LLM自然语言格式实现的方法,其中第一个便是

能力的关键方面。目前的提示工程技术通常需ProTeGi的“使用‘梯度下降’和束有哪些信誉好的足球投注网站自动

要用户进行手动调整,这使得它们耗时、容易提示优化”(Pryzantetal.,2023)。虽然ProTeGi

*LeadAuthor引入了一个创新框架,但它也存在一些限制,

包括由于过度调用API而导致计算成本高和资相似的问题。

源消耗大,这使得大规模提示优化变得不切实

3方法

际。此外,ProTeGi没有跟踪之前的改进措施,

导致了振荡行为和收敛速度缓慢。最终,提示3.1动量辅助提示优化

的优势未能得到充分利用。

首先,当前提示基于一组训练数据的最

我们引入了动量辅助提示优化(MAPO)方

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档