Spec-TOD-一个专用于高效任务导向对话系统的指令微调 LLM 框架-计算机科学-面向任务的对话-大语言模型.pdfVIP

Spec-TOD-一个专用于高效任务导向对话系统的指令微调 LLM 框架-计算机科学-面向任务的对话-大语言模型.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Spec-TOD:一个专用于高效任务导向对话系统的指令微调LLM框架

**†

Quang-VinhNguyen,Quang-ChieuNguyen,HoangPham,Khac-HoaiNamBui

ViettelArtificialIntelligenceandDataServicesCenter,

ViettelGroup,Vietnam

{vinhnq29,chieunq,hoangpv4,nambkh}@.vn

摘要具体而言,现有的TOD模型要么微调预训练

的语言模型如GPT-2(Yangetal.,2021)和T5

面向任务的对话(TOD)系统促进了用户与

本机器之间的目标驱动交互。虽然深度学习(Lee,2021;Bangetal.,2023),要么准备高质量

译方面的必威体育精装版进展提高了性能,但在有限标的数据整理以训练预训练的TOD语言模型(He

签数据的情况下,TOD系统经常在低资源etal.,2022;Suetal.,2022),能够在TOD任务上

中场景中遇到困难。为了解决这一挑战,我取得强劲的表现(图1(a))。对特定领域注释

1们提出了Spec-TOD,一个旨在使用有限数数据集的依赖给可重复性和扩展性带来了挑战

v

1据训练端到端TOD系统的新型框架。Spec-(Baoetal.,2023)。尽管在少样本学习(Mietal.,

4TOD引入了两个主要创新点:(i)一种新

82022;Moradshahietal.,2023)领域取得了进展,

4的专门的端到端TOD框架,该框架将明确

0.的任务指令纳入了针对指令调整的大语言当前的方法仍难以跨新领域进行泛化,并且表

7模型(LLMs),以及(ii)一种高效的训练策现次优。大型语言模型(LLMs)的必威体育精装版进展,包

0

5略,利用轻量级、专用的LLMs以实现强括专有模型(如GPT系列(OpenAI,2023))和开

2

:大的性能并大幅减少监督。在广泛使用的源模型(如Llama系列(Touvronetal.,2023)),

v

iTOD基准MultiWOZ数据集上的实验表明,通过实现零样本和少样本泛化能力,改变了自

x

rSpec-TOD实现了具有竞争力的结果,同时然语言处理任务的方式,并推动了基于LLM

a

显著减少了对标签数据的需求。这些发现

的TOD系统的开发(图1(b))。此外,新兴的

突显了所提出的框架在推进低资源环境下

基于代理的LLM技术通过利用通用指令跟随

高效且有效的TOD系统的潜力。

模型(如GPT-4)自主执行预定义外部API(Xu

1介绍

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档