- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Spec-TOD:一个专用于高效任务导向对话系统的指令微调LLM框架
**†
Quang-VinhNguyen,Quang-ChieuNguyen,HoangPham,Khac-HoaiNamBui
ViettelArtificialIntelligenceandDataServicesCenter,
ViettelGroup,Vietnam
{vinhnq29,chieunq,hoangpv4,nambkh}@.vn
摘要具体而言,现有的TOD模型要么微调预训练
的语言模型如GPT-2(Yangetal.,2021)和T5
面向任务的对话(TOD)系统促进了用户与
本机器之间的目标驱动交互。虽然深度学习(Lee,2021;Bangetal.,2023),要么准备高质量
译方面的必威体育精装版进展提高了性能,但在有限标的数据整理以训练预训练的TOD语言模型(He
签数据的情况下,TOD系统经常在低资源etal.,2022;Suetal.,2022),能够在TOD任务上
中场景中遇到困难。为了解决这一挑战,我取得强劲的表现(图1(a))。对特定领域注释
1们提出了Spec-TOD,一个旨在使用有限数数据集的依赖给可重复性和扩展性带来了挑战
v
1据训练端到端TOD系统的新型框架。Spec-(Baoetal.,2023)。尽管在少样本学习(Mietal.,
4TOD引入了两个主要创新点:(i)一种新
82022;Moradshahietal.,2023)领域取得了进展,
4的专门的端到端TOD框架,该框架将明确
0.的任务指令纳入了针对指令调整的大语言当前的方法仍难以跨新领域进行泛化,并且表
7模型(LLMs),以及(ii)一种高效的训练策现次优。大型语言模型(LLMs)的必威体育精装版进展,包
0
5略,利用轻量级、专用的LLMs以实现强括专有模型(如GPT系列(OpenAI,2023))和开
2
:大的性能并大幅减少监督。在广泛使用的源模型(如Llama系列(Touvronetal.,2023)),
v
iTOD基准MultiWOZ数据集上的实验表明,通过实现零样本和少样本泛化能力,改变了自
x
rSpec-TOD实现了具有竞争力的结果,同时然语言处理任务的方式,并推动了基于LLM
a
显著减少了对标签数据的需求。这些发现
的TOD系统的开发(图1(b))。此外,新兴的
突显了所提出的框架在推进低资源环境下
基于代理的LLM技术通过利用通用指令跟随
高效且有效的TOD系统的潜力。
模型(如GPT-4)自主执行预定义外部API(Xu
1介绍
您可能关注的文档
- 鲁棒的不完全模态对齐通过标记最优传输进行眼科疾病分级和诊断-计算机科学-眼科成像-最优传输.pdf
- 支持抽象论辩的基于案例推理-计算机科学-机器学习-案例推理.pdf
- 猫皇家-对机器人信任的艺术探究-计算机科学-机器人-艺术-人机交互.pdf
- 面向实例优化的 LLM 在 OLAP 数据库中的案例-计算机科学-大语言模型-实例优化.pdf
- 涌现语义超越标记嵌入-带有冻结视觉 Unicode 表示的 Transformer 语言模型-计算机科学-大语言模型-自然语言处理.pdf
- 音乐飞回标枪-重复使用扩散模型进行数据增强和音频操作-计算机科学-扩散模型-音频处理.pdf
- 语义一致的离散扩散用于三维生物图建模-计算机科学-计算机视觉-医学图像.pdf
- 空间与语义嵌入集成在常规视频中的立体声音事件定位与检测-计算机科学-音视频机器学习-音频理解.pdf
- 一种支持抽象和优化的深度学习加速器高级编译器集成方法-计算机科学-深度学习加速器-机器学习编译器-优化.pdf
- 在电池储能系统优化中考虑子系统老化变异-计算机科学-电池储能系统-优化.pdf
- 2025至2030年中国电子身份识别器行业投资前景及策略咨询研究报告.docx
- 2025至2030年中国电子实验设备行业投资前景及策略咨询研究报告.docx
- 2025至2030年中国电子文档管理系统行业投资前景及策略咨询报告.docx
- 2025至2030年中国电子硬盘行业投资前景及策略咨询研究报告.docx
- 2025至2030年中国LED用衬底材料行业市场需求分析及发展趋向分析报告.docx
- 2025至2030年中国氨基葡萄糖盐酸盐行业投资前景及策略咨询研究报告.docx
- 2025年一级建造师培训建设工程项目管理考点总结8854392902整理By阿拉蕾.doc
- 2025至2030年中国钢桶烘干生产线行业投资前景及策略咨询研究报告.docx
- 2025至2030年中国存储卡行业市场运行状况及发展前景展望报告.docx
- 2025至2030年中国甘草甜素行业投资前景及策略咨询研究报告.docx
最近下载
- 承建单位工作联系函模板.docx VIP
- 电梯施工合同范本(2025版).docx VIP
- 胸痛中心(胸痛救治单元)建设应知应会试题含答案.doc VIP
- 2025年入党积极分子发展对象考试试卷及参考答案详解【考试直接用】.docx VIP
- 工程管理笔试题.doc VIP
- 学校外来人员查验登记、车辆准入、物品出入制度.docx VIP
- 口腔科医务人员职业暴露.ppt VIP
- 高中STEM教育数字资源整合与生物实验教学的创新实践教学研究课题报告.docx
- 湖北省武汉市部分学校2024-2025学年高一上学期11月期中调研数学试题含答案.pdf VIP
- 2025年入党积极分子发展对象考试试卷及参考答案详解(新).docx VIP
文档评论(0)