- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
通过不确定性驱动的LLM路由实现对话系统中的高效范围外检测
*
ÁlvaroZaera,DianaNicoletaPopa,IvanSekuli,PaoloRosso
TelepathyLabsGmbH,Zürich,Switzerland
{firstname}.{lastname}@telepathy.ai
摘要
超出范围(OOS)意图检测是任务导向对
本话系统(TODS)中的一个重要挑战,因为
译它确保了对未见过和模糊查询的鲁棒性。
在本研究中,我们提出了一种新颖但简单
中的模块化框架,该框架结合不确定性建模
1与微调的大语言模型(LLMs),以实现高
v
1效的OOS检测。第一步是对已部署于处理
4日常数万次用户交互的真实世界TODS中图1:概览UDRIL。一个不确定性评分函数被应用
5
1的范围内的意图检测分类器的输出进行不于范围内的分类器的输出。当用户陈述可能超出范
0.确定性估计。第二步则利用一种新兴的基围、模糊或分类错误时,如由不确定性得分和定义
7于LLM的方法,其中经过微调的LLM被的阈值所指示,会提示一个微调的LLM进行修正
0
5触发对具有高不确定性的实例做出最终决预测;否则,维持分类器原有的预测。
2
:策。与先前方法不同的是,我们的方法有
v
i效地平衡了计算效率和性能,结合传统方
x
r法与LLMs,并在关键的OOS检测基准上如果没有有效的离域检测,这样的输入可
a取得了最先进的结果,包括从部署的TODS能导致不正确的响应、降低用户信任度,并最
中获取的真实世界的OOS数据。终导致系统故障,因为任何任务导向系统的离
1介绍域查询的范围是无限大的(Aroraetal.,2024)。
通过识别离域查询,系统可以优雅地处理此类
意图检测是自然语言理解中的一个基础任
情况,生成一个预定义或动态响应来表示其无
务,使系统能够通过识别用户的潜在意图来准
法处理请求,或者激活备选机制,如将对话升
确解释和响应用户查询(Casanuevaetal.,2020)。
级为人工代理处理或触发更新以扩展系统覆盖
虽然意图检测确保范围内的(INS)查询被映
范围。
射到预定义的意图上,但检测超出范围(OOS)
的意图也同样重要,特别是在现实世界的应用为应对这些挑战,我们提出了不确定性驱
中,用户常常以不可预测的方式进行交互,例动的大语言模型触发,(UDRIL),这是一种结合
如提出超出系统设计能力范围的查询(Larson了效率和准确性的两步方法,用于强大的意图
检测。UDRIL如图1所示,包含一个范围内的
您可能关注的文档
最近下载
- 印刷服务方案4.docx VIP
- 《宫腔镜检查》课件.ppt VIP
- 刑法学资料 21秋 江南大学限时机考复习资料答案。如果有颜色的是答案.doc VIP
- 金属非金属矿山从业人员安全教育培训试卷-答案.docx VIP
- 长期股权投资成本法和权益法有什么区别[学习].pdf VIP
- 2023-2024学年泰安市泰山区八年级数学第一学期期末教学质量检测试题含答案.doc VIP
- 2024《农业上市公司生物资产计量问题研究—以牧原及温氏股份为例》13000字.docx VIP
- 尿液检查注意事项及结果分析.ppt VIP
- 股骨颈骨折护理查房股骨颈骨折.pptx VIP
- 统计诚信培训课件.pptx VIP
文档评论(0)