- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
用于情感对话的双重信息语音语言模型
ChunWang,ChenyangLiu,WenzeXu,WeihongDeng
MashangConsumerFinanceCo.,Ltd.,Chongqing,China
TheUniversityofSydney,Sydney,Australia
lukewang25@;weihong.deng@
摘要—基于文本的大型语言模型(LLMs)的对话系统经常
忽略对理解情感和意图至关重要的副语言线索。使用语音作为输
入的语音-语言模型(SLMs)正逐渐成为一种有前景的解决方
案。然而,通过扩展冻结的LLMs构建的SLMs难以捕捉到副
语言信息,并且表现出减弱的情境理解能力。我们识别出纠缠的
本信息和不恰当的训练策略是主要问题。为了解决这些问题,我们
提出了两个异构适配器并建议采用弱监督训练策略。我们的方法
译解耦了副语言和语言信息,使SLMs能够通过结构化的表示来
图1.一个说明性示例,展示理解副语言信息如何影响响应生成。
中解释语音。它还通过控制随机性避免生成特定任务的向量来保持
情境理解能力。这种方法仅在公共数据集上训练适配器,确保参
1
v数和数据效率。实验结果展示了在情感对话任务中的竞争性能,
5证明了该模型能够在情境设置中有效地整合副语言和语言信息
9
0的能力。
8IndexTerms—对话,副语言,语言,情感
0
.
8
0I.介绍
5
2
:对话系统对于实现人机交互的有效性和吸引力至
v
i关重要。为了开发情感化对话系统,理解对话上下文和
x
r用户表达是关键能力[1]。现代对话系统通常使用基于图2.SLM模型架构概述。可学习模块用红色表示,而冻结的模块用蓝色
a
文本的大语言模型(LLM)作为核心。通过利用LLM表示。
的语言处理能力,这些系统实现了对人类互动的长期理
的表达,确保对话系统生成更准确的响应。因此,最近
解,从而在多轮对话场景中产生了连贯的回应。
的发展集中于语音-语言模型(SLMs)[1][2][4][5]。
然而,基于文本的大型语言模型可能会误解用户
然而,开发SLMs面临着显著的挑战。一种方法是
的表达,因为它们只考虑了语言信息[2]。副语言信息
构建一个原生处理和理解口语的语言文本基础模型。虽
(如音调和速度)对于理解情感和意图至关重要[3]。正
然有效,但这种方法需要大量的多模态数据和高计算资
如图1所示,理解副语言信息使系统能够做出恰当的回
源,这限制了其可行性[6]。
应。否则,对话系统可能会忽视用户的情绪,导致误解。
一种更可行的方法是增强现有的基于文本的LLM
这强调了在输入中包含语音的重要性,以全面理解用户
以具备语音理解能力。这涉及将语音编码器与文本LLM
PresentedatIEEEICME2025集成,并通过适配器模块连接这两者。先前采用这种方
WorkdonewhenWen
您可能关注的文档
- 组件感知剪枝以加速潜在空间模型中的控制任务.pdf
- 深度强化学习在微电网韧性能源管理中的局部可解释性.pdf
- NeuroDx-LM:一种基于 EEG 的神经系统疾病检测临床大规模模型.pdf
- 迭代细化,而不是训练目标,使得 HuBERT 的行为与 wav2vec 2.0 不同.pdf
- 随机调制:在任意范数有界和谱收敛的信道矩阵上实现渐近复本最优性.pdf
- TBAC-统一图像:通过梯形侧向扩散调优实现统一理解和生成.pdf
- 三维植物根系骨架检测与提取.pdf
- 使用发育图元胞自动机增长水库.pdf
- C-供应链链接预测的级联多模态属性图.pdf
- 基于信息瓶颈的因果注意力机制在多标签医学图像识别中的应用.pdf
- 美国出口管制“50%规则”落地,深刻改变企业合规责任.pdf
- 打造越南人工智能初创企业 2025 抓住东南亚下一波创新浪潮.pdf
- BMS在储能安全中的应用设计与实践—协能科技.pdf
- 2025年中国低空经济-民用无人机市场白皮书(精简版).pdf
- 2025临床试验中的人工智能创新:加速药物研发研究报告 AI Innovations in Clinical Trials SpeedingDrug Development.pdf
- 2024-2025德国汽车工业报告 Automotive Industry in Focus Figures and data.pdf
- 《宏观观察》2025年第36期:把握我国碳金融发展的未来方向与政策路径.pdf
- 商户装修管控要点.docx
- 商品砂浆抹灰工程监理细则.docx
- 通风与空调工程监理实施细则.docx
最近下载
- 2025年特种设备作业人员考试特种设备操作与报废试卷(附答案).docx
- 合力G系列3吨电动叉车零件图册.pdf VIP
- DB62∕T 5072-2024 公路固废基胶凝材料稳定碎石混合料 设计与施工规范.pdf
- 循证视角下眼外伤的防治与护理实践题库答案-2025年华医网继续教育.docx VIP
- 特种设备安全管理培训试题(含答案).docx VIP
- 2025七上历史全册教案.docx VIP
- bA正谱草原上升起不落的太阳声乐歌谱正谱子五线谱钢琴伴奏谱乐谱曲 谱弹唱谱歌曲乐曲.pdf VIP
- 露天煤矿建设项目的可行性研究报告.doc
- 华为ICT大赛(云赛道)高频备考试题及答案.doc VIP
- 新生入学实践报告.docx VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)