SASST: 利用语法感知切分和大语言模型进行同步语音翻译.pdfVIP

SASST: 利用语法感知切分和大语言模型进行同步语音翻译.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

SASST:利用语法感知切分和大语言模型进行同步语音翻译

11211,3

ZeyuYang,LaiWei,RomanKoshkin,XiChen,SatoshiNakamura

1TheChineseUniversityofHongKong,Shenzhen,China

2OkinawaInstituteofScienceandTechnology,Japan

3NaraInstituteofScienceandTechnology,Japan

Correspondence:zeyuyang1@,snakamura@

Abstract模能力被用于低延迟翻译。然而,现有方法通常保留

外部策略模块或手工分段策略(ZhangandFeng2023),

这项工作提出了一种基于语法的分块策略,通过解析依

赖关系(例如名词短语边界、动词-宾语结构)和标点特将“何时翻译”与“翻译什么”分离,从而限制了解释

征将输入流分割成语义完整的单元。该方法确保了分块性和联合优化。

本的一致性并最小化了语义碎片化。在此机制的基础上,在这项工作中,我们提出了一种以语言学为动机、

我们提出了SASST(语法感知同步语音翻译),这是一数据驱动的框架,该框架将将读/写决策内部化到一个

译种端到端框架,集成了冻结的Whisper编码器和仅解码指令调优的LLM中统一在单个模型中的分段和翻译。

中器的LLM。统一架构动态输出翻译标记或等待符号,以我们在推理过程中不应用预定义的分段规则,而是根据

1联合优化翻译时间和内容,并通过目标侧重新排序解决句法和语义边界生成块对齐监督,并使用它在一个两阶

v了词序差异问题。在CoVoST2多语言语料库(EnDe、段训练策略中来教导模型预测显式的等待标记以及翻

1Zh、Ja)上的实验表明,在不同语言中显著提高了翻译

8质量,并验证了语法结构在LLM驱动的同步语音翻译系译标记。这使得大语言模型能够自主学习何时及翻译什

7么内容,在不受外部对齐工具或政策头的影响下,由语

7统中的有效性。言结构指导。受到人类译员的启发,他们在句法或语义

0

.边界处自然停顿,我们的方法在流式约束条件下产生了

8介绍

0更加连贯且可解释的翻译。

5同时语音翻译(SimulST)旨在在听取源语言语音为了进一步提高具有不同词序的语言对的输出流

2的同时实时生成目标语言的翻译。与离线翻译不同,在畅性,我们引入了一种基于片段感知的重排序机制,将

:

v离线翻译中,整个输入内容在翻译开始前就已全部可翻译后的片段重新排列成自然的目标语言顺序。我们

i

x用,SimulST必须在流式传输约束下操作,并动态做出的框架是模型不可知的,并且可以使用不同的仅解码

r

a决策,平衡三个往往相互冲突的目标:翻译质量、延迟器LLM基础架构来实现。在这项工作中,我们评估了

和输出连贯性。两个代表性基础架构,LLaMA3-8B(MetaAI2024)和

传统的

文档评论(0)

专业Latex文档翻译 + 关注
实名认证
服务提供商

专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。

1亿VIP精品文档

相关文档