第一款针对车臣语的开放机器翻译系统-计算机科学-大语言模型-机器翻译-多语言翻译.pdfVIP

第一款针对车臣语的开放机器翻译系统-计算机科学-大语言模型-机器翻译-多语言翻译.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第一款针对车臣语的开放机器翻译系统

Abu-ViskhanA.UmishovVladislavA.Grigorian

abuviskhanumishov@real.vladislav.grigorian@yandex.ru

InstituteofMathematics,MechanicsandComputerSciences,SouthernFederalUniversity,

Rostov-on-Don,344090Russia

Abstract车臣语属于纳克-达吉斯坦语系中的纳克

语支,与印古什语和巴茨比语同属这一语支。

我们介绍了首个用于车臣语和俄语之间翻

车臣语是车臣共和国和达吉斯坦的官方语言之

本译的开源模型,以及收集的用于训练和评一,在印古什特以及俄罗斯南部其他地区广泛

译估该模型的数据集。我们探索了微调能使用。在许多欧洲、中东和中亚国家都有讲车

中力,将一种新语言纳入大型语言模型系臣语的侨民。印古什语,作为车臣语的近亲,

统以实现多语言翻译NLLB-200。我们的

1

v模型在从俄语到车臣语和相反方向上的是印古什特共和国的官方语言之一,而巴茨比

2BLEU/ChrF++分数分别为8.34/34.69和语则在格鲁吉亚的图舍蒂地区被使用。书面车

7

620.89/44.55。翻译模型的发布伴随着平行臣语现在基于西里尔字母。

2词汇、短语和句子语料库以及适应车臣语

1书籍和杂志以车臣语出版,24小时的电

.的多语言句子编码器的分发。

7视和广播节目播出,并且已经开发了适用于

0

51介绍西里尔字母的键盘布局,然而该语言的状态被

2

:认为是脆弱的(根据联合国教科文组织分类为

v仅在俄罗斯联邦,车臣语就有大约150万3

iVU)。

x

r人使用,其中超过97%的人在日常生活中使用作为我们的工作的一部分,我们展示了以

a

它(,2020)。车臣语于2024年被添加到Google

下准备给Chechen的结果:

Translate1中,但据我们所知,尚未有公开的车

臣语翻译系统发布,尽管英-车臣语对有一个•基于LaBSE的句子编码器模型(Fengetal.,

基线(Kuduguntaetal.,2023)。我们的工作受到2022)4

了Dale,2022的启发,该文作者基于mBART50

•车臣语-俄语平行语料库5

模型(Tangetal.,2020)创建了一个用于先前未

被覆盖的厄尔兹亚语的翻译器。与论文作者一

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档