传统蒙古文与西里尔蒙古文相互转换方法的研究.docx

传统蒙古文与西里尔蒙古文相互转换方法的研究.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
传统蒙古文与西里尔蒙古文相互转换方法的研究

传统蒙古文与西里尔蒙古文相互转换方法的研究飞龙,高光来,闫学亮,魏宏喜BAOFeilong, GAOGuanglai, YANXueliang,WEIHongxi内蒙古大学计算机学院,呼和浩特010021CollegeofComputerScience,InnerMongoliaUniversity,Hohhot010021,ChinaBAOFeilong,GAOGuanglai,YANXueliang,etal.ResearchonconversionapproachbetweentraditionalMongo-lianandCyrillicMongolian.ComputerEngineeringandApplications,2014,50(23):206-211.Abstract:TraditionalMongolianandCyrillicMongolianarebothMongolianlanguagesandarewidelyusedinChinaandMongoliarespectively.Withalmostthesamepronunciations,theirwrittenformsaretotallydifferent.Accordingtothecharacteristicofthetwolanguages,thispaperproposesajointsequencemodelbasedapproachanddepictsindetailthecorrespondingexperimentsperformed.Intheexperiments,theworderrorrateandlettererrorrateforthetraditionalMon-goliantoCyrillicMongolianconversionsystemare18.38%and6.75%,andthatforCyrillicMongolianandtraditionalMongolianconversionsystemare18.77%and7.14%.Experimentalresultsshowthattheproposedapproachcanmeetthebasicrequirementsforpracticaluse.Keywords:traditionalMongolian;CyrillicMongolian;jointsequencemodels;jointmultigram摘 要:传统蒙古文和西里尔蒙古文分别是在中国和蒙古国使用的蒙古文,它们的口语基本相同,但是书写形式完全不同。结合传统蒙古文和西里尔蒙古文的构词特点,提出了基于联合序列模型的传统蒙古文和西里尔蒙古文相互转换方法,并做了大量的相互转换实验。实验中,传统蒙古文到西里尔蒙古文转换系统的词误识率和字母误识率分别达到了18.38%和6.75%,西里尔蒙古文到传统蒙古文转换系统的词误识率字母误识率分别达到了18.77%和7.14%,基本达到了实用要求。关键词:传统蒙古文;西里尔蒙古文;联合序列模型;联合多元文献标志码:A中图分类号:TP391.1doi:10.3778/j.issn.1002-8331.1301-03141引言蒙古文是一个跨多国、多地区的语言,在世界上有广泛影响,使用者分布在中国、蒙古国和俄罗斯联邦等国家,尤其是中国和蒙古国使用的蒙古语言文字是“语同文不同”,即语言相同,文字不同。在中国使用的蒙古文叫“传统蒙古文”,在蒙古国使用的蒙古文叫“西里尔蒙古文”(也叫新蒙古文,基立尔蒙古文,斯拉夫蒙古文等)。随着中国和蒙古国两国之间的文化、教育和经济的交流与合作不断深入,两国之间的文字转换工作也变得极其重要。传统蒙古文和西里尔蒙古文的相互转换工作会给两国蒙古族同胞的交流带来更多的便利,并且对蒙古族的科学,文化和教育发展同样具有重要的意义。包萨日娜、乌日力嘎和Hao Li[1-6]等人采用基于词典的方法和基于规则的方法对传统蒙古文和西里尔蒙古文的相互转换进行了一系列的研究,并取得了一定的成果。但是,蒙古文是通过词根缀接多个后缀的方式生成新词的,按照这种生成方式,可以构成近100万的蒙古文单词,词典一般很难全部包含。而且,基于规则的方法很难归纳出所有的转换规则,并且相当一部分单词并不遵循转换规则。所以,基于词典和基于规则的方法基金项目:国家自然科学基金(NoNo;内蒙古自然科学基金(No.2014BS0604);内蒙古大学高层次人才引进科研项目资助。作者简介:飞龙(1985—),男,博士,讲师,主研方向为蒙古文信息处理、语音识别与语音检索;高光来(1964—),男,教授,博士生导师,主研方向为蒙古文信

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档