- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
传统蒙古文与西里尔蒙古文相互转换方法的研究
传统蒙古文与西里尔蒙古文相互转换方法的研究飞龙,高光来,闫学亮,魏宏喜BAOFeilong, GAOGuanglai, YANXueliang,WEIHongxi内蒙古大学计算机学院,呼和浩特010021CollegeofComputerScience,InnerMongoliaUniversity,Hohhot010021,ChinaBAOFeilong,GAOGuanglai,YANXueliang,etal.ResearchonconversionapproachbetweentraditionalMongo-lianandCyrillicMongolian.ComputerEngineeringandApplications,2014,50(23):206-211.Abstract:TraditionalMongolianandCyrillicMongolianarebothMongolianlanguagesandarewidelyusedinChinaandMongoliarespectively.Withalmostthesamepronunciations,theirwrittenformsaretotallydifferent.Accordingtothecharacteristicofthetwolanguages,thispaperproposesajointsequencemodelbasedapproachanddepictsindetailthecorrespondingexperimentsperformed.Intheexperiments,theworderrorrateandlettererrorrateforthetraditionalMon-goliantoCyrillicMongolianconversionsystemare18.38%and6.75%,andthatforCyrillicMongolianandtraditionalMongolianconversionsystemare18.77%and7.14%.Experimentalresultsshowthattheproposedapproachcanmeetthebasicrequirementsforpracticaluse.Keywords:traditionalMongolian;CyrillicMongolian;jointsequencemodels;jointmultigram摘 要:传统蒙古文和西里尔蒙古文分别是在中国和蒙古国使用的蒙古文,它们的口语基本相同,但是书写形式完全不同。结合传统蒙古文和西里尔蒙古文的构词特点,提出了基于联合序列模型的传统蒙古文和西里尔蒙古文相互转换方法,并做了大量的相互转换实验。实验中,传统蒙古文到西里尔蒙古文转换系统的词误识率和字母误识率分别达到了18.38%和6.75%,西里尔蒙古文到传统蒙古文转换系统的词误识率字母误识率分别达到了18.77%和7.14%,基本达到了实用要求。关键词:传统蒙古文;西里尔蒙古文;联合序列模型;联合多元文献标志码:A中图分类号:TP391.1doi:10.3778/j.issn.1002-8331.1301-03141引言蒙古文是一个跨多国、多地区的语言,在世界上有广泛影响,使用者分布在中国、蒙古国和俄罗斯联邦等国家,尤其是中国和蒙古国使用的蒙古语言文字是“语同文不同”,即语言相同,文字不同。在中国使用的蒙古文叫“传统蒙古文”,在蒙古国使用的蒙古文叫“西里尔蒙古文”(也叫新蒙古文,基立尔蒙古文,斯拉夫蒙古文等)。随着中国和蒙古国两国之间的文化、教育和经济的交流与合作不断深入,两国之间的文字转换工作也变得极其重要。传统蒙古文和西里尔蒙古文的相互转换工作会给两国蒙古族同胞的交流带来更多的便利,并且对蒙古族的科学,文化和教育发展同样具有重要的意义。包萨日娜、乌日力嘎和Hao Li[1-6]等人采用基于词典的方法和基于规则的方法对传统蒙古文和西里尔蒙古文的相互转换进行了一系列的研究,并取得了一定的成果。但是,蒙古文是通过词根缀接多个后缀的方式生成新词的,按照这种生成方式,可以构成近100万的蒙古文单词,词典一般很难全部包含。而且,基于规则的方法很难归纳出所有的转换规则,并且相当一部分单词并不遵循转换规则。所以,基于词典和基于规则的方法基金项目:国家自然科学基金(NoNo;内蒙古自然科学基金(No.2014BS0604);内蒙古大学高层次人才引进科研项目资助。作者简介:飞龙(1985—),男,博士,讲师,主研方向为蒙古文信息处理、语音识别与语音检索;高光来(1964—),男,教授,博士生导师,主研方向为蒙古文信
您可能关注的文档
- 中考历史复习系列6:专题一_中外历史上的思想家及思想解放运动.doc
- 中考完成句子解题方法与技巧.doc
- 丰吉种业公司岗位职责制度.doc
- 中高级酒店管理系统可行性研究报告.doc
- 中铁国际生态城旅游规划构想_图文.ppt
- 临床研究协调员 Clinical research coordinator CRC 现.ppt
- 临建技术交底.doc
- 中考英语语法温习ppt课件定语从句(共28张ppt).ppt
- 临沧文化中心代建方案.doc
- 乌江镇集体土地征地拆迁安置方案.doc
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
文档评论(0)