“蒙古语名词语义信息词典”的开发与应用 .pdfVIP

“蒙古语名词语义信息词典”的开发与应用 .pdf

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

“蒙古语名词语义信息词典”的开发与应用

海银花;那顺乌日图

【摘要】2009年至今,“蒙古语名词语义信息词典”(以下简称为“名词语义词

典”)通过几年的开发目前词典基本成形,并且有了显著的新进展.其新进展主要体现

在词条的扩充、属性字段的增添及其初步应用.该文概要介绍“名词语义词典”的

研发过程,实例说明这部词典的新进展和初步应用情况.

【期刊名称】《中文信息学报》

【年(卷),期】2015(029)003

【总页数】6页(P190-195)

【关键词】蒙古语名词;语义信息词典;开发;应用

【作者】海银花;那顺乌日图

【作者单位】内蒙古大学蒙古学学院,内蒙古呼和浩特010021;内蒙古大学蒙古学

学院,内蒙古呼和浩特010021

【正文语种】中文

【中图分类】TP391

“蒙古语语义信息词典”是基于“蒙古语语法信息词典”研发的一部面向蒙古语语

句自动处理的语言知识库。它以数据库文件形式收录5.7万个词条,不但给出每个

词语所属的词类、语义分类、近义、反义、同形等基本语义属性之外,而且以义项

为单位详细描述了它们的各种语义搭配限制和配价信息。无论是基础研究还是应用

开发,它是一部基于蒙古语词汇的语义属性描述体系,为满足计算机语义自动分析、

词义消歧等更深层次的语言信息处理提供形式化语义知识。整个词典的研发进程包

括如下内容:

(1)充分表示蒙古语词语语义关系和语义层次的词语语义分类框架体系及其相关标

记集,它是面向语义分析和语义生成的蒙古语词语语义属性描述体系。主要包括七

项大类、198项子类的名词语义分类体系及其标记集;六项大类、217项子类的形

容词语义分类体系及其标记集;以及五项大类、121项子类的动词语义分类体系

及其相应的标记集。

(2)描述每个词语翔实语义信息的“名词语义信息词典”、“形容词语义信息词典”

和“动词语义信息词典”等蒙古语三大词类的知识库,其各自囊括的信息量和信息

总量计算如表1所示。

(3)针对该词典是一部尽可能从多角度、多层次上描述现代蒙古语常用词语语义特

征的知识库这一特点,开发了“蒙古语同形词知识库”、“蒙古语多义词词典”、

“蒙古语连接形式知识库”等三个辅助库[1]。

(4)集语法信息与语义信息于一身的语言知识库管理平台。为了更好地管理并补充

和完善蒙古语语言知识库中的词条及语法、句法、语义信息的统一性和完整性,管

理平台对各个资源库设计了若干个MDI子节点窗体,分别实现了添加、修改、删

除、查询、浏览和校对等功能和一系列连贯操作。

本课题是已有国家自然科学基金项目的原有成果“蒙古语语法信息词典”的继承和

延伸。譬如,“名词语义词典”14105词条的直接来源为语法信息词典“名词分

库”的原有词条[2],“形容词语义词典”的11025余词条是通过扩充语法信息

词典“形容词分库”的7600余词条而获取的[3]。词典管理平台集成语法信息和

语义信息的同时具备了对于语法信息词典和语义信息词典均可进行科学的管理和维

护功能[4]。

2.1语义分类体系及其标记集

我们充分利用有关蒙古语词语语义分类前人研究成果,借鉴和参考英语、汉语等其

他语言的词语语义分类体系的同时,根据名词的基本词汇语义把蒙古语14105个

常用名词进行语义分类。整个语义分类体系包括事、物、智慧、时间、空间、动作、

度量等七个大类,198个子类,具有九个层次,如图1所示。有关名词语义分类

体系另有一篇文章详述[5]。由于该分类体系是针对“名词语义词典”的开发而研

制,所以词典库中的“大语义类”和“子语义类”等两个属性字段的取值来源于该

分类体系。

2.2语义属性描述

“名词语义词典”数据库中填置了22个属性字段及其相应的取值。我们把22种

语义属性信息可以归纳为“连接信息”、“基本语义信息”、“语义分类信息”、

“搭配规则信息”和“配价信息”等五种大类,其各自囊括的属性字段如表2所

示。

词典数据库中设制的属性字段名称和取值翔实说明如表3所示。

如同上述,该词典较全面地、翔实地描述了蒙古语名词的语义特征。例如,名词

“”(根)在词典中的属性描述有:【1】序号:[121];【2】蒙古文:【3】音标:

[UNDUSU];【4】词类:[不可数名词];【5】释义:[①高级植物器官之一。

②事物根源][7];【6】义项:[①];【7】同形词:[];【8】近义词:[VG];

【9】熟语:[UNDUSU-TEI-DEGENVRGVDAG,UR_E-T

文档评论(0)

181****6682 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档