基于信息检索的词汇本体知识研究.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于信息检索的词汇本体知识研究.doc

基于信息检索的词汇本体知识研究   一、引言 :网络时代和信息检索   随着网络技术的进步和互联网用户的猛增,网上的信息呈几何级数爆炸性地增长.其中,约80%是用自然语言表示的信息,简称”文本信息”.在这海量信息中,用户要发现自己所需要的信息,犹如大海捞针一样困难.于是,信息的组织和提供,特别是怎样从文本中找到用户所需要的信息,就成为语言信息处理技术研究的一个紧迫的课题.最近几年来,一些面向真实文本的自然语言处理(Natural Language Processing,NLP)技术,包括信息检索、自动文摘、信息抽取等,发展很快,也开发出一些实用的产品,但其处理效果并不能满足用户的需要.比如,环球网上提供的各种有哪些信誉好的足球投注网站引擎,基本上都采用基于关键词匹配的技术,即根据用户提出的关键词,把包含这个关键词的各种文档按照某种顺序返回,让用户费时费力地从中寻找自己所关心的信息.用发展的眼光来看,它们最终都要被基于内容理解的智能检索技术(即语义有哪些信誉好的足球投注网站)所淘汰.要想开发基于语义和内容的检索系统,又依赖于充分的词汇本体知识资源的支持.   有鉴于此,本文介绍信息检索、语义有哪些信誉好的足球投注网站、本体知识、词汇本体知识等基本概念及其相互之间的关系,特别是Ontology这个概念的内涵从哲学本体论到信息技术的本体知识的演进、本体知识系统的构造与类别、跟汉语相关的词汇本体知识库的建设、本体知识特别是词汇本体知识对于信息检索和语义有哪些信誉好的足球投注网站的作用.希望向自然语言处理及其应用研究的学者展示词汇本体知识的特殊资源价值,同时也为语言学研究人员提供一些通向当代语言信息处理技术的路径,为汉语词汇学的研究注入面向工程应用的活力.   二、语义有哪些信誉好的足球投注网站和词汇本体知识   所谓信息检索(information retrieval)是指把信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术.显而易见,在当今网络化的信息时代,为了有效地利用互联网上海量的信息,必须有卓越的信息检索技术,来根据用户的信息需求,从大规模、非结构化的信息集合中有哪些信誉好的足球投注网站特定的信息项目(包括文本、声音、图像、数据等).但是,目前通行的基于关键词匹配的有哪些信誉好的足球投注网站技术不考虑查询请求跟网上文本在语义上的匹配,因而在查全率和查准率两个方面都不尽人意.为了解决这个问题,必须发展智能性的语义有哪些信誉好的足球投注网站技术,让真正符合用户信息需求的文档即时返回给用户.   所谓语义有哪些信誉好的足球投注网站(semantics-based search),指基于查询(queries)和文档在知识和语义上的匹配的有哪些信誉好的足球投注网站技术,区别于目前常规的基于关键词匹配的有哪些信誉好的足球投注网站技术.其中,怎样为用户的信息需求建立模型,就成为语义有哪些信誉好的足球投注网站首先必须解决的技术难题.因为语义有哪些信誉好的足球投注网站追求的是查询和文档之间在语义(包括知识和内容)上的匹配,所以对用户的查询请求必须用合适的语义(概念)框架来进行系统的表示.在目前的技术条件下,本体知识无疑是一种最合适的概念模型和知识表示工具.所谓本体知识(ontology)①,在人工智能领域指对于共享概念的明确、规范的表述,其目标是描述相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇/术语,并从不同层次的形式化模式上给出这些词汇/术语及其相互之间关系的明确定义.也就是说,一个本体知识能够为需要在某个领域分享信息的用户定义这个领域的概念词典/术语表,其中包括了这个领域的基本概念及其关系的机器可读定义.有了合适的基于词汇的本体知识体系,就可用以对用户的查询词语和网页文档进行语义内容和概念类别分析,进行语义和概念层面的比对和匹配,从而帮助有哪些信誉好的足球投注网站引擎系统能够检索到跟用户的查询需求比较吻合的文档序列,并根据两者的相关性进行合理的排序.   由于用户的查询通常是用一个词或短语来表示他对信息的需求,因而基于语义的有哪些信誉好的足球投注网站技术需要词汇本体知识作为基础资源.所谓词汇本体知识(lexical ontology),指对一种语言的有关词汇所表示的概念(词义及相关的百科知识)的明确、规范的表述,通常用类框架结构,通过机器可读的格式,把概念、定义、关系、规则、目标语翻译、同义词、词性、父域信息和子域信息等知识内容有效地组织起来.   三、Ontology的内涵演进和本体知识的结构与类别   由于本文讨论的本体知识对许多语言学者来说还是比较陌生的,因而下面首先介绍国内外学术界对于本体知识的有关研究,内容包括 :Ontology这个概念的内涵的技术演进、服务于信息处理的本体知识的构造与类别.   1. Ontology的内涵的技术演进 ??? 本体论(ontology)本来是哲学上研究存在(being)的性质及其内在关系等抽象本质的理论.在人工智能、知识工程等计算机科学与技术领域中,本体知识(ontology)指有关领域对共享概念的正规、明确的表述.即以机器可读的格式来定义概念及其关系,用概念的层级体系来

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档