隐含语义索引在吉林省农业知识问答系统中应用.docVIP

隐含语义索引在吉林省农业知识问答系统中应用.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
隐含语义索引在吉林省农业知识问答系统中应用   摘要:为了解决现有农业知识问答系统功能及业务流程中存在的一些问题,将隐含语义索引技术应用于吉林省农业知识问答系统中。该技术可以增强或消减词语在文档中语义的影响力,使文档之间的语义关系更为明晰,在一定程度上实现了自然语言检索,消除了词语同义性和多义性所造成的影响,从而取得更好的检索效果。   关键词:隐含语义索引;吉林省;农业知识;问答系统   中图分类号:TP391文献标识码:A文章编号:0439-8114(2011)13-2740-03      Application of Latent Semantic Index in Agricultural Knowledge Question Answering System of Jilin Province      XIAO Yan-hua,WANG Qing-lan,BI Ye-li,WAN Fa-ren   (Agricultural Economy and Information Service Center, Jilin Academy of Agricultural Sciences, Changchun 130124, China)      Abstract: The latent semantic index technology was applied to solve some problems with the existing function and in the professional process in agricultural knowledge question answering system. This technology could enhance or reduce the influence of words on the semantic in the document and it also could make the semantic relationships more clear, thereby realized the natural language search to a certain extent. The interference from identity and poly semantics was eliminated and better search results obtained.   Key words: latent semantic index; Jilin province; agricultural knowledge; question answering system      农业作为基础产业,是社会信息化不可或缺的一部分,所以农业必然会受到以计算机网络技术、多媒体技术和智能技术为特征的信息化浪潮的洗礼。目前农业科技人员和农民经常借助各种有哪些信誉好的足球投注网站引擎进行农业信息有哪些信誉好的足球投注网站。由于有哪些信誉好的足球投注网站引擎不是为农业领域设计的,多数有哪些信誉好的足球投注网站的结果往往不能满足他们的需求,农业知识问答系统正是在这种情况下发展起来的。   从大量农业信息中迅速而准确地获取最需要的信息是农业知识问答系统发展的困难之一。如何使现有的吉林省农业信息资源得到充分有效地利用,提高吉林省农业信息化服务的质量,已经成为农业科研人员研究的一个热点。隐含语义索引(LSI)是近年来逐渐兴起的不同于关键词检索的有哪些信誉好的足球投注网站引擎解决方案,其检索结果的实际效果更接近于人的自然语言,在一定程度上提高了检索结果的相关性,目前已被逐渐地应用到图书馆、数据库和有哪些信誉好的足球投注网站引擎的算法当中。隐含语义索引通过对原文档库的词-文档所建立的矩阵的奇异值分解计算,进而取其前k个最大的奇异值,然后用对应的奇异矢量构成一个新矩阵,用其近似地表示原来文档库的词-文档矩阵。因为新的矩阵消减了词和文档之间语义关系的模糊度,所以这种方法更有利于信息检索。   1隐含语义索引的基本原理   因为文本和词汇之间存在着一定的相关性,所以若干篇文本和若干个词汇由他们之间的相关性构成语义模型;使用数学的算法和计算机技术,分析此模型并对其进行计算和处理,保留文本与词汇间最主要的相关性,去除其他冗余、次要的影响因素,于是得到了优化后的模型;最终构成的语义结构和原始的文本、词汇的相关结构进行比较,规模要小很多,并且还保留了其中主要的相关性,用此模型挖掘文本和词汇的隐含关系;在即将进行的检索中,用该语义结构作为基础,统计出词汇与文本间的隐含相关度[1]。   在向量空间中,每个文档都可以表示成词的向量空间矢量Di=(wi1,wi2,…,wim)(T1,T2,…,Tm)T,这样每个词条也就可以表示为文档空间的矢量Tj=(w1j,w2j,

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档