Lucene在数据库全文检索中的性能研究.pdfVIP

Lucene在数据库全文检索中的性能研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Lucene在数据库全文检索中的性能研究.pdf

第32卷第6期 微 计 算 机 应 用 V01.32No.6 2011年 6月 MICROCOMPUTERAPPLICATIONS Jun.2011 Lucene在数据库全文检索中的性能研究 吴代文 杨方琦 (渭南师范学院 传媒工程系 陕西 714000) 摘要:通过LuceneAPI实现对MYSQL数据库的全文检索,并将 Lucene全文检索的性能和查全率同数据库全文检索和Like子 句检索作对 比。通过对比发现Lucene全文检索在性能上接近数据库全文检索 ,检索耗时约为Like子句检索的1/5。在对中 文检索方面能达到77.2%的查全率,大大高于数据库全文检索。因此对于数据量较大的MYSQL数据库,Lucene全文检索将 是一个很好的选择。 关键词 :Lucene全文检索 Like子旬检索数据库全文检索 MYSQL ThePerformanceStudyofDatabaseFull—-TextRetrievalBasedonLucene WU Daiwen.YANG Fangqi (ColledgeofMediaEngineering,WeinanTeachersUniversity,Shanxi,714000,China) Abstract:ItimplementstheFull—TextRetrievalinMYSQLDatabasebyLuceneAPI.Andcomparestheperformanceandrecall—pre· cisionofLucenefulhextretrievalwiththatofdatabasefulhextretrievalnadLikeclausesretrieva1.ThroughcomparingwefoundLucene iSclosetothedatbaaseinfulltextretrieval performance.thetimeconsumingofLuceneiS1/5thatofLikeclausesretrieva1.whatiS more.theLucenefulltextretrievalcanachievethe77.2% recallratioinchineseretrievalaspects。tl1atiSsubstantiallyhigherthandata. basefulhextretrieva1.Therefore,asforMYSQLdatbaasewithlargerqunatitydata,11heLucenefulltextretrievalwillbeagoodchoice. Keyword:LuceneFuU—TextRetrieval,Likeclausesretrieval,datbaasefulhextretrieval,MYSQL 近年来 ,随着一个开源的高性能全文检索引擎 Lucene的出现,基于Lucene的应用和二次开发越来越 多。只要是能用上全文检索的软件系统中都可以集成 Lucene的全文检索功能。然而众所周知,MYSQL数 据库可以通过SQL的Like子句实现字符串检索,而且MYSQL数据库本身也带有全文检索功能。那么Lu— cene全文检索、MYSQL数据库全文检索和Like子句检索之间的性能如何呢?本文即将进行这方面的实验。 1 实验设计 本文选用的数据库为 MYSQL,因为MYSQL支持全文检索功能。用SQL语句 “select木from表名 where Match(字段名)Against(关‘键词 ’)”即可实现对数据库的全文检索。此时要求数据库表引擎类型为 “My— ISAM”… , 因为只有这个引擎才支持全文本有哪些信誉好的足球投注网站。而用SQL语句 “select from表名where字段名 Like% 关键词% 可实现数据库的字符串检索 ]。本文在数据库中设计一张数据表格,通过程序导人部分文本数 据。然后用java编写相应程序分别实现三种方式的检索,通过比较三种检索耗时和查全率来区分三种检索 方式的优劣。 本文于2011一O1一l4收到。 ·资助项 目:教育部特色专业建设点项 目编号:TSl1

您可能关注的文档

文档评论(0)

gr4d52fg46fr3df + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档