基于Lucene 的索引系统的设计与实现[J].docxVIP

基于Lucene 的索引系统的设计与实现[J].docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2009 年 7 月 现 代 情 报 July , 2009第 29 卷第 7 期 Journal of Modern Information?工作研究?基于 Lucene 的索引系统的设计与实现黄少林  王  华  张玉红  蒋一峰(首都师范大学信息工程学院 , 北京 100037)〔摘  要〕索引系统是有哪些信誉好的足球投注网站引擎的数据大本营 , 在有哪些信誉好的足球投注网站引擎发展早期 , 能够索引的网页数量代表了整个行业的技术发展水平 。Lucene 全文检索技术是信息检索领域广泛使用的基本技术 , 它是一个优秀的开源全文本有哪些信誉好的足球投注网站技术框架 , 本文详细分析了索引系统相关技术和 Lucene 的索引系统结构 。〔关键词〕有哪些信誉好的足球投注网站引擎 ; 索引 ; lucene ; 倒排索引The Design and Implementation of Indexing System Based on LuceneHuang Shaolin  Wang Hua  Zhang Yuhong  Jiang Yifeng( School of Information Engineering , Capital Normal University , Beijing 100037 , China)〔Abstract〕 Index system is the data center of the search engine , at the beginning of the search engine , the number of thepages that can be indexed to represent the technology level of the whole industry. Lucene full - text retrieval , as a basic skill , is〔Key words〕search engine ; index ; lucene ; inverted index 无论在工业界还是在学术界 , 有哪些信誉好的足球投注网站引擎一致地被认为 中实现针对应用的全文索引/ 检索功能 。Lucene 的 API 接口分为下载 、分析 、索引和查询四大系统 , 这四大系统相互 设计得比较通用 , 输入输出结构都很像数据库的表 、记录配合共同实现有哪些信誉好的足球投注网站引擎的快 、全 、准 、稳的四大需求 。索 和字段 , 所以很多传统的应用的文件 、数据库等都可以比引系统是有哪些信誉好的足球投注网站引擎最核心的模块之一 , 索引过程就是将普 较方便的映射到 Lucene 的存储结构或接口中 。总体 上 看 ,通的文档形式转换为可快速检索的索引形式 。例如 , 书目 可以先把 Lucene 当成一个支持全文索引的数据库系统 。包含的目录 。其中每一条目就是一个索引 , 用来标识某个章节的页码 , 帮助读者快速浏览 , 索引就是这样一个短小 索引是在有哪些信誉好的足球投注网站时使用到的一种特殊的数据结构 。当文精炼的检索信息的信息 。建立索引可以大大提高有哪些信誉好的足球投注网站时的效率 。在使用索引进行查1  lucene 及索引技术介绍找时 , 首先对需要索引的文档进行预处理 , 建立关于这些文档的索引 结 构 。索 引 技 术 主 要 有 以 下 3 种 : 倒 排 索 引 ,Lucene 是 apache 软件基金会 jakarta 项目组的一个子项 后缀数组和签名文件 。其中 , 倒排索引技术在当前大多数目 , 是一个开放源代码的全文检索引擎工具包 , 即它不是 的信息检索系统中得到了广泛的应用 , 它对于关键词的搜一个完整的全文检索引擎 , 而是一个全文检索引擎的架构 , 索非常有效 , 在 lucene 中也是使用的这种技术 。后缀数组提供了完整的查询引擎和索引引擎 , 它为数据访问和管理 技术在短语查询中具有很快的速度 , 但是这样的数据结构提供了简单的函数 调 用 接 口 , 可 以方便的嵌入到各种应用 在构造和维护时都比较复杂一些 。签名文件技术在 20 世纪收稿日期 : 2009 - 02 - 26基金项目 : 北京市优秀人才专项项目 (20071A0501600220)作者简介 : 黄少林 (1983 - ) , 女 , 硕士研究生 , 研究方向 : 数据库应用 。— 169 —Vol129  No17〔中图分类号〕TP393109  〔文献标识码〕A  〔文章编号〕1008 - 0821 (2009) 07 - 0169 - 03widely field information excellent open - search technology framework. 2analyzed Lucene indexing structure in d

文档评论(0)

smdh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档