基于Lucene的图书垂直有哪些信誉好的足球投注网站引擎探析.pdfVIP

基于Lucene的图书垂直有哪些信誉好的足球投注网站引擎探析.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于 Lucene 的图书垂直有哪些信誉好的足球投注网站引擎探析 基于 Lucene 的图书垂直有哪些信誉好的足球投注网站引擎探   随着信息的多元化发展和互联网信息的急剧增长,互联网上的图书信息也在急剧增加 ,在这种现状下,通用的有哪些信誉好的足球投注网站引擎已经不能快速、全方位的帮助用户查找相关信息资料, 而图书垂直有哪些信誉好的足球投注网站引擎的出现适时的帮助用户解决了这一难题。这是由于与通用的有哪些信誉好的足球投注网站引擎 相比,图书垂直有哪些信誉好的足球投注网站引擎的有哪些信誉好的足球投注网站结果更实用、更准确和更精确。比如某用户想要找某一主 题的图书,通常情况下需要通过有哪些信誉好的足球投注网站引擎有哪些信誉好的足球投注网站到许多个图书类站点,然后到每一个网站上 去寻找需求的图书,而图书垂直有哪些信誉好的足球投注网站引擎则能够按照该图书的主题,把符合该主题的图书 一次性全部有哪些信誉好的足球投注网站出来,显示在检索界面中以供用户选择,这样可以为用户节省大量的时间 ,而且检索到的图书信息更加全面,方便了用户的需求。   1.垂直有哪些信誉好的足球投注网站引擎概述   垂直有哪些信誉好的足球投注网站引擎是一种具有行业色彩的有哪些信誉好的足球投注网站引擎,是通用有哪些信誉好的足球投注网站引擎的细分和延伸,是对 网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以 某种形式返回给用户。垂直有哪些信誉好的足球投注网站是相对通用有哪些信誉好的足球投注网站引擎的信息量大、查询不准确、深度不够 等提出来的新的有哪些信誉好的足球投注网站引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需 求提供的有一定价值的信息和相关服务,如图书垂直有哪些信誉好的足球投注网站引擎、汽车垂直有哪些信誉好的足球投注网站引擎、房产 垂直有哪些信誉好的足球投注网站引擎等。垂直有哪些信誉好的足球投注网站引擎具有“专、精、深”的特点,相比较通用有哪些信誉好的足球投注网站引擎的海量信 息无序化,垂直有哪些信誉好的足球投注网站引擎则显得更加专注、具体和深入。   垂直有哪些信誉好的足球投注网站引擎主要由三部分组成:抓取模块、索引库模块和检索模块,如图(1)所 示。      图(1)垂直有哪些信誉好的足球投注网站引擎组成结构   2.图书垂直有哪些信誉好的足球投注网站引擎结构分析   图书垂直有哪些信誉好的足球投注网站引擎结构上也主要分三个部分,实现图书信息采集的抓取系统,建立图 书信息索引的索引库系统,以及直接面向用户的检索系统,其结构如图(2)所示。      图(2)图书垂直有哪些信誉好的足球投注网站引擎结构图   (1)图书信息的采集   在图书信息的采集过程中,首先要对图书信息采集条件进行相关设置,然后利用网络 爬虫工具通过 URL 来采集网页图书信息,抽取网页的图书内容并将这些图书网页信息存储 在图书信息数据库,接着找到原始网页中的其它链接地址,通过这些链接地址寻找下一个 图书网页,就这样循环,直到将相关网站所有的图书网页都抓取完为止。   (2)建立图书信息索引库   建立图书信息索引库,主要是针对网页采集到的图书信息进行分析,利用分词处理技 术对图书文本进行处理,可根据图书的主题、出版社、丛书名、作者等(用户可以按照这 几种分类信息来检索图书),以及之前将该图书信息存储到图书信息数据库时的 ID ,按照 相应的规则存入图书信息索引库中,来为索引系统服务。而在 Lucene 中,图书信息索引 的建立可以直接由 Lucene 提供的索引引擎实现。   (3 )图书信息检索   在图书垂直有哪些信誉好的足球投注网站引擎的用户接口处,用户在通过关键字(如图书的主题、出版社、丛 书名、作者等)检索图书信息时,检索系统会先在图书信息索引库中进行快速检索,得到 和关键字相关的图书信息,并进一步得到这些图书在图书论文联盟 www.LWlM.com 信息 数据库中的 ID ,再在图书信息数据库中查找与这些ID 对应的图书信息记录,最后将完整 的图书信息返回给用户,这样就完成了一次检索,这一检索过程可直接由 Lucene 提供的 查询引擎实现。   3.检索系统中基于 Lucene 的图书排名算法分析   在图书垂直有哪些信誉好的足球投注网站引擎实际检索过程中,有时根据用户关键词的局限性和不完整性所检 索到的图书信息会有很多页面,在这种情况下,怎样在用户检索接口处显示用户最希望得 到的图书信息就需要对检索系统中的检索算法进行分析,这里通过对 Lucene 基础检索算 法的分析,来探究图书垂直有哪些信誉好的足球投注网站引擎检索系统中图书信息排名的算法。   Lucene 是 Apache 软件基金会 4 Jakarta 项目组的一个子项目,是一个开放源代码的 全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构 ,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene 的目的是为软件开发 人员提供一个简单易用的工具包,以方便的在目标 统中实现全文检索的功能,或者是论文联盟 www.LWlM.com 以此为基础建立起完整的全 文检索引擎。Lucene 基础检索排序算法描述如下:   Score(d)=tf(t in d)*idf(t)*t.getBoost()*norm(t,d)   其中:   (1) tf(t in d)表示词条频率,即检索词条 t 在文档 d 中出现的

文档评论(0)

max + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档