基于Lucene的有哪些信誉好的足球投注网站引擎技术在综合查询系统中的应用.docVIP

下载本文档

5
0
约 5页
2017-10-25 发布于北京
举报
版权申诉

基于Lucene的有哪些信誉好的足球投注网站引擎技术在综合查询系统中的应用.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Lucene的有哪些信誉好的足球投注网站引擎技术在综合查询系统中的应用　　摘要摘要：有哪些信誉好的足球投注网站引擎技术应用广泛。Lucene作为一个优秀的有哪些信誉好的足球投注网站引擎开源工具包，可方便实现相关有哪些信誉好的足球投注网站引擎功能。介绍了Lucene有哪些信誉好的足球投注网站引擎工具包，在此基础上，利用Lucene开发工具包，设计并实现了综合查询系统中有哪些信誉好的足球投注网站引擎功能。阐述了网络爬虫子系统、索引子系统和查询子系统3个模块功能。　　关键词关键词：有哪些信誉好的足球投注网站引擎；网络爬虫；Lucene技术；Suggestion提示　　DOIDOI：10.11907/rjdk.1511256 　　中图分类号：TP319文献标识码：A文章编号文章编号2017）001012603 　　引言　　随着互联网技术的迅猛发展，形成了海量Web交互数据，有哪些信誉好的足球投注网站引擎成为用户在海量数据中获取有用信息的重要技术手段。综合查询系统作为当前管理信息系统的重要组成部分，承担了系统查询的大部分功能，是用户进行查询的重要接口。综合查询系统包括快速查询、模糊查询、组合查询、关联查询等功能，一般是用户根据查询要素进行查询，例如输入某人的学号来查询确切信息。但是在很多查询场合，用户往往不清楚自己所掌握的数据是哪一个查询要素，例如只知道一个编号，但是不清楚这个编号是学号还是其它编号，这样就无法根据查询要素查询，导致查询效率大大降低。综合查询系统迫切需要一种类似有哪些信誉好的足球投注网站引擎的服务来方便用户使用。　　本文设计了一种基于Lucene的有哪些信誉好的足球投注网站引擎技术在综合查询系统的应用方案，并详细阐述了该方案的设计与实现。　　1Lucene开发工具包　　Lucene作为一个优秀的有哪些信誉好的足球投注网站引擎开源工具包，可以4结语　　代码质量问题已成为制约软件持续发展的主要因素。代码质量问题包括多个方面，但特征不够明确和统一，自动检测效果差，这些都为代码质量检查增加了难度[7]。可控性作为代码质量评价的重要指标，越来越受到信息企业的关注[8]。它在整个产品线的长远发展方面发挥着重要作用，有助于构建完整的软件产品“生态系统圈”。可控性不仅是代码质量理论，更需要应用在程序编码实践之中。遵循可控性原则进行方案设计和代码实现，可进一步提高代码质量，监督控制程序代码修改的风险，增加软件产品应对需求变化的灵活性。　　2基于Lucene的有哪些信誉好的足球投注网站引擎技术实现2.1网络爬虫设计与实现　　网络爬虫是通过网页的链接地址来寻找网页信息，通常从网站的首页开始读取网页内容，从中抽取网页中的超链接地址，然后通过这些链接地址寻找下一个网页，如此循环，直到把网站所有的网页都抓取为止[2]。有哪些信誉好的足球投注网站策略包括广度优先或深度优先两种形式。　　网络爬虫根据抓取过程分为3个功能模块：①网页源文件获取。通过获取网页的输入流，将网页源文件信息提取出来；②网页超链接地址抽取。这个模块就是分析网页信息，抓取URL列表；③网页文件写入磁盘。这个模块主要是将网页数据写入磁盘，然后进行索引查询。　　2.1.1网页源文件获取　　通过与指定URL链接，获取网页输入流，然后逐字符把网页源文件输入到一个字符串变量中。这一部分用到J包下的URL类和URLConnection类，主要代码如下：　　.1.3网页源文件写入磁盘　　因为文件名不能包括“/”等特殊字符，所以这部分要利用StringTokenizer类把每个获得的超链接以“/”分隔，然后按照分隔出来的字符串依次建立相应的文件夹。例如：/english/index.asp依次创建文件夹，然后是其子文件夹english，最后是最内层文件夹index.asp，还要创建一个FileWriter对象把网页源文件index.asp写入到最内层的文件夹中。　　实现网络爬虫功能后，网页数据就写入磁盘，然后索引子系统要对这些网页源文件进行索引。　　2.2索引子系统设计与实现　　由于经过网络爬虫搜集的数据是在数据库中存储的，所以需要利用Lucene对数据库中的数据进行索引。有两种方式实现创建索引：①实时索引。在信息系统添加数据时就为该数据添加索引；②定时创建索引。文件为配置时间，在指定时间创建索引。索引完后就可以在索引文件中进行查询，把结果返回给用户。　　2.2.1实时创建索引　　实时创建索引是业务系统在增加数据时为新数据添加索引。本文设计实现了一个创建索引的公共方法createIndex，参数为新增加的数据对象。在该方法中使用Lucene有哪些信誉好的足球投注网站引擎包提供的IndexWriter对象向索引文件夹中写入索引文件。创建索引时先从配置文件中读取索引文件夹位置，判断索引文件夹中是否存在索引文件。如果不存在则直接在索引文件中写数据，如果已经存在，则向索引文件夹追加数据并不覆盖原有数据；然后使用addDocument方法，把要索引的数据库字段放到Document对象的Field中。Doc