基于WEB挖掘的网络爬虫设计与实现-计算机系统应用.PDFVIP

基于WEB挖掘的网络爬虫设计与实现-计算机系统应用.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于WEB挖掘的网络爬虫设计与实现-计算机系统应用

计 算 机 系 统 应 用 2013 年 第 22 卷 第 9 期 基于 WEB 挖掘的网络爬虫设计与实现① 1 2 1 肖 毅 , 张 林 , 聂笑一 1(湖南农业大学 信息科学技术学院, 长沙 410128) 2(湖南农业大学 东方科技学院, 长沙 410128) 摘 要: 从介绍 Web 挖掘与数据挖掘的差异入手, 分析 Web 挖掘中 Web 爬虫的必要性和现代 Web 挖掘技术的发 展方向, 在深入了解 Web 爬虫的原理及其功能的基础上, 提出一个现代网站通用的挖掘模型, 并利用该模型设计 一种网络爬虫. 经实例证明, 该爬虫能高效爬取更多的各种页面数据. 关键词: 数据挖掘; Web 爬虫; 挖掘技术 Design and Realization of Web Crawlwer Based on Web Minning 1 2 1 XIAO Yi , ZHANG Lin , NIE Xiao-Yi 1(Information Science and Technology College, Hunan Agricultural University, Changsha 410128, China) 2(Orient Science Technology College, Hunan Agricultural University, Changsha 410128, China) Abstract: The diffeences between web-minning and data-mining were introduced in this paper firstly, then the necessity of Web crawler during web-minning and the development of modern web-minning technology were analysed. Based on the deep understanding of the principle and its function of Web crawler, a minning model popular in modern website was put forward, and a web crawler was designed by the use of this model. Tested by several examples, this kind of crawler can get more diversified pagedata efficiently. Key words: data-mining; Web crawler; Web-minning technology 随着互联网的不断发展和普及, web 成为人们不 1 数据挖掘与Web挖掘 可缺少的一部分, 同时也是人们获得信息的重要途径. 传统的数据挖掘又称为数据库知识发现. 是指从 如何充分有效地利用 web 中数量庞大的信息成为一个 数据源(如数据库、文本、图片、万维网等) 中探寻有用 不可回避的问题, web 数据挖掘技术也逐渐成为 web 的模式或知识的过程. 对于数据挖掘模式来说必须是 技术中的重要部分. Web 挖掘是指综合利用数据挖掘 有用, 有潜在价值的[2]. 它主要基于人工智能、机器学 技术对 Web 内容、Web 结构及 Web 日志等进行分析 习、模式识别、统计学、数据库、可视化技术等, 高 处理, 从中获得对决策制定有价值的各种信息的过程. 度自动化地分析企业的数据, 做出归纳性的推理, 从 Web 挖掘技术与传统的数据挖掘的比较, 主要区别在 中挖掘出潜在

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档