[网络信息爬取使用说明.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[网络信息爬取使用说明

网络信息爬取管理系统 文件状态: 【√】草稿 【 】正式发布 【 】正在修改 项目名称 网络信息爬取管理系统 文档名称 使用说明书 文件标识 YOUOO.WDIW.APP.SPIDER 当前版本 V1.0 作者 马松 完成时间 YYYY-MM-DD 页数 密级 中 使用说明书 成都友有网络科技有限公司 2011年10月 文档控制 修改记录 起止日期 修改类型* 作者 参与者 版本 备注 2011-10-27——YYYY-MM-DD A 马松 V1.0 * 修改类型分为 A—Added M—Modified D—Deleted 审阅人 姓名 职位 审阅签字 存档 存档号 地点/位置 备注 概述 1.1背景 公司品财经网站每天需要繁琐的去收集新闻信息,为了减轻客服人员的负担,开发此系统进行自动的数据爬取。当然也可以应用于各种数据的爬取。 1.2应用领域与使用对象 该系统主要用于有一定程序基础的人员。 1.4参考资料 列出有关资料的作者、标题、编号、发表日期、出版单位或资料来源,可包括 与该产品有关的已发表的资料 文档中所引用的资料,所采用的软件标准或规范或业务规则 编号 资料名称 简介 作者 日期 出版单位 列出编写本说明书时查阅的Internet上杂志、专业著作、技术标准以及他们的网址 网址 简介 Web-Harvest是一个用Java写的开源的Web数据提取工具. 1.5术语与缩写解释 列出本文中用到的专门术语的定义 缩写、术语 解释 Web-Harvest 一个用Java写的开源的Web数据提取工具. 系统综述 2.1系统结构 2.2系统功能简介 本软件主要分为3个大模块,分别为爬取信息管理、数据源管理、数据库连接管理。只需根据所爬取网页编写一个配置文件,就能轻松爬取到你想要的精确数据。 2.3性能 该系统可以支持1000个爬取信息同时爬取网络信息。 2.4版权声明 声明版权所有者以及盗版应承当的法律责任。 运行环境 3.1硬件设备要求 本软件要求在PC及其兼容机上运行。 要求奔腾Ⅱ以上的CPU。 要求64MB以上的内存。 要求10GB以上的硬盘。 3.2支持软件 本软件要求在PC及其兼容机上运行。 操作系统在Windows 98以上的系统、Linux等。 操作系统要支持Java ,JDK版本1.6以上。 需要安装Tomcat6.0以上。 3.3数据结构 该软件所需数据库:MySQL 系统操作说明 首先用图表的形式说明软件的功能同系统的输入源机构、输出接收机构之间的关系。 4.1安装与初始化 4.1.1 安装JDK 由于该系统是由JAVA开发的,所以第一步需要用户下载JDK并进行安装。 下载地址: /download/jdk6/6u10/promoted/b32/binaries/jdk-6u10-rc2-bin-b32-windows-i586-p-12_sep_2008.exe 安装完成后需要进行环境变量的设置。进入环境变量:右键我的电脑-选择属性-高级-环境变量。(如图:4.01) 图4.01 进入环境变量后,在系统变量栏点击新建,变量名为JAVA_HOME,变量值为你的JDK的安装路径。例如:本机的JDK安装在C:\Program Files\Java下面,而该目录下面有一个jdk和jre的文件夹,选择jdk的那个文件夹,最后则是C:\Program Files\Java\jdk1.6.0_07作为变量值。(如图:4.02) 图4.02 设置完JAVA_HOME路径后,添加到系统变量Path后面。路径为:%JAVA_HOME%\bin; (如图:4.03) 图4.03 至此Java的JDK配置成功。测试成功与否可以在命令行输入:java 。会有当前JDK的版本信息。 4.1.2 安装Tomcat Tomcat基本上都是绿色版本的,解压就可以用。 下载地址:/index.html 下载解压后,在环境变量里面配置Tomcat。首先配置CATALINA_BASE和CATALINA_HOME,其值都是Tomcat的根目录。(如图4.04) 图4.04 配置classpath环境变量。值为以下变量。 %JAVA_HOME%\dt.jar;%CATALINA_HOME%\common\lib\servlet-api.jar;(如图4.05) 图4.05 加入到在环境变量path中。%CATALINA_

文档评论(0)

zhonhua5000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档