- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML的web数据挖掘实现
·56 ·2005 年2 月上半月刊 中国西部科技
基于XML 的web 数据挖掘实现
王秀庆 陈力群 (绍兴文理学院计算机系 绍兴 312000)
摘 要:本文分析了 数据挖掘技术的难点提出了基于 的 数据挖掘的实现过程。
Web , XML Web
关键词: 数据挖掘
Web XML HTML
1 Web 数据挖掘的引入 需求,因为WEB 上的数据不仅表现形式多样,而且数据
1.1 数据挖掘的概念 和数据之间的关系非常复杂。为了解决这个问题,产生
数据挖掘又称知识发现( 了 数据挖掘技术,使数据库技术进入一个更高的阶
Knowledge D iscovery in Dat- Web
abase,简称KDD),是从大量数据中抽取有意义的、隐含 段。 数据挖掘技术不仅能够对数据进行查询和遍历,
Web
的、以前未知的并有潜在使用价值的知识的过程。数据 还能够找出数据间的潜在联系,从而促进信息的传递,逐
挖掘是一个多学科交叉性学科,它涉及统计学、机器学习、 渐成为数据挖掘技术研究的热点。
数据库、模式识别、可视化以及高性能计算等多个学科。 但是Web 上的数据挖掘是一项复杂的技术,它要比
数据挖掘技术可以分析各种类型的数据,例如结构化数 单个数据仓库的挖掘要复杂得多,因而面向Web 的数据
据、半结构化数据以及非结构化数据、静态的历史数据和 挖掘是一个复杂困难的过程。随着XML 技术的出现,为
动态数据流数据等等。充分利用有用的数据,废弃虚伪 解决Web 数据挖掘的难题带来了新的契机。因为XML 不
无用的数据,是数据挖掘技术的最重要的应用。 仅为Internet 的数据交换提供了标准,而且XML 技术从
1.2 Web 数据挖掘的引入 数据角度提供了一个更好的表示数据内容和数据所代表
Internet 的迅速发展和普及,致使网络信息资源急剧 意义的手段。它将解决Web 数据挖掘技术中的半结构化
增长。在这些海量数据的背后隐藏着许多重要信息,人 数据模型以及半结构化数据模型的抽取问题。可以说
们为了更好的利用这些数据,开始对其进行更深层次的 XML 促进了信息的交流,也为Web 数据挖掘提供了更广
分析。但是传统的数据库查询技术已经无法满足人们的 阔的结构化信息平台。
是那些新建工业区或居民楼以及与宽带传输系统共处一 构上适于点到点或环形结构。而F TTH 用于居民住宅用
地的场合。 户,业务量需求很小,因而经济的结构必须是点到多点方
③光纤到家( ) 和光纤到办公室( ) 。在原来 式。
FTTH F TTO
的FTTC 结构中,如果将设置在路边的ON U 换成无源光 3 结束语
分路器,然后将ON U 移到用户家,即为FTTH 结构。如果 数字技术的应用,通信、广播电视和计算机的结合,
(
将ON U放在大企事业用户 公司、大学、研究所、政府机关 已经给接入网领域带来了巨大的活力,也严重冲击了传
)
等等 终端设备处,并能提供一定范围的灵活的业务,则构 统观念。大量的研究工作和剧烈的商业竞争,给这个领
成所谓的光纤到办公室( ) 结构。 和 是 域带来了多种技术。对于任何一种通信需求,都有一种
F TTO FTTO
文档评论(0)