分布式数据环境下关联规则挖掘算法研究-计算机应用技术专业论文.docxVIP

分布式数据环境下关联规则挖掘算法研究-计算机应用技术专业论文.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据环境下关联规则挖掘算法研究-计算机应用技术专业论文

II II 要 近些年来,人们收集数据、存储数据的能力得到了空前的提高,我们可以轻 而易举地获得海量数据,在这些海量数据背后隐藏着许多重要的信息,理解它们 已经远远超出了人的能力,这就需要一种强有力的数据库分析工具。数据库知识 发现(KDD)就是为顺应这种需要而发展起来的一门学科,它用来进行数据分析,发 现重要的数据模式,并且已经成为一个重要而活跃的研究领域。 数据挖掘被视为数据库知识发现过程的一个基本步骤,它已引起了信息产业 界的极大关注,其主要原因是“数据丰富,但信息贫乏”,为了有效利用这些海 量数据,如何将它们转换为有用的信息和知识就成为当务之急。随着计算机和网 络技术的发展,我们可以方便地获取 Internet 上的各种信息资源,传统的集中式数 据挖掘已经不能满足需要。企业的数据资源往往规模大、动态增长并且存在于地 理上分布的各个数据库中,把所有数据集中在一起进行处理既不可取,也不可行, 这使得数据挖掘系统必须具有分布式挖掘的能力。基于分布式信息资源的数据挖 掘日益受到人们的关注,成为信息科学研究领域中一个新的课题。 关联规则挖掘是近些年来研究较多、应用也最为广泛的数据挖掘方法。关联 规则挖掘于 1993 年由 Agrawal 等人提出,它最初是以分析事务数据库中项与项之 间的联系为目标,后来的研究者们对问题原型进行了多方面的改进和扩充。关联 规则挖掘问题的关键是频繁项集的产生,Apriori 算法是一种经典的挖掘布尔关联 规则的算法,本文将用它在局部站点来产生频繁项集。 分布式数据环境下的关联规则挖掘算法中,时间开销主要体现在两方面:(1) 频繁项集的确定;(2) 网络的通讯量。本文提出了一种基于 Web Services 框架的 改进算法 DARM(Distributed Association Rules Mining),成功地克服了 FDM 算法 中可能造成频繁项集丢失的缺点,保证了数据挖掘结果的完整性和正确性,同时 也减少了站点间的通讯量。 关键词:分布式数据环境;数据挖掘;关联规则;知识发现;Web Services PAGE PAGE IV Abstract In the last decade, we have seen an explosive growth in our capabilities to both of collecting and storing data, and generate massive data by further computer processing. Interpretation and understand for massive data are beyond our ability. As a result, a powerful analysis tool is needed to be developed. Consequently, the discipline of knowledge discovery in databases(KDD), which used for analyzing data and discovering important data model, has evolved into an important and active research area. Data mining is a step in the knowledge discovery process. The major reason that data mining has attracted a great deal of attention in the information industry in recent years is due to “We are drowning in data, but starving for knowledge”. It is urgent matter to convert such data into useful information and knowledge. With the increasing developments of computer and network technology, we can easily access the Internet information resources, but the traditional centralized data mining can not meet the needs. Data repositories are large in size, dynamic, and physically distributed

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档