一种基于MapReduce架构的并行矩阵Apriori算法.PDFVIP

一种基于MapReduce架构的并行矩阵Apriori算法.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于MapReduce架构的并行矩阵Apriori算法

优先出版 计 算 机 应 用 研 究 第34 卷 一种基于MapReduce 架构的并行矩阵Apriori 算法* 1 2, 3 谢志明 ,王 鹏 (1.汕尾职业技术学院 信息工程系,广东 汕尾 516600 ;2 .成都信息工程学院 并行计算实验室,成都 610225 ;3.中 国科学院成都计算机应用研究所,成都 610041) 摘 要:传统数据挖掘关联规则 Apriori 算法直接移植到云计算平台,数据挖掘效率虽然有了数量级的提升,但由于需 要频繁地扫描事务数据库,增加了系统I/O 、内存和通信的开销。提出一种基于矩阵的并行关联规则算法Apriori_MMR , 该算法结合了数据划分的思想进行并行化改进,简化了生成候选项的连接步骤,仅需对事务数据库扫描两次,同时在计 算过程中还能对事务进行压缩从而进一步提高了算法的性能。通过两种算法在不同数据规模下算法性能对比分析实验和 两种算法在相同数据集不同节点数对比实验,共同验证了Apriori_MMR 的运算效率至少要比Apriori_MR 高出两倍左右, 且设置的支持度阈值越小,效果愈明显。 关键词:数据挖掘;关联规则;Apriori 算法;云计算;矩阵 中图分类号:TP301.6 Parallel matrix apriori algorithm based on MapReduce architecture 1 2, 3 Xie Zhiming , Wang Peng (1. Dept. of Information Engineering, Shanwei Polytechnic, Shanwei 516600, Guangdong, China; 2. Parallel Computing Lab, Chengdu University of Information Technology, Chengdu 610225, China; 3. Chengdu Institute of Computer Application, Chinese Academy of Sciences, Chengdu 610041, China) Abstract: By migrating traditional data mining association rules based Apriori algorithm to cloud computing platform , data mining efficiency can be improved significantly. In this manner ,transaction database should be scaned frequently and the I/O , memory and communication overhead increase simultaneously. Apriori_MMR is proposed which is a matrix based parallel association rule algorithm. Data partition is used in Apriori_MMR to simply the connection step of candidate item generation . We only need to scan the transaction database twice , and a transaction is compressed

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档