- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯
2007年 第28卷 第5期 中 北 大 学 学 报 (自然科学版) Vo1.28 No.5 2007
(总第 115期) JOURNALOFNORTHUNIVERSITYOFCHINA(NATURALSCIENCEEDITION) (SumNo.115)
文章编号 :1673—3193(2007)05—0417—05
关联规则的并行优化挖掘算法
杨泽 民
(tb西大同大学 计算中心,山西 大同037009)
摘 要 : 传统的关联规则并行挖掘算法中存在着产生大量的候选项集和通信量高的缺点,本文在分析已有
并行挖掘关联规则算法的优缺点的基础上,提出了一个效率较高的并行优化关联规则挖掘算法 EPMAR
(EfficientParallelMiningAssociationRules),并与其它相应的算法进行了比较.实验结果证明:算法 EP—
MAR是有效的,具有一定的扩展性.
关键词: 数据挖掘;关联规则;并行算法
中图分类号: TP311 文献标识码 :A
An EfficientParallelAlgorithm for
M iningAssociationRules
YANG Ze—m ing
(ComputerCentre,ShanxiDatongUniversity,Datong037009,China)
Abstract:Therearedisadvantagesofproducingvastcandidateitemssetandcorrespondenceforthetra—
ditionalParallelAlgorithm forM iningAssociationRulesrunningsynchronously.Onecomparativeeffi—
cientparallelalgorithm forminingassociationrules。——YPRAM basedonanalysisoftheadvantageand
disadvantageoftheexistingparallelminingalgorithmsispresented.Comparisonwithotherparallelal—
gorithmsisalsocarriedout.Theexperimentsshow thatYPMAR isefficientandhascertainexpansibili—
ty.
Keywords:datamining;associationrules;parallelalgorithm
0 引 言
大型关系数据库 中的数据挖掘是数据库研究的一个新课题 ,作为数据挖掘 的一部分 ,关联规则的挖
掘越来越受到业界人士的高度重视 ,许多文献对关联规则的挖掘算法进行了研究.近年来,随着数据的
成倍增长 ,挖掘速度和效率成为另一个人们所关注的焦点,这就使得关联规则的并行挖掘算法成为 目前
数据挖掘研究中的一个主流分支.
目前的并行算法有Agrawal等人提出的以下三种 :
1)算法 CD(CountDistribution)是算法 Apriori的简单并行化.所有处理器从集合 厶一中产生完整
的候选哈希树,这样每个处理器能从本地的数据仓库分区中独立地获得局部支持度的候选集,此后通过
缩减来获得全局的计数.注意到仅仅只有局部计数 的交换 ,而不是合并不同的哈希树,这是因为每个处
收稿 日期:2006—12-20
基金项 目:山西大 同大学科学研究项 目 (2006kl)
作者简介:杨泽民(1974一),男,讲师,硕士.主要从事人工智能、数据库、数据挖掘研究
维普
文档评论(0)