- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Hadoop二阶段并行模糊c-Means聚类算法-计算机应用与软件
第33卷第6期 计算机应用与软件 Vol33No.6
2016年6月 ComputerApplicationsandSoftware Jun.2016
基于Hadoop二阶段并行模糊cMeans聚类算法
胡吉朝 黄红艳
(石家庄经济学院信息工程学院 河北石家庄050031)
摘 要 针对Mapreduce机制下算法通信时间占用比过高,实际应用价值受限的情况,提出基于Hadoop二阶段并行cMeans聚类
算法用来解决超大数据的分类问题。首先,改进Mapreduce机制下的MPI通信管理方法,采用成员管理协议方式实现成员管理与
Mapreduce降低操作的同步化;其次,实行典型个体组降低操作代替全局个体降低操作,并定义二阶段缓冲算法;最后,通过第一阶段
的缓冲进一步降低第二阶段Mapreduce操作的数据量,尽可能降低大数据带来的对算法负面影响。在此基础上,利用人造大数据测
试集和KDDCUP99入侵测试集进行仿真,实验结果表明,该算法既能保证聚类精度要求又可有效加快算法运行效率。
关键词 二阶段 模糊cMeans 大数据 聚类 并行 入侵检测
中图分类号 TP312 文献标识码 A DOI:10.3969/j.issn.1000386x.2016.06.067
HADOOPBASEDTWOSTAGEPARALLELFUZZYCMEANSCLUSTERINGALGORITHM
HuJichao HuangHongyan
(SchoolofInformationEngineering,ShijiazhuangUniversityofEconomics,Shijiazhuang050031,Hebei,China)
Abstract Aimingattheproblemoftoohighoccupancyofcommunicationtimeandlimitedapplyingvalueofthealgorithmunderthe
mechanismofMapreduce,weputforwardaHadoopbasedtwostageparallelcMeansclusteringalgorithmtodealwiththeproblemof
extralargedataclassification.First,weimprovedtheMPIcommunicationmanagementmethodinMapreducemechanism,andused
membershipmanagementprotocolmodetorealisethesynchronisationofmembersmanagementandMapreducereducingoperation.Secondly,
weimplementedtypicalindividualsgroupreducingoperationinsteadofglobalindividualreducingoperation,anddefinedthetwostagebuffer
algorithm.Finally,throughthebufferinfirststagewefurtherreducedthedataamountofMapreduceoperationinsecondstage,andreduced
thenegativeimpactbroughtaboutbybigdataonthealgorithmasmuchaspossible.Basedonthis,wecarriedoutthesimulationbyusing
artificialbigdatatestsetandKDDCUP99invasiontestdata.Experimentalresultshowedthatthealgorithmcouldbothguaranteethe
clusteringprecisionrequirementandspeedupeffectivelytheoperationefficiencyofalgorit
文档评论(0)