云计算环境下多服务器多分区数据高效挖掘方法设计.docVIP

云计算环境下多服务器多分区数据高效挖掘方法设计.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云计算环境下多服务器多分区数据高效挖掘方法设计

云计算环境下多服务器多分区数据高效挖掘方法设计   摘 要: 云计算环境下的多服务器多分区系统中存在海量数据,传统串行数据挖掘方法对这些数据进行挖掘的过程中,无法对海量数据进行并行处理,挖掘效率低。针对该问题,设计云计算环境下多服务器多分区数据挖掘系统,其包括基础设施即服务层、平台即服务层、软件即服务层,可实现大规模数据的高效挖掘。系统通过平台即服务层中的多服务器多分区数据处理模型,实现海量数据的分布式运算,并基于MapReduce机制实现K均值聚类数据挖掘算法的并行化,通过Map和Reduce函数实现多服务器多分区数据的并行挖掘。实验结果表明,所设计系统大幅度降低了云计算环境下多服务器多分区数据的挖掘时间,提高了数据的挖掘效率和稳定性 关键词: 云计算; 多服务器; 多分区数据; 数据挖掘 中图分类号: TN911?34; TP311 文献标识码: A 文章编号: 1004?373X(2017)10?0043?03 Abstract: Since there are mass data in the multi?server multi?partition system in cloud computing environment, the traditional serial data mining method cannot be carried out on the parallel processing of the mass data in the data mining process, and its mining efficiency is low, a cloud computing environment multi?server multi?partition data mining system was designed, which includes infrastructure, platform and software, and can realize efficient mass data mining. The system can realize the distributed operation of mass data through the multi?server multi?partition data processing model in the platform, and achieve parallelization of K?means clustering data mining algorithm based on MapReduce mechanism. The multi?server multi?partition data parallel mining is realized with Map and Reduce functions. The experimental results indicate that the designed system has greatly shortened multi?server multi?partition data mining time in the cloud computing environment, and improved the efficiency and stability of data mining. Keywords: cloud computing; multi?server; multi?partition data; data mining 0 引 言 当前随着信息时代的到来,云计算环境下的多服务器多分区网络中的数据量呈现爆炸式增长[1]。采用有效的数据挖掘工具,可从这些数据中提取有价值的信息,能够为人们的生产和生活提供服务。传统的串行数据挖掘方法[2]无法对海量数据进行并行处理,挖掘效率低,存在较多弊端。因此,寻求有效方法,高效挖掘云计算环境下多服务器[3]多分区网络中的数据,具有重要应用意义 1 云计算环境下多服务器多分区数据挖掘系统 1.1 系统结构 基于云计算的多服务器多分区数据挖掘系统是一个低成本、高可靠性的海量并行数据挖掘系统,其总体结构如图1所示 基于云计算的多服务器多分区数据挖掘系统包括基础设施即服务层、平台即服务层和软件即服务层。云计算环境下多服务器多分区网络中的应用程序每一个都是独立的,负责的每一项业务不同[4?6]。在这种环境下把多服务器分解优化成数个虚拟机,极大地提高了物理机的使用频率,有利于负载均衡和避免资源的浪费,在最大程度上提高了系统部署和在线活动的运行效率[7?8] 多服务器多分区数据处理

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档