HadoopYARN大数据计算框架及其资源调度机制研究方案.PDFVIP

HadoopYARN大数据计算框架及其资源调度机制研究方案.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Broad Angle for Technology 技术广角 Hadoop YARN大数据计算框架及其资源 调度机制研究 董春涛 李文婷 沈晴霓 吴中海 北京大学 北京 100086 摘 要 Hadoop 2.0提出一种新的资源管理系统YARN,它可以支持多种大数据计算框架(如MapReduce、Storm、 Spark等),目前已经成为腾讯、阿里等互联网公司部署大数据平台采用的主流计算框架。为此,文章在分析Hadoop YARN计算框架的基本结构和工作流程的基础上,重点研究Hadoop YARN中的资源调度机制,包括其资源调度器的模 型与机制,及其目前已经实现的容量调度器(Capacity Scheduler)和公平调度器(Fair Scheduler)的设计思想、工作原 理和脆弱性,并探讨其下一代欧米伽调度器(Omega Scheduler)的主要设计思想。 关键词 大数据;YARN计算框架;资源管理器;容量调度器;公平调度器;欧米伽调度器;拒绝服务攻击 多的成功应用案例 ,并获得业界的广泛支持和肯定。 引言 但随着分布式系统集群的规模和其工作负荷的增长 特 , 别是支持其他实时计算框架的需求越来越多 包括内存 大数据技术 目前已成为学术界和产业界的研究热 , 点。Google公司提出的GFS(Google File System) 、 计算框架(Spark)、流式计算框架(Storm)、迭代式计算 MapReduce 、BigTable[ 1-3] 等技术成为了大数据技术 框架(iMapReduce)等新型计算框架的出现,MRv 1计算 框架的局限性日益突出 主要包括扩展性差 资源利用 发展的重要基础 ,而A pac he软件基金会基于这些技 , 、 [5] [4] 率低 存在单点故障 计算框架单一等问题 。为此, 术推出的开源项 目Hadoop 成为大数据技术发展和应 、 、 用的标志性成果 许多互联网公司(如Yahoo IBM Hadoop 2.0提出一种新的资源管理系统YARN[6-7] (也被 , 、 、 百度、Face boo k等) 的大数据平台都是以Hadoo p 为 称为MRv2) ,一个多种计算框架通用的资源调度体系, 为不同的并行化计算提供资源分配服务 这样 YA RN 主,它们或自建Hadoop集群、或使用Amazon Elastic 。 , 支持的计算框架只要实现YA RN定义的接口 便可以运 MapReduce服务 , 。 在Hadoo p 1.0 版本 中,Ma p Red uce (也被称为 行在YA RN之上,从而很好地打造一个以YA RN为核心 MRv 1)分布式处理框架是Hadoop 中的唯一计算框架 的生态系统。由于YA RN具有灵活且支持多计算框架的

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档