大数据与机器学些第五章.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据与机器学习

目录

TOC\o1-3\h\z\u第五章YARN介绍 3

1.1YARN背景 3

1.2YARN原理 4

1.2.1YARN组件 4

1.2.2HDFS与YARN架构关系 5

1.2.3YARN流程 5

第五章YARN介绍

YARN背景

YARN(YetAnotherResourceNegotiator另一种资源协调者)是Hadoop的资源管理器。

作用:为上层不同计算框架(流处理、批处理、实时处理、内存处理、交互式、图处理、高性能计算-消息接口)共享HDFS数据,以及提供资源分配和资源调度。见下图:

YARN的好处:提高集群资源的利用率

YARN原理

YARN组件

ResourceManager:唯一的全局的资源分配与调度。

客户端任务处理:

处理Map或Reduce的Job任务请求

为每个NodeManager启动建立ApplicationMaster,以执行任务

NodeManager资源处理:

监控NodeManager的状态,一旦崩溃告知NM上的AM

为每个NodeManager分配资源

NodeManager:负责各自节点的资源管理

RM资源报告:ResourceManager定时报告节点资源

本节点

任务执行:执行ApplicationMaster的Map或Reduce任务

资源执行:执行ResourceM的资源分配,为节点建立container资源池(CPU 核、内存、带宽)

ApplicationMaster:由RM指定生成,负责为对应的一个应用程序向RM申请资源并分配给内部task

任务:接收RM的MR任务,并传给NM

资源:向RM申请资源,内部任务分配

数据切分

Container:封装了某节点的资源(cpu核、内存、带宽、磁盘、网络)

Client:提交任务、查询任务、杀死任务

JobHistoryServer:负责任务的进度与元数据管理

Job:输入数据与MR的任务和信息配置。

Task:具体执行Map或Reduce的单元,在NodeManager的container中运行

HDFS与YARN架构关系

NodeManager与DataNode在同一节点上,负责该节点的资源分配与调度

HDFS与YARN都是主从结构,都元数据管理。HDFS是SecondaryNameNode,YARN是JobHistoryServe

YARN流程

先有任务再有资源,因为任务请求后才出发资源分配。

文档评论(0)

133****9689 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档