“云计算(第三版)”配套之21:第6章Hadoop2.0大家族(二).pptxVIP

“云计算(第三版)”配套之21:第6章Hadoop2.0大家族(二).pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“云计算(第三版)”配套之21:第6章Hadoop2.0大家族(二)

2 6.3 Hbase 谷歌发表论文BigTable Powerset开启了Hbase项目 Powerset将Hbase交给Apache托管 Hbase成为Apache顶级项目 Hbase是基于Hadoop的开源分布式数据库,它以Google的BigTable为原型,设计并实现了具有 高可靠性 高性能 列存储 可伸缩 实时读写 的分布式数据库系统。 HBase适合于存储非结构化数据 Hbase是基于列的而不是基于行的模式 Hbase在Hadoop之上提供了类似于BigTable的能力 6.3 Hbase 6.3.1 Hbase简介 6.3.2 Hbase入门 4 6.3 Hbase Hbase数据模型 数据的逻辑模型 数据的物理模型 的形式存储结构化数据 数据库一般以 的形式存储数据 Hbase也以 用户对数据的组织形式 Hbase里数据在HDFS上的具体存储形式 5 Hbase数据模型 逻辑模型 列族 概念 元素 时间戳 行和列确定的存储单元 6 行健 时间戳 列族contents 列族anchor 列族mime n.www t9   anchor:= CNN   t8   anchor:my.look.ca= CNN.com   t6 contents:html=html…   mime:type=text/html t5 contents:html=html…     t6 contents:html=html…     6.3 Hbase Hbase数据模型 表中仅有一行数据,行的唯一标识为n.www,对这行数据的每一次逻辑修改都有一个时间戳关联对应。 表中共有四列:contents:html,anchor:,anchor:my.look.ca,mime:type,每一列以前缀的方式给出其所属的列族。 7 6.3 Hbase Hbase数据模型 通过单个 行健访问 给定行健的 范围访问 全表扫描 行键是数据行在表中的唯一标识,并作为检索记录的主键。 Hbase提供了两个版本的回收方式: 对每个数据单元,只存储指定个数的必威体育精装版版本 1 保存最近一段时间内的版本(如七天),客户端可以按需查询 2 元素由行健、列(列族:限定符)和时间戳唯一确定,元素中的数据以字节码的形式存储,没有类型之分。 物理模型 概念模型中的一个行进行分割 并按照列族存储 Hbase数据模型 表中的空值是不被存储的 如果没有指名时间戳,则返回指定列的必威体育精装版数据值 可以随时向表中的任何一个列添加新列,而不需要事先声明 8 行健 时间戳 列族contents n.www t6 contents:html=html… t5 contents:html=html… t3 contents:html=html… 行健 时间戳 列族anchor n.www t9 anchor:= CNN t8 anchor:my.look.ca= CNN.com 行健 时间戳 列族mime n.www t6 mime:type=text/html 6.3 Hbase Hbase数据模型 9 Hbase采用master/slave架构 主节点运行的服务称为HMaster 从节点服务称为HRegionServer 底层采用HDFS存储数据 Hbase架构 client HMaster 6.3 Hbase Hbase架构 1)Client Client端使用Hbase的RPC机制与HMaster和HRegionServer进行通信 2)ZooKeeper 存储了ROOT表的地址、HMaster的地址和HRegionServer地址 3)HMaster Hbase主节点,将Region分配给HRegionServer,协调HRegionServer的负载并维护集群状态 4)HRegionServer HRegionServer主要负责响应用户I/O请求,向HDFS文件系统中读写数据 12 6.3 Hbase 6.3.1 Hbase简介 6.3.2 Hbase入门 14 6.3 Hbase Hbase部署 15 6.3 Hbase Hbase接口 Hbase提供了诸多访问接口,下面简单罗列各种访问接口。 Native Java API Hbase Shell Thrift Gateway 最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理Hbase表数据。 Hbase的命令行工具,最简单的接口,适合管理、测试时使用。 利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他异构系统在线访问Hbase表数据。 16 6.3 Hbase Hbase接口 Hbase提供了诸多访问接口,下面简单罗列各种访问接

您可能关注的文档

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档