1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop培训概要1

;;Hadoop是开源的、可靠的、可扩展的分布式并行计算框架 Hadoop是Google集群系统的开源实现 -Google集群系统:GFS(Google File System)、MapReduce、BigTable -Hadoop主要由HDFS(Hadoop Distributed File System)、MapReduce、Hbase组成 Hadoop的初衷是为了解决Nutch的海量数据爬取和存储的需要 -Nutch是一个开源的有哪些信誉好的足球投注网站引擎实现 Hadoop于2005年作为Lucene的子项目Nutch的一部分正式引入Apache基金会 作者:Doug Cutting 语言:Java,支持多种开发语言,如:Python,C++,Ruby等 ;高扩展性;HDFS(Hadoop Distributed File System):分布式文件系统,是根据google发表的论文GFS(Google File System)Google 文件系统的开源实现。 HDFS的特点: 按块存储:将文件划分为固定大小的数据块进行存储,默认块大小为64M。 数据通过多个副本的形式保存在多个数据节点上,默认为3个副本。 运行在通用的服务器上。 适合大数据的处理。 ;NameNode:管理文件系统的命名空间,它维护着文件系统树及整棵树内所有的文件和目录,NameNode也记录着每个文件中各个块所在的数据节点信息。 SecondaryNameNode:是一个小弟,分担大哥NameNode的工作量,是NameNode的冷备份,合并fsimage和edit logs然后再发给NameNode。 ;DataNode:是分布式文件系统中的工作节点,他们根据客户端或者NameNode的指示检索或者存储数据,并且定期向NameNode发送心跳。 ;1、查看指定目录下内容 Hadoop dfs –ls [文件目录] eg: hadoop dfs –ls /user/ 2、打开某个已存在文件 hadoop dfs –cat [file_path] eg:hadoop dfs -cat /user/data.txt 3、将本地文件存储至hadoop hadoop dfs –put [本地地址] [hadoop目录] hadoop dfs –put /home/t/file.txt /user/t 4、将本地文件夹存储至hadoop hadoop fs –put [本地目录] [hadoop目录] hadoop fs –put /home/t/dir_name /user/t 5、将hadoop上某个文件down至本地已有目录下 hadoop dfs -get [文件目录] [本地目录] hadoop dfs -get /user/t/ok.txt /home/t 6、删除hadoop上指定文件 hadoop dfs –rm [文件地址] hadoop dfs –rm /user/t/ok.txt;Map/Reduce编程思想;Map/Reduce编程思想;Map/Reduce编程思想;Map/Reduce实例;Map/Reduce实例

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档