- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop培训概要1
;;Hadoop是开源的、可靠的、可扩展的分布式并行计算框架
Hadoop是Google集群系统的开源实现
-Google集群系统:GFS(Google File System)、MapReduce、BigTable
-Hadoop主要由HDFS(Hadoop Distributed File System)、MapReduce、Hbase组成
Hadoop的初衷是为了解决Nutch的海量数据爬取和存储的需要
-Nutch是一个开源的有哪些信誉好的足球投注网站引擎实现
Hadoop于2005年作为Lucene的子项目Nutch的一部分正式引入Apache基金会
作者:Doug Cutting
语言:Java,支持多种开发语言,如:Python,C++,Ruby等
;高扩展性;HDFS(Hadoop Distributed File System):分布式文件系统,是根据google发表的论文GFS(Google File System)Google 文件系统的开源实现。
HDFS的特点:
按块存储:将文件划分为固定大小的数据块进行存储,默认块大小为64M。
数据通过多个副本的形式保存在多个数据节点上,默认为3个副本。
运行在通用的服务器上。
适合大数据的处理。
;NameNode:管理文件系统的命名空间,它维护着文件系统树及整棵树内所有的文件和目录,NameNode也记录着每个文件中各个块所在的数据节点信息。
SecondaryNameNode:是一个小弟,分担大哥NameNode的工作量,是NameNode的冷备份,合并fsimage和edit logs然后再发给NameNode。
;DataNode:是分布式文件系统中的工作节点,他们根据客户端或者NameNode的指示检索或者存储数据,并且定期向NameNode发送心跳。
;1、查看指定目录下内容
Hadoop dfs –ls [文件目录]
eg: hadoop dfs –ls /user/
2、打开某个已存在文件
hadoop dfs –cat [file_path]
eg:hadoop dfs -cat /user/data.txt
3、将本地文件存储至hadoop
hadoop dfs –put [本地地址] [hadoop目录]
hadoop dfs –put /home/t/file.txt /user/t
4、将本地文件夹存储至hadoop
hadoop fs –put [本地目录] [hadoop目录]
hadoop fs –put /home/t/dir_name /user/t
5、将hadoop上某个文件down至本地已有目录下
hadoop dfs -get [文件目录] [本地目录]
hadoop dfs -get /user/t/ok.txt /home/t
6、删除hadoop上指定文件
hadoop dfs –rm [文件地址]
hadoop dfs –rm /user/t/ok.txt;Map/Reduce编程思想;Map/Reduce编程思想;Map/Reduce编程思想;Map/Reduce实例;Map/Reduce实例
您可能关注的文档
最近下载
- 声控灯的安装与调试工作页.doc VIP
- 2024年全国统一高考化学试卷(新课标)(含解析版).docx
- 2024春期国开电大《应用写作(汉语)》形考任务1-6参考答案.doc
- 佳能PowerShot使用手册SX70HS说明书.pdf
- 重大社2024初中信息科技1教材解读-七年级上册第一单元(吴跃进).pptx
- 谦敬辞训练题(答案).doc
- 《等腰三角形的判定》PPT课件.pptx
- 原发性肝癌诊疗指南(2024年版)内科及系统治疗解读.pptx
- 线性多智能体系统的自适应动态事件触发一致性Adaptive Dynamic Event-Triggered Consensus of Linear Multi-Agent Systems-来源:理论数学(第2021011期)-汉斯出版社.pdf VIP
- HG_T 4580-2013 农业用硝酸钙.docx
文档评论(0)