生产环境的hadoop集群安装.pptx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生产环境的Hadoop集群安装;Enterprise Redhat Linux Oracle JRE 1.6以上 保持所有节点操作系统和软件版本一致 Hadoop 1.x 稳定版本;网络规划;动态添加/删除节点 平衡hdfs节点数据 单独运行namenode和jobtracker 使用JMX对Hadoop进行监控;Hadoop 版本介绍;Hadoop升级和优化 ;总共有接近200个配置项 mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml project-dist/hadoop-hdfs/hdfs-default.xml project- mon/core-default.xml;dfs.name.dir dfs.data.dir dfs.tmp.dir dfs.replication dfs.block.size fs.trash.interval ;默认值:2 说明:控制每个TaskTracker同时运行的Map或Reduce任务数 建议值:CPU核数/2;默认值:10 说明:namenode,datanode和jobtracker用于处理内部RPC的线程数 建议值:对于节点比较多的集群,使用更多的线程;默认值:-Xmx200m 说明:jvm启动的子进程使用的启动参数 建议值:-Xmx1024m -XX:+UseConcMarkSweepGC;默认值:0.05 说明:默认是在5%的map任务完成后,就开始调度reduce进程启动 建议值:0.5;默认值:40 说明:用于map任务的输出 建议值:对于大集群,使用更多的线程;默认值: 100 说明:排序内存使用限制 建议值:200,建议使用更大的内存;默认值:10 说明:排序文件的时候一次同时最多可并流的个数 建议值:100;默认值:false 说明:map输出是否进行压缩,如果压缩就会多耗cpu,但是减少传输时间,如果不压缩,就需要较多的传输带宽 建议值:true;默认值:0.66 说明: reduce归并接收map的输出数据可占用的内存配置百分比;默认值: 0.25 说明:一个单一的shuffle的最大内存使用限制。;单个进程打开的最大文件数 /etc/sysctl.conf fs.epoll.max_user_instances = 2048 /etc/security/limits.conf * soft nofile 2048

文档评论(0)

lflebooks + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档