全国职业院校技能大赛双数年 ZZ052-大数据应用与服务 赛项赛题汇总 第06--10套.pdf

全国职业院校技能大赛双数年 ZZ052-大数据应用与服务 赛项赛题汇总 第06--10套.pdf

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

一、背景描述

当今时代,数据正在迅速膨胀并变大,一天之中,互联

网产生的全部内容可以达到EB级别,能够轻松刻满1.68亿

张光盘。在商业、经济及其它领域中,决策将日益基于数据

和分析而作出,而并非基于经验和直觉。那么,要怎样基于

大数据做出正确的决策呢?大数据首先需要解决的问题就

是数据存储的问题,由于数据量非常之大,想通过传统单一

的节点的存储显得力不从心,搭建分布式的文件存储系统成

为了一个完美的解决方案。解决了数据存储的问题,我们需

要从数据中提取有用信息,通过数据分析手段让数据发挥出

真正的价值。但往往采集的原始数据中包含了一些无用数据

以及噪声数据,如果直接基于这些脏数据进行分析,往往会

让分析结果产生偏差甚至错误,从而造成决策上的失准。因

此,我们有必要对这些原始数据进行清洗,以保证其数据准

确性、完整性和可用性,提高数据的质量。在解决脏数据的

困扰后,我们需要采取各种数据分析手段,提取数据中的价

值,得到可靠的结果,并以图表等直观的方式将分析结果进

行展现。然后从业务层面对分析结果进行分析和解释,从而

指引我们做出正确的决策,真正获取“数据财富”。

气候变化正在迅速地改变地球。随着全球气温不断升高、

11

海平面上升、极端天气事件频繁发生,人们对于地球的未来

更加担忧。为了更好地了解气候变化的趋势、预测未来天气

趋势,指引相关部门尽早做出举措以应对气候变化,保护人

类赖以生存的家园,你的团队将运用大数据技术对天气数据

进行分析及决策。搭建大数据平台集群环境以应对海量天气

数据的存储,结合数据库的毫秒级的响应,为天气决策系统

提供数据存储及查询保障。通过数据清洗技术,去除数据中

的噪音,提高数据质量。通过数据标注技术,结合业务认知,

对数据进行分类标注,为后续通过人工智能算法模型决策奠

定基础。通过各种数据分析技术,让看似杂乱无章的数据,

变得灵动,找出天气变化的内在规律。通过数据可视化技术,

让数据分析结果及天气变化规律以一种最为直观的方式呈

现。最后从业务层面对天气数据分析结果进行分析及解释,

使气象学家更好的了解气候变化,并做出精准决策应对气候

问题。你们作为该大数据小组的技术人员,请按照下面任务

完成本次工作。

二、模块一:平台搭建与运维

(一)任务一:大数据平台搭建

1.子任务一:Zookeeper集群安装配置

本任务需要使用root用户完成相关配置,具体要求如

下:

(1)在master节点将/usr/local/src目录下的

apache-zookeeper-3.5.7-bin.tar.gz包解压到/opt路径下,

22

将完整命令截图粘贴到对应答题报告中;

(2)把解压后的apache-zookeeper-3.5.7-bin文件夹

更名为zookeeper-3.5.7,将完整命令及结果截图粘贴到对

应答题报告中;

(3)在master节点修改/root/.bash_profile文件,

设置Zookeeper环境变量,将环境变量配置内容截图粘贴到

对应答题报告中;

(4)将/opt/zookeeper-3.5.7/conf目录下的

zoo_sample.cfg文件更名为zoo.cfg,将完整命令截图粘

贴到对应答题报告中;

(5)修改/opt/zookeeper-3.5.7/conf/zoo.cfg配置文

件,配置zookeeper服务器存储快照文件(zookeeper节点

数据)的目录为/opt/zookeeper-3.5.7/data目录,将修

改的内容截图粘贴到对应答题报告中;

(6)修改/opt/zookeeper-3.5.7/conf/zoo.cfg配置文

件,配置master节点为zookeeper集群的第一号服务器、

slave1节点为zookeeper集群的第二号服务器、slave2节

点为zookeeper集群的第三号服务器,并且将master、slave1、

slave2节点与集群中的Leader节点交换信息的端

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档