数据仓库技术及应用 项目4 企业信息管理数据查询与操作.ppt

数据仓库技术及应用 项目4 企业信息管理数据查询与操作.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

使用内连接、左外连接、右外连接三种连接方式,查询员工信息表和部门表的所有内容,以deptid字段为索引查询,再通过查看结果表的字段长度比较三种表的结果。任务2拓展任务3基于聚合函数的员工信息查询【任务描述】财务部门每月都要统计员工平均工资,最高和最低工资的人员信息,每半年还要统计在职员工人数,有时还要为各部门统计此类信息,小刘分析业务需求后发现,HiveQL中提供了聚合函数来计算字段的平均数、最大值和最小值等。【任务分析】1.使用聚合函数COUNT(),查询经理岗位人数;2.使用聚合函数AVG()函数,查询平均工资;3.使用聚合函数MAX()、MIN()函数,查询工资中的最大值、最小值;4.使用聚合函数SUM()函数,查询工资总额。任务3基于聚合函数的员工信息查询数据聚合是按照特定条件将数据整合并表达出来,以总结出更多的组信息。Hive包含内建的一些基本聚合函数,如MAX,MIN,AVG等等。函数名含义COUNT(*)count(*)返回检索到的行的总数,包括含有NULL值的行。SUM([DISTINCT]col)对组内某列求和(包含重复值或不包含重复值)AVG([DISTINCT]col)对组内某列元素求平均值者(包含重复值或不包含重复值)MIN(col)返回组内某列的最小值MAX(col)返回组内某列的最大值任务3基于聚合函数的员工信息查询1.准备任务实施环境:1)启动Hadoop:start-all.sh2)进入Hive客户端hive3)数据准备:若未加载数据,需要先创建数据表,并导入数据,具体操作请参考任务一【任务实施】中的准备实施环境部分。2.查询经理岗位有多少人:查询某列的数量,可以同过count()函数来实现:selectcount(job)fromemployeewherejob=’MANAGER’;3.查询“员工信息表”中员工的平均工资:查询平均值,可以调用avg()来实现:selectavg(salary)fromemployee;任务3基于聚合函数的员工信息查询4.查询“员工信息表”中每个岗位的最高工资:查询最大值可以调用max()函数来实现:selecte.job,max(e.salary)fromemployeeegroupbye.job;5.查询“员工信息表”中每个部门的最低工资:查询最小值可以调用min()函数来实现:selectdeptid,min(salary)fromemployeegroupbydeptid;6.查询“员工信息表”中每个岗位的工资和:计算某列的和,可以用sum()函数来实现:selectjob,sum(salary)fromemployeegroupbyjob;任务4基于分组的员工信息查询【任务描述】在公司中,小刘有时要为各部门提供相似的信息,比如为每个部门提供总工资和平均工资信息,有时在这些查询到的基础上还要提供收入排序、员工职位信息等,对这些需求,小刘发现可以对员工信息表和部门信息表进行分组查询。【任务分析】首先使用分组查询,查询员工平均工资大于2000的部门;在此基础上,对员工工资进行排序。任务4基于分组的员工信息查询1、GROUPBY分组查询在Hive中,GROUPBY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。语法格式如下:SELECT[ALL|DISTINCT]select_expr,select_expr,...FROMtable_reference[GROUPBYcol_list]任务4基于分组的员工信息查询2、HAVING子句HAVING子句对GROUPBY的查询结果进行筛选,与WHERE子句不同的是,HAVING子句只用于GROUPBY分组统计语句。语法格式如下:SELECT[ALL|DISTINCT]select_expr,select_expr,...FROMtable_reference[GROUPBYcol_list][HAVINGhaving_condition]任务4基于分组的员工信息查询1.准备任务实施环境:1)启动Hadoop:start-all.s

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档