数据分析及可视化 课件 第5章-数据基本分析及可视化;第6章 数据综合评价及可视化.pptx

数据分析及可视化 课件 第5章-数据基本分析及可视化;第6章 数据综合评价及可视化.pptx

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计1.次序统计2.集中趋势3.离散程度4.箱线图【Excel的基本操作】5.1.2数据的综合统计1.多变量数据统计2.数据的分组统计第5章数据基本分析及可视化

5.1描述性数据分析描述性统计,是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。主要包括数据的次序分析、集中趋势分析、离散程度分析、频数分析,分布图形以及一些基本的统计图形。第5章数据基本分析及可视化

5.1描述性数据分析对一组数据X1,X2,...,Xn,X(i)称为该其第i个次序统计量,其取值是将数据由小到大排列后得到的第i个值。从小到大排序为X(1),X(2),...,X(n),则称X(1),X(2),...,X(n)为顺序统计量。5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化

5.1描述性数据分析(1)顺序统计5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化

5.1描述性数据分析(1)顺序统计对2019年珠三角9个地区的人均GDP数据进行排序:5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计1.次序统计(2)极值一组数据中最小的数据,即最小次序统计量X(1),记为X.min一组数据中最大的数据,即最大次序统计量X(n),记为X.maxInX.min()Out5.39InX.max()Out20.35第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计1.次序统计(3)分位数分位数(亦称分位点,Quantile),是指将一组数据分为多个等份的数值点,如百分位数就是将数据分成100个等份。常用的分位数有二分位数、四分位数和五分位数。第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计1.次序统计(3)分位数Python提供了函数quantile()对数据计算分位数:InX.quantile([0,0.25,0.5,0.75,1])Out0.005.390.258.600.5011.250.7515.641.0020.35第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计2.集中趋势对于数值型定量数据,经常要分析它的集中趋势和离散程度,用来描述集中趋势的主要统计指标称为平均统计量,如均值、中位数;用于描述离散程度的统计量主要有方差、标准差。Python只需要一个命令就可以简单地得到这些结果,计算均值、中位数、方差、标准差的命令分别是mean()、median()、var()、std()第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计2.集中趋势(1)均值均值(mean,也称均数,即为算术平均数):指一组数据的和除以这组数据的个数所得到的商,它反映一组数据的总体水平。对于正态分布数据:InX.mean()Out12.027777777777777第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计2.集中趋势(2)中值中值(median,也称中位数,即二分位数):指一组数据按大小顺序排列,处于中间位置的一个数值,它也是反映了一组数据的集中趋势。对偏态分布数据,通常计算其中位数,来表示其平均水平。InX.median()#=X.quantile(0.5)Out11.25第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计3.离散程度(1)极差或四分位差极差指一组数据中最大数据与最小数据的差,在统计中常用极差来刻画一组数据的离散程度。该指标由于只考虑数据的最大和最小值,通常用处不是很大。IndefR(x):return(x.max()-x.min())R(X)#X.max()-X.min();Out14.96第5章数据基本分析及可视化

5.1描述性数据分析5.1.1数据的描述统计3.离散程度(1)极差或四分位差四分位差(也称四分位数间距,InterQuartileRange,IQR),是第三分位数与第一分位数的差距。IndefIQR(x):return(x.quantile(0.75)-x.quantile(0.25))IQR(X)#X.quantile(0.75)-X.quantile(0.25)Out7.040000000000001第5章数据基本分析及可视化

5.1描述

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档