- 1、本文档共115页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计1.次序统计2.集中趋势3.离散程度4.箱线图【Excel的基本操作】5.1.2数据的综合统计1.多变量数据统计2.数据的分组统计第5章数据基本分析及可视化
5.1描述性数据分析描述性统计,是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。主要包括数据的次序分析、集中趋势分析、离散程度分析、频数分析,分布图形以及一些基本的统计图形。第5章数据基本分析及可视化
5.1描述性数据分析对一组数据X1,X2,...,Xn,X(i)称为该其第i个次序统计量,其取值是将数据由小到大排列后得到的第i个值。从小到大排序为X(1),X(2),...,X(n),则称X(1),X(2),...,X(n)为顺序统计量。5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化
5.1描述性数据分析(1)顺序统计5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化
5.1描述性数据分析(1)顺序统计对2019年珠三角9个地区的人均GDP数据进行排序:5.1.1数据的描述统计1.次序统计第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计1.次序统计(2)极值一组数据中最小的数据,即最小次序统计量X(1),记为X.min一组数据中最大的数据,即最大次序统计量X(n),记为X.maxInX.min()Out5.39InX.max()Out20.35第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计1.次序统计(3)分位数分位数(亦称分位点,Quantile),是指将一组数据分为多个等份的数值点,如百分位数就是将数据分成100个等份。常用的分位数有二分位数、四分位数和五分位数。第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计1.次序统计(3)分位数Python提供了函数quantile()对数据计算分位数:InX.quantile([0,0.25,0.5,0.75,1])Out0.005.390.258.600.5011.250.7515.641.0020.35第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计2.集中趋势对于数值型定量数据,经常要分析它的集中趋势和离散程度,用来描述集中趋势的主要统计指标称为平均统计量,如均值、中位数;用于描述离散程度的统计量主要有方差、标准差。Python只需要一个命令就可以简单地得到这些结果,计算均值、中位数、方差、标准差的命令分别是mean()、median()、var()、std()第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计2.集中趋势(1)均值均值(mean,也称均数,即为算术平均数):指一组数据的和除以这组数据的个数所得到的商,它反映一组数据的总体水平。对于正态分布数据:InX.mean()Out12.027777777777777第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计2.集中趋势(2)中值中值(median,也称中位数,即二分位数):指一组数据按大小顺序排列,处于中间位置的一个数值,它也是反映了一组数据的集中趋势。对偏态分布数据,通常计算其中位数,来表示其平均水平。InX.median()#=X.quantile(0.5)Out11.25第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计3.离散程度(1)极差或四分位差极差指一组数据中最大数据与最小数据的差,在统计中常用极差来刻画一组数据的离散程度。该指标由于只考虑数据的最大和最小值,通常用处不是很大。IndefR(x):return(x.max()-x.min())R(X)#X.max()-X.min();Out14.96第5章数据基本分析及可视化
5.1描述性数据分析5.1.1数据的描述统计3.离散程度(1)极差或四分位差四分位差(也称四分位数间距,InterQuartileRange,IQR),是第三分位数与第一分位数的差距。IndefIQR(x):return(x.quantile(0.75)-x.quantile(0.25))IQR(X)#X.quantile(0.75)-X.quantile(0.25)Out7.040000000000001第5章数据基本分析及可视化
5.1描述
您可能关注的文档
- 数据分析及可视化 课件 第0章-课前准备、第1章-数据分析及可视化概述、第2章-Python数据分析平台、第3章-数据的基本可视化方法.pptx
- 数据分析及可视化 课件 第3章-数据的基本可视化方法;第4章-数据挖掘基础及可视化.pptx
- 2025年8月党支部三会一课有关《中国共产党党徽党旗条例》等法规文件学习记录+党支部关于党旗党徽图案使用情况的自查报告.docx
- 在2025年市委常委班子集中整治问题整改工作专题会议上的讲话+党课:以过硬作风护航高质量发展以实干担当书写新时代“赶考”答卷.docx
- 国有企业2025年在“贯彻党中央决策部署和国企改革要求方面、全面从严治党责任落实方面、基层党组织建设方面、巡察整改长效机制建设四个方面”巡察整改专题民主生活会存在的原因分析.pdf
- 2篇 国企2025年上半年落实意识形态工作责任制情况自查报告.docx
- 4篇 在深入贯彻中央城市工作会议精神专题研讨交流会上的发言.pdf
- 2025年党支部、镇关于党旗党徽图案使用情况的自查报告.docx
- 4篇 2025年在学习贯彻《中华人民共和国监察法实施条例》研讨交流会上的发言.docx
- 2025年党支部、镇关于党旗党徽图案使用情况的自查报告.pdf
- 2025年8月 在全市防汛工作视频会议上的讲话.docx
- 在2025年市委常委班子集中整治问题整改工作专题会议上的讲话+党课:以过硬作风护航高质量发展以实干担当书写新时代“赶考”答卷.pdf
- 国有企业2025年在“贯彻党中央决策部署和国企改革要求方面、全面从严治党责任落实方面、基层党组织建设方面、巡察整改长效机制建设四个方面”巡察整改专题民主生活会存在的原因分析.docx
- 2篇 2025年在四届区委第十三轮巡察动员部署会议上的讲话.pdf
- 在理论学习中心组巡视整改专题学习研讨会议上的讲话+在省委巡视反馈问题整改部署会上的讲话+工作领导小组会议上的讲话.pdf
- 2篇 2025年在四届区委第十三轮巡察动员部署会议上的讲话.docx
- 2025年国企理论学习中心组巡视巡察专题民主生活会会前学习研讨+(2025年四个方面)巡察整改专题民主生活会个人发言提纲.docx
- 局党组、宣传部、纪委监委关于2025年上半年意识形态工作总结及2025年下半年工作打算.pdf
- 4篇 2025年在学习贯彻《中华人民共和国监察法实施条例》研讨交流会上的发言.pdf
- 在市委理论学习中心组中央城市工作会议精神专题学习研讨会上的发言.+关于传达中央城市工作会议精神的讲话提纲.docx
文档评论(0)