(应用统计学经济与相关管理中的数据分析)第三章统计数据分布特征的描述.pptVIP

(应用统计学经济与相关管理中的数据分析)第三章统计数据分布特征的描述.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(应用统计学经济与相关管理中的数据分析)第三章统计数据分布特征的描述.ppt

2 第三章 统计数据分布特征的描述 【本章导读及学习目标】 原始数据经过统计分组整理所形成的频数分布,直观和概略地反映了数据分布的基本特征。数量数据的频数分布是对数据分布特征的初步描述,缺乏对数据分布的具体特征和内在联系的综合度量。数据分布特征的综合度量包括三个方面的内容:一是数据分布的集中趋势,反映数据的聚集程度;二是数据分布的离散趋势,反映数据的变异程度;三是数据分布的偏态和峰度,反映数据分布的形状。这三个方面从不同的角度描述了数据分布特征的不同侧面,三者之间相互联系、互为补充。通过本章的学习,要求理解数据分布特征的集中趋势、离散程度、偏态和峰度的统计内涵和计算方法。 3 第一节 数据分布的集中趋势 一、集中趋势与平均指标 集中趋势(central tendency)是指变量数列中数据分布的中心值。 平均指标经常被作为评价事物和决策的数量标准或参考,在统计研究中的应用很广,其作用主要表现为以下几个方面: (1) 可以反映总体各单位某一标志变量分布的集中趋势和一般水平。 (2) 可以用于比较同类现象在不同空间的发展水平的差距。 (3) 可以比较同类现象在不同时期的发展变化趋势或规律。 (4) 可以分析现象之间的依存关系。 4 二、数值平均数 (一)算术平均数 1. 简单算术平均数 2. 加权算术平均数 (二)调和平均数 (三)几何平均数 5 三、位置平均数 (一)众数 1. 未分组数据的众数 2. 已分组数据的众数 1) 品质数据和单项式分组数量数据的众数 2) 组距式分组数量数据的众数 (二)中位数 1. 未分组数据的中位数 2. 已分组数据的中位数 1) 定序尺度变量和单项式分组变量分布数列的中位数 2) 组距式分组变量分布数列的中位数 8 五、相对位置:百分位数 9 第二节 数据分布的离散程度 一、测定离散程度的意义 数据变异性(data variation)是数据分布的另一个特征,它所反映的是一组数据远离其中心值的程度,反映了数据的差异程度和离散程度。集中趋势特征量对一组数据的代表性,取决于这组数据的离散程度。数据的离散程度越大,集中趋势特征量的代表性就越差,反之,离散程度越小,其代表性就越好。 描述数据离散程度的特征量,依据数据类型的不同有异众比率、极差、四分位差、方差、标准差、变异系数等。 10 二、品质数据离散程度的度量 11 三、数量数据离散程度的度量 (一)极差 (二)四分位差 (三)方差 1. 未分组数据的方差 2. 已分组数据的方差 (四)标准差 (五)变异系数 12 第三节 集中趋势与离散程度的综合运用 前面两节介绍了几种集中趋势和离散程度的度量。其中平均数是最为广泛使用的集中趋势度量指标,方差和标准差是最为广泛使用的衡量数据变异程度的度量指标。利用平均数和标准差,我们还可以获得各个观测值在整个数据集中的相对位置,并且可以用来判断一组数据中是否存在离群数据。 13 一、z分数 14 二、经验规则与切比雪夫定理 (一)经验规则 (二)切比雪夫定理 15 三、异常值检测 有时在一个数据集中会有一个或几个数据与数据集中的其他数据相比,特别地大或特别地小,这样的极端值称为离群数据(outlier data),也就是异常值。标准分数(z分数)可用于确认异常值。经验规则告诉我们,对于钟形分布的数据集,几乎所有的数据与其平均数的距离都在3个标准差之内。因此,可以利用z分数对数据集中是否存在异常值进行检测,即当 或 时,可以认为这个数据很有可能是异常值。 当一个数据被检测为异常值时,我们对这个数据还要进一步进行仔细鉴别,可能有以下几种情况。 (1) 该异常值可能是被错误地观测、记录或输入了计算机,则在进一步分析之前要将其改正; (2) 该异常值可能来自于另一个数据总体,则应该将这个数据删除; (3) 该异常值就是该数据集的一个极端值,它被正确地观测和记录了,的确属于这个数据集,应该保留。 16 第四节 数据分布形状的测度 一、测定分布形状的意义 集中趋势和离散程度是数据分布的两个重要的特征量,但要全面地了解数据分布的特点,还需要知道数据分布的形状是否对称以及分布的扁平程度等。偏态和峰度是从分布形状上对分布特征的进一步描述,同时偏态和峰度在一定程度上也能反映出均值作为集中趋势指标的代表性和数据分布的离散程度。 17 二、数据分布的偏态 1. 未分组数据的偏态系数 2. 已分组数据的偏态系数 18 三、数据分布的峰度 1. 未分组数据的峰度系数 2. 已分组数据的峰度系数 19 第五节 统计软件应用 本节以例2-4中的数据为例,说明如何在Excel 2003中对样本数据集进行描述性统计分析。 第1步:将第二章表2-3中的数据录入Excel工作表,如图3-8所示。 第2步:单击【工具】下拉菜单,选择【数据分析】

您可能关注的文档

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档