第4章-数据的概括性度量.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 总体方差和标准差 (Population variance and Standard deviation) 未分组数据: 方差的计算公式 标准差的计算公式 未分组数据: 组距分组数: 组距分组数: * 案例分析 总体标准差的计算 【例】根据表中的数据,计算工人日加工零件数的标准差 某车间50名工人日加工零件标准差计算表 按零件数分组 组中值(Xi) 频数(Fi) (Xi- X )2 (Xi- X )2Fi 105~110 110~115 115~120 120~125 125~130 130~135 135~140 107.5 112.5 117.5 122.5 127.5 132.5 137.5 3 5 8 14 10 6 4 246.49 114.49 32.49 0.49 18.49 86.49 204.49 739.47 572.45 259.92 6.86 184.90 518.94 817.96 合计 — 50 — 3100.5 * 样本方差和标准差 (simple variance and standard deviation) 方差的计算公式 注意:样本方差用自由度n-1去除! 标准差的计算公式 未分组数据: 未分组数据: 组距分组数据: 组距分组数据: * 样本方差 自由度(degree of freedom) 1.一组数据中可以自由取值的数据的个数 2.当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 4.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量 * 案例分析 样本方差 样本方差与标准差 原始数据: 10 5 9 13 6 8 * 离散系数 (coefficient of variation) 1.标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 4.用于对不同组别数据离散程度的比较 5.计算公式为: * 案例分析 离散系数 【例】某公司抽查了所属的8家超市,其产品销售数据如表。试比较产品销售额与销售利润的离散程度 超市编号 产品销售额(万元) x1 销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 表2-8 某公司所属8家超市的产品销售数据 * 案例分析 离散系数 v1= 536.25 309.19 =0.577 v2= 32.5215 23.09 =0.710 结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 * 本节提问 为什么要计算离散系数? 第3节 分布偏态与峰度的测度 一、偏态及其测度 二、峰度及其测度 * 偏态与峰度分布的形状 偏态 峰度 左偏分布 扁平分布 右偏分布 尖峰分布 与标准正态分布比较! * 偏态 1、偏态:衡量频数分配不对称程度,或偏斜程度的指标。 2、计算公式: * 当 =0时,左右完全对称,为正态分布;当 0时为正偏斜(右偏);当 0时为负偏斜(左偏)。 Ⅰ(α3 =0) II(α3 0) Ⅲ(α3 0) 偏态 * 案例分析 偏态 按纯收入分组(元) 户数比重(%) 500以下 500~1000 1000~1500 1500~2000 2000~2500 2500~3000 3000~3500 3500~4000 4000~4500 4500~5000 5000以上 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94 【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数 表2-9 1997年农村居民家庭纯收入数据 * 案例分析 偏态与峰度从直方图上观察 户数比重 (%) 25 20 15 10 5 按纯收入分组(元) 1000 500 ← 1500 2000 2500 3000 3500 4000 4500 5000 → 结论:1. 为右偏分布 2. 峰度适中 农村居民家庭村收入数据的直方图 * 案例分析 偏态系数(计算过程) 按纯收入分组 (百元) 组中值 Xi 户数比重(%) Fi (Xi- X ) Fi3 (Xi-

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档