第三章数据分布特征的测度解析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章数据分布特征的测度解析

对于比率数据的平均采用几何平均要比算术平均更合 理。几何平均数也可以看成是均值的一种变形。 几何平均数的对数是各变量值对数的算术平均。需要注意得是,当数据中出现零值或负值时不宜计算几何平均数。 用Excel计算算术平均、几何平均值和调和平均值 算术平均:函数分类---统计---AVERAGE 几何平均:函数分类---统计---GEOMEAN 调和平均:函数分类---统计---HARMEAN 四、众数、中位数和均值得比较 众数、中位数和均值时集中趋势得三个主要的测度值 (一)众数、中位数和均值得关系 从分布得角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均值。 单峰分布的大多数数据而言,众数、中位数和均值之间具有以下关系: 对称分布: 左偏分布: 右偏分布 Mo=Me=均值 MoMe均值 均值 Me Mo (二)众数、中位数和均值的特点与应用场合 众数是一组数据分布的均值,它是一种位置代表值,不受极端值的影响。缺点:不唯一或没有。众数适合于作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值。其特点是不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。 均值是数值型数据的集中趋势测度值。它利用了全部数据信息。调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数。均值的主要缺点时易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差。 第2节 离散程度的测度 集中趋势只是数据分布的一个特征,它所反映的是各变量值向其中心值聚集的程度。而数据的分散程度是数据分布的另一个重要特征,它所反映的是各变量值远离其中心 值的程度,即离中趋势。描述数据离散程度采用的测度值,依据数据类型的不同主要有异众比率、四分位差、方差和标准差、极差、平均差和离散系数等 一 分类数据:异众比率(variation ratio) 异众比率:指非众数组的频数占总频数的比率。 它的作用是衡量众数对一组数据的代 表程度。 其中, 变量值的总频数, 众数组的频数 [例3-11 ]计算表2-5中数据,饮料品牌的异众比率 注:异众比率越大,众数的代表性越差; 异众比率越小,众数的代表性越好。 利用异众比率还可以比较不同总体或样本的离散程度 四分位差:上四分位数与下四分位数之差,它反映了中间50%数据的离散程度。数值越小,说明中间数据越集中;数值越大,说明中间数据越分散。它不受极值的影响。它还说明了中位数对一组数据的代表程度。 二 顺序数据:四分位差(quartile deviation) [例3-12] 根据表2-6中的数据,计算顾客评价等级的四分位差 三 数值型数据:方差和标准差 (一)极差(range) 一组数据的最大值与最小值之差。易受极端值的影响,不能反映中间数据的分散程度。 (二)平均差(mean deviation) 是各变量值与其均值离差绝对值的平均数。平均差以均值为中心,反映了每个数据与均值的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大说明数据的离散程度就越大,反之则说明数据的离散程度就越小。 未分组数据计算 平均差的公式为: 分组数据计算平 均差的公式为: [例3-13]根据表3-2中的分组数据,计算业务员月销售额的平均差。 (三)方差和标准差 (variance) 方差: 是各变量值于其均值离差平方的平均数,它是测度数值型数据离散程度的最主要方法。 未分组数据: 分组数据: 标准差(standard deviation) 未分组数据: 分组数据: [例3-14]根据表3-2中分组数据,计算业务员月销售额的标准差。 方差或标准差是根据全部数据计算的,他反映了每个数据与其平均值相比平均相差的数值,它能准确地反映出数据的离散程度。 用Excel计算离散趋势值 平均差: “ AVEDEV” 总体方差:“VARP” 总体标准差: “ STDEVP” 四 相对位置的测量:标准分数(standard score ) 在对多个具有不同量纲的变量进行处理时,常常需要对各变量数值进行标准化处理。 [例3-15] 根据例3-4的数据,计算每个家庭人均月收入的标准分数。 实际上,z分数只是将原始数据进行了线性变换,他并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1 用Excel标准化 STANDARDIZE(标准化数据) “X”:需要正态化的数值; “Mean”:数据分布的算术平均值; “Standard-d

文档评论(0)

33qwer + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档