第4章 数据的描述2.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 数据的描述2

第四章 数据的描述2---重要的统计量;§1 集中趋势的描述;§1.1 均值 §1.2 中位数 §1.3 众数 §1.4 均值、中位数、众数之间的比较 ;1 均值;1.算术平均数未经分组整理的原始数据,其算术平均(arithmetic mean)的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。 设一组样本数据为 ,则算术平均数的计算公式为: ; 根据分组整理的数据计算的算术平均数,要以各组变量值出现的次数或频数为权数计算加权算术平均数。 假设样本数据被分成组,样本数据各组变量的代表值用m1、m2、…、mk 表示,各组变量值出现的频数用f1、f2、…、fk ,则加权算术平均数的计算公式为: ;【例4.1】根据表中给出的某项调查中30名被访者的月收入水平分组数据,计算其平均收入水平: ;2.调和平均数 调和平均数(harmonic mean)也称倒数平均数或调和均值。 有简单和加权两种形式。 简单调和平均数是各个变量值倒数的简单算术平均数的倒数。主要应用于各变量值对应的标志总量相等的情况。当变量值用xi表示时,其计算公式如下: ;当各变量值对应的标志总量不相等时,用Mi表示各单位或各组的变量值对应的标志总量,其计算公式如下:;【例4.2】根据某证券交易所信息,已知四只股票某日的收盘价和成交额如表所示,计算这四只股票的当日平均收盘价格。 ;3.几何平均数 几何平均数(geometric mean)也称几何均值,通常用来计算平均比率和平均速度。计算公式为: 几何平均数也可看作是算术平均数的一种变形.;【例4.3】某股票投资者长期持有一只股票,2005-2008年每年的收益率分别是5.6%,7.2%,28.5%,-15.6%。计算该股票投资者4年内的平均收益率。;4.均值的特点 : 均值一般用于寻找定量数据的中心代表值,并不适用于定性数据。 均值的优点在于它对变量的每一个取值都加以利用。 均值的缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。;2 中位数 ;1.中位数的确定 变量的取值数据规模较小时,将数据按大小排列。 当数据个数N为奇数时,处在 位置上的变量取值大小即为改组数据的中位数; 当数据个数N为偶数时,处在 和 位置上两个变量取值的简单算术平均数即为中位数。;当变量的取值数据规模较大时,将数据按单变量分组或组距分组,得到频数分布 。对频数分布做向上累计或向下累计: 当 为偶数时,第 个变量值所在的组为中位数所在的组。 当 为奇数时,第 个变量值所在的组为中位数所在的组。 如果是单变量分组,可以该组标志值作为中位数。 ;如果是组距分组,则采用如下公式近似计算得到计算公式 下限公式: 上限公式: ;【例4.4】给出的某项调查中30名被访者的月收入水平分组数据,得到累积频数分布表,计算其中位数。;2.根据统计图来寻找中位数 对于处理成茎叶图的数据: 首先找到频数一半所对应的那段茎。 然后在对应的叶上找处在全部数据中间位置上的数即可。;例:;如果图形中没有原始数据,例如直方图。 ;假设数据在中位数所在区间组均匀分布,全部100名调查员的中位数说对应的位置应当是50.5。通过图中观察在140-150组之前的累积频数是42,只需要在140-150之间找到第8.5位置上所对应的数。 由于假设140-150间这18个数是均匀分布的,而这段区间的长时10,因此区间上第8.5位置上的数应当是 。即中位数是144.7 ;3.中位数的特点 中位数很好的代表了一组数据的中间位置。 当直方图显示数据时一个有偏分布时。中位数具有较好的稳健性,对极端值并不敏感。 中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。;3 众数 ;1.定性变量的众数确定 根据分类变量和顺序变量的不同取值得到频数分布,确定众数时,只需找出频数出现最多所对应的变量取值即为众数。 例: 通过观察频数分布表,可以直观看到受教育水平为高中的频数最大。因此对于3000名被调查者受教育水平来说,众数就是高中学历。 ;2.定量变量的众数确定 对于离散型变量的取值,计算众数时,只需找出出现次数最多的变量取值即为众数。 【例4.5】根据表中35名调查员的有效问卷频数分布资料,确定众数。;对于连续性变量的取值,首先根据组距分组得到频数分布。对于等距分组,对应频数最大的组为众数所在组;对于不等距分组,对应频数密度最大的组为众数组。;设众数组的频数为 ,众数前一组的频数为 ,众数后一组的频数为 。 假定数据在众数组均匀分布,众数与其相邻两组的频数分布有如下关系: 下限公式: 上限公式: ;*;【例4

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档