- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 数据的描述2
第四章 数据的描述2---重要的统计量;§1 集中趋势的描述;§1.1 均值
§1.2 中位数
§1.3 众数
§1.4 均值、中位数、众数之间的比较
;1 均值;1.算术平均数未经分组整理的原始数据,其算术平均(arithmetic mean)的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。
设一组样本数据为 ,则算术平均数的计算公式为:
; 根据分组整理的数据计算的算术平均数,要以各组变量值出现的次数或频数为权数计算加权算术平均数。
假设样本数据被分成组,样本数据各组变量的代表值用m1、m2、…、mk 表示,各组变量值出现的频数用f1、f2、…、fk ,则加权算术平均数的计算公式为:
;【例4.1】根据表中给出的某项调查中30名被访者的月收入水平分组数据,计算其平均收入水平: ;2.调和平均数
调和平均数(harmonic mean)也称倒数平均数或调和均值。 有简单和加权两种形式。
简单调和平均数是各个变量值倒数的简单算术平均数的倒数。主要应用于各变量值对应的标志总量相等的情况。当变量值用xi表示时,其计算公式如下:
;当各变量值对应的标志总量不相等时,用Mi表示各单位或各组的变量值对应的标志总量,其计算公式如下:;【例4.2】根据某证券交易所信息,已知四只股票某日的收盘价和成交额如表所示,计算这四只股票的当日平均收盘价格。 ;3.几何平均数
几何平均数(geometric mean)也称几何均值,通常用来计算平均比率和平均速度。计算公式为:
几何平均数也可看作是算术平均数的一种变形.;【例4.3】某股票投资者长期持有一只股票,2005-2008年每年的收益率分别是5.6%,7.2%,28.5%,-15.6%。计算该股票投资者4年内的平均收益率。;4.均值的特点 :
均值一般用于寻找定量数据的中心代表值,并不适用于定性数据。
均值的优点在于它对变量的每一个取值都加以利用。
均值的缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。;2 中位数 ;1.中位数的确定
变量的取值数据规模较小时,将数据按大小排列。
当数据个数N为奇数时,处在 位置上的变量取值大小即为改组数据的中位数;
当数据个数N为偶数时,处在 和 位置上两个变量取值的简单算术平均数即为中位数。;当变量的取值数据规模较大时,将数据按单变量分组或组距分组,得到频数分布 。对频数分布做向上累计或向下累计:
当 为偶数时,第 个变量值所在的组为中位数所在的组。
当 为奇数时,第 个变量值所在的组为中位数所在的组。
如果是单变量分组,可以该组标志值作为中位数。
;如果是组距分组,则采用如下公式近似计算得到计算公式
下限公式:
上限公式:
;【例4.4】给出的某项调查中30名被访者的月收入水平分组数据,得到累积频数分布表,计算其中位数。;2.根据统计图来寻找中位数
对于处理成茎叶图的数据:
首先找到频数一半所对应的那段茎。
然后在对应的叶上找处在全部数据中间位置上的数即可。;例:;如果图形中没有原始数据,例如直方图。
;假设数据在中位数所在区间组均匀分布,全部100名调查员的中位数说对应的位置应当是50.5。通过图中观察在140-150组之前的累积频数是42,只需要在140-150之间找到第8.5位置上所对应的数。
由于假设140-150间这18个数是均匀分布的,而这段区间的长时10,因此区间上第8.5位置上的数应当是 。即中位数是144.7 ;3.中位数的特点
中位数很好的代表了一组数据的中间位置。
当直方图显示数据时一个有偏分布时。中位数具有较好的稳健性,对极端值并不敏感。
中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。;3 众数 ;1.定性变量的众数确定
根据分类变量和顺序变量的不同取值得到频数分布,确定众数时,只需找出频数出现最多所对应的变量取值即为众数。
例:
通过观察频数分布表,可以直观看到受教育水平为高中的频数最大。因此对于3000名被调查者受教育水平来说,众数就是高中学历。
;2.定量变量的众数确定
对于离散型变量的取值,计算众数时,只需找出出现次数最多的变量取值即为众数。
【例4.5】根据表中35名调查员的有效问卷频数分布资料,确定众数。;对于连续性变量的取值,首先根据组距分组得到频数分布。对于等距分组,对应频数最大的组为众数所在组;对于不等距分组,对应频数密度最大的组为众数组。;设众数组的频数为 ,众数前一组的频数为 ,众数后一组的频数为 。
假定数据在众数组均匀分布,众数与其相邻两组的频数分布有如下关系:
下限公式:
上限公式:
;*;【例4
文档评论(0)