3.统计描述(离散趋势的描述)解析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
离散趋势的描述 离散趋势的概念 离散趋势描述的指标 各指标的计算及意义 (二)百分位数 百分位数(percentile)是一种位置指标,用 来表示。 一个百分位数 将全部变量值分为两部分,在不包含 的全部变量值中有 的变量值比它小, 变量值比它大。 1.直接计算法 设有x个原始数据从小到大排列,第x百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时: 例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: n 120,120X5% 6,为整数: 例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: ,带有小数,取整后trunc(118.8) 118 2.频数表法 公式: 例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见表2-5第 1 、 2 栏,试分别求中位数及第25、第75百分位数。 某地120名正常成人血清铜含水量umol/L频数表 组段 频数f 频率% 累积频数fc 累积频率pc% 9.0~ 3 2.5 3 2.5 10.0~ 4 3.3 7 5.8 11.0~ 12 10.0 19 15.8 12.0~ 13 10.8 32 26.6 13.0~ 17 14.2 49 40.8 14.0~ 22 18.3 71 59.1 15.0~ 18 15.0 89 74.1 16.0~ 13 10.8 102 84.5 17.0~ 11 9.2 113 94.1 18.0~ 5 4.2 118 98.3 19.0-20.0 2 1.7 120 100.0 合计 120 100 三 离散趋势的描述 反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个个体之间的差异。 统计学中把个体间的差异称为变异性(variation)。所谓变异性是指在同质条件下的观察单位,其同一标志的数据间的差异性。用以描述一组数值变量资料观察值之间参差不齐的程度,即离散程度或变异度的指标,称为离散指标或变异指标。 常用统计指标: 全距或极差 range 四分位数间距 quartile interval 方差和标准差 variancestandard deviation 变异系数 CV coefficient of variation 全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于书中例8.1数据,有 二、四分位数间距(quartile range) 四分位数间距,用Q表示,若将一组资料分为四等份,上四分位数和下四分位数之差就是Q: Q P75-P25 下四分位数: 上四分位数: 三、方差与标准差 全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察值x与总体均数?的差值(x-?),称为离均差。 由于∑(x-?) 0,不能反映变异的大小,而用离均差平方和 ∑(x-?)2(sum of deviation from mean)反映。同时还要考虑到观察值个数N的影响,用其均数,即得到总体的方差,用?2表示。 公式为: 2.标准差(standard deviation) 方差可以比较全面地反映变量值的变异情况,但其方差的单位是原单位的平方,故引入标准差的概念。 标准差:将方差开平方,恢复成原度量单位,得到总体的标准差?和样本标准差S。 样本标准差用 表示 ,其度量单位与均数一致,所以最常用。 四、变异系数 例:某地7岁男孩身高的均数为123.10 cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg, 比较其变异度? 某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,试比较其变异度? 四、正态分布 正态分布 正态分布:又称为Gauss分布(Gaussian distribution)。 设想当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时,图2-4中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。这条曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布。在处理资料时,我们就把它看成是正态分布。 正态分布的概念和特征 1.正态分布曲线的数学函数表达式 如果随机变量 的分布服从概率密度函数 2.正态分布的特征 (4)正态曲线下的面积分布有一定的规律。 对公式 2-17 积分 : 小结 数值变量资料统计描述 离散趋势指标 极差、

文档评论(0)

bbnm58850 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档