统计描述.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计描述

定量资料的统计描述 Descriptive Statistics 一、频数分布表与频数分布图 (frequency distribution table and graph ) 编制频数表的步骤 (1)计算极差(range,R)也称全距,是一组变量值中最大值与最小值之差。(1.7kg) (2)确定组距和组段 ①确定组段数 8~15组(10组) ②确定组距 极差/拟分组段数(0.2kg) ③划分组段 左闭右开[2.5,2.7) 最小、最大值 (3)统计各组段频数 (4)计算频率、累计频数与累计频率 65.3 频数分布图 频数表和频数图的用途 1. 揭示资料的分布类型与特征 2. 便于统计指标的进一步分析处理 3. 便于发现个别特大或特小的可疑值 4. 正态性判定,确定参考值范围,正确选用统计分析方法。 正态分布与偏态分布 1.正态分布:高峰居中,两端基本对称。 2.偏态分布:频数最多的组段不在中间位置,各组段以此为中心呈不对称分布。 正偏态(右偏态):高峰偏左,尾部向右 负偏态(左偏态):高峰偏右,尾部向左 120例链球菌感染咽炎患者潜伏期 频数表的分布特征 ①有明显的统计分布规律,数据主要集中在3.1~3.7kg之间,尤以组段的人数在3.3~3.5kg最多,且上下组段数的频数分布基本对称。 ②变异的范围在2.50~4.20kg。 第二节 定量资料集中趋势指标 平均数(average)描述定量资料的集中趋势,说明数据的平均水平。 1.算术均数,简称均数 (mean) 2.几何均数(geometric mean) 3.中位数 (median) 简称:平均值、均值或均数(mean) 符号:样本均数 总体均数μ 适用条件:描述一组服从对称分布特别是正态分布或近似正态分布的资料的集中趋势。 1. 均数(mean) 1. 均数(mean) Σ为求和符号,读成sigma (17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg) (17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+70.0)/10=25.80(kg) 1. 均数(mean) Σ为求和符号,读成sigma (17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg) (17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+70.0)/10=25.80(kg) 2. 几何均数(geometric mean) 几何均数:变量对数值的算术均数的反对数。 几何均数的适用条件与实例 适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料 血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。 此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数均数。 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布 3. 中位数(median) 中位数指把一组数据从小到大排列后,位次居中的观测值。总体中有一半观测值小于中位数,一半观测值大于中位数。 适用条件:适合各种类型的资料。尤其适合于①大样本偏态分布的资料; ②资料分布不明或分布末端无确定数值(例: 1,3,7,5,20)等。 例:现调查得9例某传染病患者发病潜伏期时间(天)分别为2,3,6,7,8,8,11,13,19,求其中位数。 例:现调查得20例某传染病患者发病潜伏期时间(天)分别为1,2,2,3,3,4,5,6,7,7,9,9,9,10,11,13,15,20,26,30求其中位数。 中位数计算公式与实例 先将观察值按从小到大顺序排列,按以下公式计算: 特点:仅仅利用了中间的1~2个数据,位于中部的百分位数比较稳定,所以P50具有较好的代表性。 想象你在运输部门工作,你想向领导汇报26条公路项目投资的平均值是多少。 其中一条新公路收到的资助数额最大(2200万),另外的25个,每项投资在20~100万之间。 中位数是25万,均数是100万。 你会选择哪一种平均数来代表每一条高速公路所获得的投资呢? 均数、中位数两者关系 均数、中位数两者关系 正态分布时: 均数=中位数 正偏态分布时:均数中位数 负偏态分布时:均数中位数 例:9例某传染病患者发病潜伏期时间(天)2,3,6,7,8,8,11,13,19, 例:20例某传染病患者发病潜伏期时间(天) 1,2,2,3, 3, 4, 5, 6

文档评论(0)

chenchena + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档