第2章定量资料统计描述.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章定量资料统计描述.ppt

第2章 定量资料的统计描述 医学本科生用 泰山医学院预防医学教研室 zcheng@tsmc.edu.cn The teaching plan for medical students Dept. of Preventive Medicine Taishan Medical College 目 录 第一节 频数分布表 统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。 频数分布表(frequency distribution table):主要由组段和频数两部分组成表格。 二、频数分布表的编制 编制步骤 : 1. 计算全距 (range): 一组变量值最大值和最小值之差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一般分为8~15组。 ; 4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ; 5.频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。 表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布 二、频数分布表的用途 第二节 集中趋势的描述 一、算术均数 1. 直接法:用于观察值个数不多时 2.加权法(weighting method):用于变量值个数 较多时。 120名12岁健康男孩身高均数为143.07cm。 二、几何均数 几何均数(geometric mean,简记为G):表示其平均水平。 适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。 计算公式:有直接法和加权法。 1.直接法: 用于变量值的个数n较少时 2.加权法 : 用于资料中相同变量值的个数f(即频数)较多时。 ①变量值中不能有0; ②不能同时有正值和负值; ③若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 三、中位数及百分位数 ㈠中位数 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。 适用条件:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清。 ㈡ 百分位数 定义:百分位数(percentile)是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。 ①描述一组资料在某百分位置上的水平; ②用于确定正常值范围; ③计算四分位数间距。 计算方法:有直接法和加权法 2.频数表法: 用于例数较多时 计算中位数及百分位数的步骤: 先找到包含Px的最小累计频率; 该累计频率同行左边的组段值为L; L同行右边的频数为fx(或fm); L前一行的累计频数为∑fL; 将上述已知条件代入公式计算Px或P50 。 计算结果: 第三节 离散趋势的描述 定义:用来说明变量值的离散程度或变异程度。 注意:仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。 常用离散指标有:极差、四分位数间距、标准差、方差、变异系数。 实例分析 甲组: 184 186 188 190 192 乙组: 180 184 188 192 196 两组球员的平均身高都是188cm,但甲组球员身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。 一、极差和四分位数间距 ㈠极差 极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差 。 特点:计算简单,不稳定,不全面,易变化;可用于各种分布的资料。 ㈡四分位数间距 公式: Q= P75-P25 特点:比极差稳定,只反映中间两端值的差异。 计算不太方便。可用于各种分布的资料。 二、方差和标准差 ㈠方差(variance) 自由度(degree of freedom)的概念 n-1是自由度,用希腊小写字母ν表示,读作[nju:]。 定义:在N维或N度空间中能够自由选择的维数或度数。 例:A+B=C,共有n=3个元素,其中只能任选2个元素的值,故自由度ν=n-1=3-1=2。 方差的特点 充分反映每个数据间的离散状况,意义深刻; 指标稳定,应用广泛,但计算较为复杂,不易理解; 方差的单位与原数据不同,有时使用时不太方

文档评论(0)

huaz15718 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档