第十章数值变量资料统计分析.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章数值变量资料统计分析

第二章 集中趋势(平均水平)的统计描述 课 时:2学时 授课对象:临床医学、康复医学、中医学本科 目的要求:1. 掌握数值变量资料主要描述性指标(集中趋势指标)的定义、应用条件和计算方法。 2. 了解百分位数的计算、意义。 重 点:集中趋势指标的描述。 难 点: 频数分布表的制作;百分位数的计算、意义。 教学方式:小班讲授 学时安排:组织教学1分钟,复习旧课2分钟,讲授新课85分钟,小结2分钟。 教学基本内容如下: 对搜集到的任何统计资料都需要进行整理,了解其数量特征、分布规律, 以便进一步统计分析。对数值变量资料进行统计描述,需要根据资料的分布类型选择合适的统计指标,因此,首先我们要通过频数分布表或分布图来了解资料的分布特征。 第一节 频 数 分 布 一、频数表 什么叫频数(frequency)? 频数是指在对一组研究对象进行观察时,某变量或指标数值出现的次数。我们可以将各变量值及其出现的频数编制频数分布表(简称频数表),以此反应各变量值与其频数之间的关系,并观察资料的分布类型。 现利用例2.1 的资料(P9)来说明编制频数表的步骤。 频数表及其制作 1.求全距(极差,range) R= 最大值—最小值=5.95—3.82=2.13(1012/L) 2.确定组段数和组距(class interval) 根据样本含量多少确定组段数(K),一般设8~15(或9~16)个组段,100例以上取10个左右,例数较少时可相应减少组段数,反之,例数较多时可相应增加。 相邻两组段下限之差称为组距(),一般都用等距,且用“极差∕组段数”之商最接近的方便的数(能取整数值时最好)作为组距,本例若分为10个组段,则=/=2.13/10=0.213(1012/L), 取整0.2,便于汇总和计算。各组段的的起点和终点分别称为下限(lower limit)和上限(upper limit)。注意的是:第一组段应包括最小值,下限取3.80(1012/L),最末组段应包括最大值,略大于或等于最大值。即取5.80~6.00(1012/L)。 3.列出频数表 组段确定后,将原始数据用唱票划计法或计算机做出频数表,可得到各组段的频数、频率、累积频数和累积频率,见表2-2(P10只列出了频数与频率)。 二、频数分布图(直方图) 频数分布图 将频数表数据在直角坐标系上绘制成图便称为频数分布图,简称频数图,其意义同频数表,但较直观。见图2-1(P11)。 三、频数表及频数图的应用意义 1.较具体地、直观地描述一组数据的分布特征; 2.便于发现可疑的异常值; 3.有助于正确选用统计指标进行更深入地分析。 由频数表或频数图可以看出本例分布的两个重要特征:①集中趋势(central tendency)。成年男性的RBC测定值虽然高低不等,但向中间集中,中等水平(4.60~ 1012/L)的人数最多;②离散趋势(tendency of dispersion)。即随着RBC值逐渐变大或变小,人数越来越少,向两端分散。由此知道资料的分布类型,频数分布有对称分布和偏态分布之分。对称分布是指集中位置在正中,左右两侧频数分布大致对称,这种分布统计学上称为正态分布或近似正态分布。偏态分布是指频数分布不对称,集中位置偏向一侧,若偏向数值小的一侧——正偏态分布(左偏态分布),如食物中毒潜伏期的分布;集中位置偏向数值大的一侧——负偏态分布(右偏态分布),如冠心病,大多恶性肿瘤患者的年龄分布都呈负偏态分布。不同的分布选用不同的统计分析方法。 第二节 平 均 数 统计分析包括统计描述和统计推断两部分,统计描述是用统计指标、统计表和统计图来描述资料分布规律及数量特征;统计推断则包括总体参数估计和假设检验两个内容。 平均数(average)是一类描述数值变量资料集中趋势的指标。这类指标不但能给人一个简明概括的印象,而且还便于进行事物间的分析比较。医学统计上常用的集中趋势指标有、G、M,它们用于描述一组同质数值变量资料的平均水平或集中趋势。 (一)算术均数(arithmetic mean) 简称均数,它是一组已知性质相同的数值之和除以数值个数所得的商。常用表示样本均数,表示总体均数,适用于呈对称分布,尤其是正态分布或进似正态分布的数值变量数据资料。其计算方法有直接法,加权法、简捷法三种,随着计算机的普及,简捷法将被逐渐淘汰。 1.直接法 当观察例数不多,如小于30时,或观察例数虽然很多,但有计算机及统计软件,宜选择此法: 公式: (2-1) 例2-2 测定5名健康人第1小时末血沉,分别是6,3,2,9,10(mm),试求均数。 将5个人的血沉值代入公式2-1,得 2.加权法 当观察值个数较多时,可先将各观察值分组归纳成频数表,用加权法求其均数。将

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档