统计2--数值变量资料的统计描述2014.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1医学统计学的主要内容山东大学公共卫生学院LiuYunxia数值变量资料的统计描述山东大学公共卫生学院刘云霞山东大学公共卫生学院LiuYunxia3变量类型(复习)数值变量(numericalvariable)其变量值是定量的,表现为数值大小,多有度量单位。如身高(cm)、体重(kg)等。由数值变量的测定值构成的资料称为数值变量资料或计量资料。分类变量(categoricalvariable)亦称定性变量,表现为互不相容的类别或属性。无序分类变量(unorderedcategoricalvariable):所分类别或属性之间无程度或顺序上的差别。如性别、血型等。有序分类变量(ordinalcategoricalvariable):所分类别或属性之间有程度或顺序上的差别。如尿蛋白化验结果等。变量类型可根据统计分析的需要进行转化。山东大学公共卫生学院LiuYunxia4山东大学公共卫生学院LiuYunxia5内容提纲§2.1频数分布频数表的概念频数表的编制方法频数表的用途※频数分布的特征※频数分布的类型山东大学公共卫生学院LiuYunxia6一、频数分布表的概念当样本含量n较大时,为了解样本中观察值的分布规律和便于指标计算,可编制频数分布表,简称频数表(frequencytable)。频数:对某一随机现象进行重复观察,或测量大量个体的某项特征,其中某个或某一组变量值出现的次数。频数表:将各变量值与其相应的频数列成表格形式即为频数表。山东大学公共卫生学院LiuYunxia7二、频数表的编制数值变量资料的频数分布变量的取值为正整数时,如轧钢工人白细胞中的大单核细胞数:384510135347……山东大学公共卫生学院LiuYunxia8二、频数表的编制数值变量资料的频数分布山东大学公共卫生学院LiuYunxia9变量的取值是连续的,如身高、体重、血压等。编制频数表时需要根据变量的取值范围将变量值划分为若干组段,然后再汇总各组段的频数。具体步骤通过例子加以说明10例2.1某地2004年抽样调查100名男大学生的身高(cm)山东大学公共卫生学院LiuYunxia频数表的编制步骤1.找出观察值中的最大值和最小值,求全距(极差,range)。本例最大值为183.5,最小值为162.9,全距R=183.5-162.9=20.6(cm)。2.确定组段数和组距,划分组段。组段数:根据样本量大小,一般划分8~15个组段。组距:即每一组段上、下限之差。一般取等距分组,组距取极差的1/10(取整或四舍五入)。划分组段:各组段是连续的,但不能有交叉和重叠,应使观察单位分组时“不重不漏”,第一个组段包含最小值,最后一个组段包含最大值。本例取组距(cm),第1个组段下限从162cm开始,第2个组段下限为164cm,……,依次类推,最后一个组段为182~184cm。3.列频数表,汇总频数。山东大学公共卫生学院LiuYunxia11山东大学公共卫生学院LiuYunxia12山东大学公共卫生学院LiuYunxia13直方图(histogram)注意:有些资料因为数据中有特大或特小的数值也可以采用不等组距,如某些食物中毒的潜伏期,大部分在短时间内出现症状,只有极少部分的人经过较长的时间后才有反应,这种情况可将后面的一些组段作适当的合并,并可以将最后一个组段以大于某个值表示,以避免出现一些组段频数为零的情况。对于不等距资料绘制直方图时,应先将不等距的各组频数折算成等距频数,然后再做图。山东大学公共卫生学院LiuYunxia14三、频数表的用途频数表可以揭示资料分布类型和分布特征;便于发现资料中的某些远离群体的特大或特小值。当样本含量比较大时,可以各组段的频率估计概率。作为资料的陈述形式,可代替原始资料,直观地反映被研究事物的分布特征,又便于作进一步的分析研究。山东大学公共卫生学院LiuYunxia15山东大学公共卫生学院LiuYunxia16图2-1某地100名18岁男大学生身高的频数分布山东大学公共卫生学院LiuYunxia17频数分布的类型对称分布:指频数分布的集中位置在中间,左右两侧大致对称。偏态分布:指频数分布不对称,集中位置偏向一侧。集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。如有害化学物质在正常人体内的分布为正偏态分布;冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。不同的分布类型应选用不同的统计分析方法。山东大学公共卫生学院LiuYunxia18对于数值变量资料,应将集中趋势和离散程度二者结合起来分析其分布规律。集中趋势(centraltendency):即身高向中央部分集中,以中等身高居多(172cm组段),此为集中趋势。反映集中位置或平均水平。离散趋势(tendencyofdispersion):由中等

文档评论(0)

精品文库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档