预防医学__数值变量资料的统计分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
预防医学__数值变量资料的统计分析

主讲人:王春平 教研室:预防医学概论; ? 学习目标 :;统计推断;统计描述:利用统计图、统计表、统计指标等来描述资料的规律性及特点。 统计推断:用样本信息估计总体参数所在范围和用样本信息推断总体参数之间有无差别。 即参数估计和假设检验。 参数估计:用样本指标(统计量)估计总体指标(参数)。 假设检验:利用样本信息推断总体参数之间有无差别的方法。;数值变量资料的统计分析 ;第一节 数值变量资料的统计描述;一、数值变量资料的频数分布 二、集中趋势的描述 三、离散趋势的描述; (一) 频数表(frequency table)的编制 (二)频数表的用途 ;(一)频数表的编制方法;;2、确定组数、组段和组距: (1)确定组数K:根据研究目的和观察例数确定。 (2)定组距 i: 组距即组与组间的距离,一般等距分组。 近似组距 i=R/K(极差/组数)=4.45/12=0.37 根据专业习惯和方便计算适当调整, 所以本例 i=0.40。 (3)定组段的上下限: 每个组段的起点(最小值)称为该组的下限(low limit),终点(最大值)称为该组的上限(upper limit)。;;表9-2 140名正常成男血清尿素氮浓度的频数表;(二)频数分布表的用途;2、揭示频数分布的集中趋势和离散趋势。 集中趋势:大多数观察值趋向于同一数值的趋势,集中在4.00组段。 离散趋势:所有观察值不会均为同一数值,而是或近或远地分散在集中位置的周围。 ;;一、数值变量资料的频数分布 二、集中趋势的描述 三、离散趋势的描述;二、集中趋势的描述;符号:总体均数用希腊字母μ,样本均数 适用范围:对称分布,尤其正态或近似正态分布的资料。 计算方法: 直接法 加权法;直接法(用于n≤30) 加权法(用于n30) ;表9-2 140名正常成男血清尿素氮浓度的频数表;如表9-3第一组段的组中值是 按均数的计算公式求得均数为: ;几何均数G(geometric mean);几何均数的计算方法:;;表9-4 112名儿童接种免疫后血清抗体滴度计算表;;中位数(median,M);中位数的计算方法:;2、百分位数法:大样本频数表资料 百分位数(percentile,Px):表示一组观察值按升序排列,并等分为100等份,位居第x%位置的数。 中位数M=P50;式中, Px:百分位数 L:百分位数所在组下限; i:百分位数所在组的组距; fx:百分位数所在组的频数; fL:百分位数所在组之前的累计例数; n:样本例数。 ;表9-5 340名7岁以下儿童的血铅含量中位数及百分位数计算表; 本例怎样找中位数组段呢? 因为本例n=340是偶数,按照中位数的定义,中位数M所在组为340/2=170所在组, 可从累计频数一栏中找刚包括170的那一组,也可从累计频率一栏中找刚包括50%的那一组。 本例中位数所在组的下限为1.25-的组;i为0.25;f为55;fi为164,将其代入公式,求得M ;案例1;三、离散趋势的描述;;;;;数学上可以证明:;由于方差的度量单位是原度量单位的平方,为了方便实际使用,将方差公式开方,即得到标准差(standard deviation)。; 用途 反映个体观察值之间变异大小 结合均数描述正态分布特征 计算其他指标,如标准误等 ;(四)变异系数(coefficient of variation)/CV 1、意义 标准差与均数之比用百分数表示 2、计算 3、用途 比较度量衡单位不同资料的变异度 比较均数相差悬殊资料的变异度 ;第二节 正态分布及其应用;一、正态分布 二、正态分布的特征和曲线下面 积分布的规律 三、参考值范围的估计; 正态分布曲线:高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。 该曲线的函数表达式f(x)称为正态分布密度函数, 位置参数:μ 决定曲线的位置 变异度参数:σ 决定曲线的形状;正态概率密度曲线的特点: (1)关于x=μ对称 (2)在x=μ处取得最大值。 (3)曲线下面积为1。 (4)μ决定曲线在横轴上的位置, μ增大,曲线沿横轴向右移;反之, μ减小,曲线沿横轴向左移。 (5)σ决定曲线的形状,当μ恒定时, σ越大,数据越分散,曲线越“矮胖”; σ越小,数据越集中,曲线越“瘦高”。 习惯上用N( μ, σ2)表示均数为μ、标准差为σ的正态分布。; 标准差相同、均数不同的四条正态曲线; 均数相同、标准差不同的四条正态曲线;二、正态概率密度曲线下面积的分布规律 正态曲线下面积的

文档评论(0)

gz2018gz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档