- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二十二章 统计方法选择与结果解释幻灯片
一个经典例子:Durkheim资料分析所下的结论 对若干地区的调查发现,地区中基督徒人数所占比例越大,自杀率就越高。 相关和回归分析结果表明,基督徒人数比例与自杀率呈现出很强的联系,即基督徒自杀率高于其它宗教人群。 但这种因果推论很可能是有问题的! 因为并不知道这些自杀者到底来自哪些人群,它完全可能是另外一种情况,即在基督徒占大多数的地区,天主教徒或其它宗教信徒由于宗教歧视而更可能趋向于自杀。 小 结 表1 单变量资料差异比较的分析方法小结 资料类型 数据 特征 单组设计 完全随机设计 配对或配伍设计 两组 多组 两组 多组 定量资料 正态、方差齐 样本与总体均数比较的t检验 两样本t检验 单因素方差分析 配对t检验 随机区组设计方差分析 非正态和/或方差不齐 Wilcoxon符号 秩和检验 检验、Wilcoxon秩和检验 Kruskal-Wallis H秩和检验 Wilcoxon符号秩和检验 Friedman秩和检验 定性资料 无序 二项分布直接计算概率法、正态近似法(Z检验) 检验、Fisher确切概率法 表资料 检验、Fisher确切概率法 配对四格表 检验 配对 列联表 检验 有序 ____ Wilcoxon秩和检验 Kruskal-Wallis H秩和检验 Wilcoxon符号秩和检验 数据特征 分析方法 相关分析 定量资料 x、y服从双变量正态分布 直线相关分析 x、y不服从双变量正态分布 Spearman秩相关 定性资料( 表) 双向无序 检验 双向有序、属性不同 Spearman秩相关、线性趋势检验 Gamma系数 双向有序、属性相同 一致性检验(kappa系数的假设检验) 回归分析 应变量为连续型定量变量,服从正态分布 一个应变量,一个自变量:直线回归分析 一个应变量,多个自变量:多重线性回归分析 应变量为定性变量 logistic回归分析 应变量为含有截尾数据的生存时间 Cox比例风险回归分析 表2 双变量(多变量)资料的关联性分析方法小结 * 3. 正确理解可比性问题 应该怎样正确理解“可比性”问题? 比较A、B两地区肺癌死亡率的高低,总的肺癌死亡率A地区高于B地区,但B地区各年龄组肺癌死亡率却均高于A地区。 Why? 原因: 由于肺癌死亡率与年龄有关,通常随年龄增高而增高; A、B两地区各年龄组人口构成不同,A地区高年龄组人口构成大于B地区,这就造成了A地区总的肺癌死亡率高于B地区; 上述矛盾是因为两地人口年龄构成不同造成的。 A、B两地区肺癌死亡率到底谁高谁低? 直接比较肺癌死亡率: A地 B地 比较标准化肺癌死亡率: B地 A地 消除年龄的影响后 无疑,A地区肺癌死亡率高于B地区 因此,所谓可比性问题其实与研究目的有关。 如肺癌一例,假定已知年龄是肺癌死亡率的影响因素,如果想探索除了年龄之外还有没有其它因素影响肺癌死亡率,那么就应该对年龄进行标准化(如果标化后A、B两地肺癌死亡率相同,则说明年龄是影响肺癌死亡率的唯一因素)。 但如果研究目的并非探讨分组因素对研究指标的影响或作用,谈论可比性就没有意义,也没有必要去调整其它混杂因素的影响。 因为A地区肺癌死亡率高于B地区是一个不争的事实。 换言之,单纯描述谁高谁低无需进行调整,只是在进一步探究导致高低不同的归因(所谓因素分析)时才对混杂因素进行控制或调整。 4. 数据的分组问题 另一个在数据分析时特别值得注意的问题就是分组或分类问题 它既是数据整理的主要内容,也是数据分析的基础。 分组:就是将专业上认为性质相同的个体归在一起,将性质不同的个体区别开来,即试图在专业上反映出组内的同一性和组间的差异性。 在此基础上进行的数据分析才有可能揭示出事物的本质和规律。 美国儿科杂志曾报道了医生间关于口服氨苄青霉素副作用研究的一场有趣的争论。 剂量(mg/kg天) 无腹泻例数 有腹泻例数 合计例数 50 79 21 100 100 70 30 100 150 61 39 100 200 68 32 100 表1 口服氨苄青霉素的副作用 A医生认为:“腹泻副作用不论剂量大小均常发生,虽随剂量增加而增加,但无统计学意义(Pearson 检验P0.05)”。见表1。 B医生认为,在缺乏未服氨苄青霉素对照组时,只好以50mg组与较大剂量组比较。若腹泻与剂量无关,则两组腹泻发生率差异应无统计学意义。因此,将较大剂量各组合并(见表2)。 表2 表1合并后的结果 剂量(mg/kg/天) 无腹泻例数 有腹泻例数 50 79 21 50 199 101 结果: 较大剂量组的腹泻发生
文档评论(0)