- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第13章 行×列表分析 学习目标 掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序; 了解FREQ过程语句格式; 熟悉R×C表资料的分类类型以及相应的统计检验方法; 掌握行均分检验以及SAS程序; 掌握行列均为顺序变量的相关检验以及SAS程序; 掌握分层行列表的分析以及SAS程序; 掌握趋势卡方检验方法以及SAS程序; 了解卡方分割与卡方合并; 熟悉Fisher’s确切概率计算方法。 概述 前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。?2检验可解决此类问题。 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 四格表资料 定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡”)和名义的(如:血型分为“O、A、B、AB”型)2类,对于每1个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的1级(如某人的疗效为“显效”);名义指标的观测结果只能是该名义指标若干标志中的1个(如某人的血型为B型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。 当表中只有2个定性指标时,称为2维列联表;有3个或3个以上定性指标时,称为多维列联表。常用R、C表示2维列联表的行数和列数,并称为R×C表;当R=C=2时,称为2×2表(或四格表)。2×2表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。 四格表卡方检验 为了解不同致癌剂的致癌作用,分别在两组大白鼠皮肤涂以不同致癌剂,观察不同致癌剂作用下的发癌率,结果如下表13-1,问两组发癌率有无差别? 表13-1 不同致癌剂作用下大白鼠的发癌率 四格表卡方检验 这四个格子是表中最基本的数据,其余数据都是由这四个数据推算出来的,因此上表资料又被称之为四格表资料。 ?2检验的基本思想及计算步骤如下: 假设两总体率相等 H0: ,即两总体发癌率相等; H1: ,即两总体发癌率不等; 。 四格表卡方检验 不妨将H0看作 两样本合并的发癌率(Pc=80.33%),按合计率推算,本例第一行第一列理论上的致癌数为: 此结果称为理论频数,简称理论数,记为T。由上述过程可推导出理论数的计算公式为: 四格表卡方检验 式中Trc即第r行第c列的理论数,nr为Trc所在行合计,nc为Trc所在列合计。相应地,表中的4个基本数据为实际频数,简称为实际数,记为A。4个基本格子的实际数都不等于理论数。 经上述推导,两样本率的差别就演绎为实际数与理论数之间的差别。即:两样本率相差越大,则实际数与理论数的差别就愈大。 四格表卡方检验 卡方检验的统计量是?2值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,故?2值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。 四格表卡方检验 实际数与理论数的差值服从?2分布:在H0条件下,上述 差值属于随机误差,可获得统计量: 四格表卡方检验 差?2分布表,确定P值并作出推论,以?=1查?2界值表得: 本例?2=6.4777,故0.05P0.01,按水平拒绝H0,接受H1,因而可以认为两种致癌剂作用于大白鼠的发癌率有差别(统计学推论)。结果说明乙组致癌剂的发癌率高于甲组(结合样本率作实际推论)。 连续性校正公式 ?2分布是正态变量的一种分布。设 是k个独立的标准正态变量,则 。?2界值表就是根据这种连续性分布计算出来的。?2统计量计算公式实质上是正态近似法。分类资料是间断性的,由此计算的?2值不连续,尤其自由度为1的四格表,求出的概率可能偏小,此时需要对?2值进行连续性校正,公式为 ?2检验的应用条件 连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。 四格表?2检验的应用条件为: 当n≥40且所有T≥5时,用普通的?2检验,若所得,改用确切概率法; 当n≥40但有1≤T5时,用校正的?2检验; 当n40或有T1时,不能用?2检验,改用确切概率法。 四格表卡方检验的SAS程序 在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计
您可能关注的文档
最近下载
- 绵阳南山2025年高中自主招生数学真卷 .pdf VIP
- 学生公寓引进社会化服务安装自助吹风机项目147.docx
- 粤语学习必威体育精装版最全教程.ppt VIP
- 2025上海市六年级升七年级暑假数学衔接讲义 第32讲 图形的运动 暑假综合检测二(解析版)(1).docx VIP
- 压力容器制造质量保证手册+程序文件+表格-符合TSG 07-2019特种设备质量保证管理体系.pdf
- 深海鱼油(syt)课件.ppt
- 《做温暖的教育者》读书分享+课件.pptx VIP
- GB50907-2013 抗爆间室结构设计规范.docx VIP
- 部编版语文一年级上册第八单元教材解读大单元集体备课.pptx VIP
- 大功率充电中压直挂充电技术的发展.pdf VIP
文档评论(0)