- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 卡方分析教学版
第八章 ?2检验 ;内容;引言;参数统计和非参数统计优缺点;实际应用情况:调查、问卷、访谈等方法中,按性质划分类别,然后将结果按类计点人数或个数,得到计数数据。 类别变量(1)只能划分为类别,如性别、民族;(2)人为划分类别,如学习成绩(连续数据)分成优、良、中、差。 这些计数数据不能使用前几章所讲的统计方法,需要用到计数数据专用的统计方法,这些分析方法主要是根据χ2(卡方)分布进行的,故称为卡方检验。这类数据大都以表格形式表示,所以又称列联表分析。;1.单变量的卡方检验:同时检验一个因素两项或多项分类的实际观察数与某理论次数分布是否相一致的问题,或说有无显著差异的问题。这种检验又称为拟合度检验。 理论次数是指根据概率原理、某种理论、某种理论次数分布或经验次数分布所计算出来的次数。 3.独立类别的卡方检验:用于检验两个或两个以上因素(变量)各有多项分类之间是否有关联或是否具有独立性的问题。如不同性别的人在态度上是否有差异。这类检验又称独立性检验。 ;卡方检验的基本公式; 指用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度,是对次数分布的检验。 (一)研究情境 主要用于实际观察次数(f0)与某理论次数(fe)是否有差别的分析。例如, 在医生职业中,男的多还是女的多? 在三种咖啡中,哪种被国人最喜欢? 在北京大学中,各国留学生的比例有代表性吗? ;(二)统计假设及相关计算;实际观察次数与某理论次数之差的平方再除以理论次数,即 f0:观察次数 f e :期望次数 其中,f e 期望次数(大于5)。 ;例1 某项民意测验,答案有同意、不置可否和不同意三种,调查结果如下表:;例2 某班学生50人,体检结果按一定标准划分为甲、乙、丙三类,各类人数分别为:甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布?;例3 下表所列资料是552名中学生的身高次数分布,问这些学生的身高分布是否符合正态分布。;二、总体分布的拟合检验;三、独立性检验;虚无假设:两变量(或多变量)之间是独立的或无关联的 备择假设:两变量之间有关联或差异显著,一般用文字叙述,不用统计符号。 例4:某学校对学生的课外活动内容进行调查,结果整理成下表: ; 虚无假设:体重自我知觉与性别无关;计算;; 观察频数a对应的理论频数为: 式中TRC为第R(row)行、第C(column)列的理论频数,nR为相应行的合计,nc为相应列的合计,n为总例数.; 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,自由度(df)=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值. 自由度=(行数-1)(列数-1) ;(三) 2×2 列联表 检验 ; 例5 工农业高血压患病率的比较(50岁以上男性),首钢调查50-59岁男性工人1281人、高血压患者386人,患病率为30.13%。石景山区农民387人,血压血患者65人,患病率为16.80%,从事工农业生产的男性患病率有无差别。 ;解: ① 建立检验假设 H0:π1 =π2 (工人与农民的总体患病率相同) ?=0.05 估计总体某现象的发生或存在的概率,假定高血压的发生和这两种工种众彼此独立无关,因此,这两组资料是一总体中的两个随机样本,估计 总体患病率= 451/1668 =0.2704 未患率= 1217/1668=0.7296;;??? 计算检验统计量 ?2 值 ⑤ 查 ?2 分布界值表,作出统计结论。 df = (r-1)(c-1)=1; 故按 p0.01 水平拒绝Ho 接受H1 。 ⑥ 结合具体问题作出专业结论:不同职业的高血压患病率极显著意义,工人的高血压患病率显著高于农民。;应用简化公式计算:; 2 n?40, 但有1? Tij 5时,需对上述公式进行校正。;(四) 与 r?系数(phi coefficient) ;1、适用资料 属于R×C列联表的资料,要分析所研究的二因素之间的相关程度,就要用列联相关。 2、计算公式
文档评论(0)