独立性检验 课件- 高二下学期数学人教A版(2019))选择性必修第三册.pptx

独立性检验 课件- 高二下学期数学人教A版(2019))选择性必修第三册.pptx

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

温故知新:;8.3列联表与独立性检验;前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率的稳定性推断两个分类变量之间是否有关联.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.

设X和Y为定义在以Ω为样本空间上,且取值于{0,1}的成对分类变量,则判断事件{X=1}和{Y=1}之间是否有关联,主要是看以下假定关系是否成立.;由条件概率的定义可知,零假设H0等价于;由于下列四条性质彼此等价:;思考:如何基于②中的四个等式及下列2×2列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断?;一般来说,若频数的期望值较大,则差的绝对值也会较大;而若频数的期望值较小,则相应的差的绝对值也会较小.为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:;随机变量χ2取值的大小可作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.那么,究竟χ2大到什么程度,可以推断H0不成立呢?或者说,怎样确定判断χ2大小的标准呢?

小概率值α的临界值:

忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准,概率值α越小,临界值xα越大.

由P(χ2≥xα)=α可知,只要把概率值α取得充分小,在假设H0成立的情况下,事件{χ2≥xα}是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断H0不成立.;基于小概率值α的检验规则是:

当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;

当χ2xα时,我们没有充分证据推断H0不成立,此时H0成立,可认为X和Y独立

这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.

??表给出了χ2独立性检验中几个常用的小概率值和相应的临界值.;解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.根据表中的数据,计算得到:;思考:例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?;零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.由已知数据列出列联表.;对犯错误概率的解释:

在零假设H0成立的前提下,随着小概率值α的逐渐减小,χ2统计量对应的临界值xα逐渐增大,则事件{χ2≥xα}越来越不容易发生,零假设越来越不容易被拒绝;随着小概率值α的逐渐增大,χ2统计量对应的临界值xα逐渐减小,则事件{χ2≥xα}越来越容易发生,零假设越来越容易被拒绝.

例如,对于例3中的数据,经计算得χ2≈4.881.

(1)当小概率值α=0.005时,x0.005=7.879,此时χ2≈4.8817.879,则没有充分理由拒绝零假设.因此可以接受H0,即认为两种疗法的效果没有差异.

(2)当小概率值α=0.05时,x0.05=3.841,此时χ2≈4.8813.841,则拒绝零假设,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05.

(3)当小概率值α=0.1时,x0.05=2.706,此时χ2≈4.8812.706,则拒绝零假设,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.1.;观察:在例3的2×2列联表中,若对调两种疗法的位置或对调两种疗效的位置,则卡方计算公式中a,b,c,d的赋值都会相应地改变.这样做会影响χ2取值的计算结果吗?;(1)用样本估计总体思想估计该中学一年级学生的近视率;

(2)能否在犯错误的概率不超过0.01的前提下认为不足够的户外暴露时间与近视有关系?;(2)由卡方计算公式,可得;能否在犯错误的概率不超过0.001的前提下认为不足够的户外暴露时间与近视有关系?;零假设为H0:吸烟与患肺癌之间无关联,由表中数据可得;吸烟;应用独立性检验解决实际问题大致应包括以下几个主要环节:

(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.

(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.

(3)根据检验规则得出推断结论.

(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.

注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变量的抽样数据列联表是

您可能关注的文档

文档评论(0)

159****6867 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档