12《独立性检验基本思想及其初步应用》.docxVIP

12《独立性检验基本思想及其初步应用》.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 20 / 20 独立性检验的基本思想及其初步应用 基 础 梳 理 基 础 梳 理 分类变量的定义. 如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.2×2 列联表. 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x , 1 x }和{y ,y },其样本频数列联表(称为 2×2 列联表)为: 2 1 2 y1y2 y 1 y 2 总计 x x 1 2 总计 a c a+c b d b+d a+b c+d a+b+c+d 基 础 自 测, 基 础 自 测 下列变量中不属于分类变量的是(B) A.性别 B. 吸 烟 C.宗教信仰 D.国籍 解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选 B. 下面是一个 2×2 列联表 y1y2合计xx12 y 1 y 2 合计 x x 1 2 合计 a 2 b 21 25 46 73 27 100 A.94、96 B.52、50 C.52、54 D.54、52 解析:由 a+21=73,得 a=52,由 b+46=100,得 b=54. 3.某高校“统计初步”课程的教师随机调查了选修该课程的一 些学生情况,具体数据如下表: 为了判断主修统计专业是否与性别有关系,根据表中的数据,得 50×(13×20-10×7)2 到 K2= 23×27×20×30 ≈4.844>3.841,所以判定主修统计 专业与性别有关系,那么这种判断出错的可能性为 . 解析:P(K2>3.841)=0.05,判断出错的可能性为 5%. 答案:5% (一)重点 通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计. (二)难点 独立性检验的基本思想,随机变量 K2 的含义. (三)知识结构图 (三)思维总结 直观分析的两种方法. ①频率分析. 通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析. 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x , 1 x }和{y ,y },其样本频数列联表(称为 2×2 列联表)为: 2 1 2 x x 1 x 2 y 1 a c y 2 b d 总计 a+b c+d 总计 a+c b+d a+b+c+d y在列联表中,如果两个分类变量没有关系,则应该满足 ad- bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱; |ad-bc| 越大,说明两个分类变量之间的关系越强. y ②图形分析. 利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系. a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种 颜色,观察下方颜色区域的高度,如果两个高度相差比较明显 ? a c ? ?即 和 相差很大?,就判断两个分类变量之间有关系. ? a+b c+d ? 独立性检验及其基本思想. ①独立性检验. 利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 利用上诉公式求出 K2 的观测值为 n(ad-bc)2 k=(a+b)(c+d)(a+c)(b+d . ) 再得出 X 与 Y 有关系的程度,通常用到以下数据: 如果 k>6.635,在犯错误的概率不超过 0.01 的前提下认为 X 与 Y 有关系; 如果 k>2.706,在犯错误的概率不超过 0.1 的前提下认为 X 与 Y 有关系; 值得注意的是:观察值 k 越大,越有利于结论“X 和 Y 有关系”, 越小越有利于结论“X 和 Y 没有关系”.因此,可以建立一定的规 则:当 k≥k 0 时就说 X 与 Y 有关系,k<k 0 时就说 X 和 Y 没有关系, 故求得观测值后只要与建立的规则进行比较即可得出结论. ②独立性检验的基本思想. 独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量 K2 应该很小, 如果由观察数据计算得到 K2 的观测值 k 很大,则在一定程度上说明假设不合理,根据随机变量 K2 的含义,可以通过 P(k≥6.635)≈0.01 来评价假设不合理的程度,由实际计算出 k>6.635,说明假设不合理的程度约为 99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出: 独立性检验是对两个分类变量间是否有关系的一种案例分析方法

文档评论(0)

hao187 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体 武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档