- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了6578个成年人,其中吸烟者1988人,不吸烟者4590人,调查结果是:吸烟的人中56人患病, 不吸烟的人中23人患病。 根据这些数据能否断定:患肺癌与 吸烟有关吗? 6578 6499 79 总计 4590 4567 23 不吸烟 1988 1932 56 吸烟 总计 不患病 患肺病 为了研究这个问题,我们将上述问题用下表表示: 2×2列联表 患肺病在不吸烟者中的比重是 患肺病在吸烟者中的比重是 0.50% 2.82% 上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢? 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 1、列联表 2、三维柱形图 3、二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 直观判断 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 4、等高条形图 a+b+c+d b+d a+c 总计 c+d d c 不吸烟 a+b b a 吸烟 总计 不患病 患病 列出2×2列联表 假设H0:吸烟和患病之间没有关系 即H0:P(AB)=P(A)P(B) 其中A为某人吸烟,B为某人患病 设n=a+b+c+d 则P(A) P(B) 故P(AB) 吸烟且患病人数 吸烟但未患病人数 不吸烟但患病人数 不吸烟且未患病人数 怎样描述实际观测值与估计值的差异呢? 统计学中采用 即 独立性检验 第一步:H0: 吸烟和患病之间没有关系 通过数据和图表分析,得到结论是:吸烟与患病有关 结论的可靠程度如何? a+b+c+d b+d a+c 总计 c+d d c 不吸烟 a+b b a 吸烟 总计 不患病 患病 第二步:列出2×2列联表 用χ2统计量研究这类问题的方法 步骤 第三步:引入一个随机变量:卡方统计量 第四步:查对临界值表,作出判断。 10.828 7.879 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.455 x0 0.001 0.005 0.010 0.025 0.05 0.10 0.15 0.25 0.40 0.50 P(χ≥x0) 独立性检验基本的思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量 K2 应该很能小,如果由观测数据计算得到K2的值很大,则在一定程度上说明假设不合理. (3)根据随机变量K2的含义, 可以通过K2值的大小来 评价该假设不合理的程度。K2小,观测值与预期值接近,假设合理程度高,反之,K2的值很大,则在一定程度上说明假设不合理. 1%把握认 为A与B无关 5%把握认为A与B无关 99%把握认 为A与B有关 95%把握认 为A与B有关 90%把握认 为A与B有关 10%把握认为 A与B无关 没有充分的证据判定A与B有关联,可以认为A与B没有关联的 例如 独立性检验 通过公式计算 H0: 吸烟和患病之间没有关系 解: 6578 6499 79 总计 4590 4567 23 不吸烟 1988 1932 56 吸烟 总计 不患病 患病 已知在 成立的情况下, 故有99.9%的把握认为H0不成立,即有99.9%的把握认为“患病与吸烟有关系”。 即在 成立的情况下, 大于10.828概率非常小,近似为0.001 现在的 =62.698的观测值远大于10.828,出现这样的观测值的概率不超过0.001。 *
文档评论(0)