- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十九章 二项分布 A基本概念 二项分布的来源 二项分布的正态近似 比率z检验 本书前面的章节主要介绍了参数统计的方法,如果变量为等距或等比数据,且数据分布服从正态分布(或t分布等),那么我们可以采用参数统计方法进行分析。 如果所有数据都是称名或者顺序数据,或者等距/等比数据不满足参数统计的分布假设,就需要采用非参数统计方法。 比如,期末考试6道判断题,一个学生她答对多少道题才算她考试通过呢? 对于这样的问题,即使这个学生完全不会,那她也很可能蒙对3道题,那她蒙对4道、5道、6道的概率是多少呢? 根据概率的乘法原则,几个独立事件同时出现的概率等于这些事件发生概率之积。 这样做对X道题的概率为 这个公式代表的分布称为二项分布。 当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的一个且是唯一一个时(男女、对错等),就可能产生一个二项分布,也成为伯努利分布;这样的事件被称为二分事件。 对应的两个类别的概率通常用P和Q表示,P+Q 1. 扔硬币就是一个典型的二分事件,P Q 0.5,随着试验次数(扔的次数)N增加,二分事件所对应的发生概率P和Q不会变化。 通常把第一类别(概率P的时间)的实验次数称为X,即二项分布的变量。 上面的问题中,P Q,做对X道判断题的概率分布如下图所示。 随着试验的总次数N增加,二项分布越来越接近正态分布。 如果考试题目为单选题(三选一),P不等于Q,则二项分布不对称。 即使P不等于Q,但只要N足够大,二项分布也越来越对称,越来越接近正态分布。 N足够大的标准: 如果P 0.5,当N大于25时,二项分布近似于正态分布; 如果P不接近0.5时,NPQ最少是9时才可将二项分布近似为正态分布。 总之,对于二分事件,只要N足够大,二项分布就接近于一个均值为NP,标准差为 的正态分布。 如果期末考试题为判断题,总题数50,该同学做对多少道才算她通过呢? 一般来说,只要她做的题目数大于一半,且概率足够小( 0.05),那么我们就可以认为她不是蒙的,可以通过。 既然当N足够大时,该分布服从正态分布,那么我们可以通过Z临界计算需要答对的题数。 显著水平0.05下,单侧Z临界为1.65。 当学生答对的题目数大于等于31题时,可让其通过。 B基本统计过程 符号检验过程 符号检验的前提假设 赌徒谬误 二项分布的一个重要应用是,比较不容易定量的两个刺激。 比如设计一个实验来检验面孔知觉偏好是不是天生的,选择30个婴儿,同时给他们呈现一张面孔图片和一张彩球图片,看婴儿是不是更关注面孔图片。结果发现有20个婴儿看面孔更多一点。 如果记录下了每个婴儿关注两张图片的时间,也就是差异可以量化,那么可以采用配对t检验来检验这个差异。 如果当时具体的时间没有记录下来,只记录了每个婴儿看哪张图片更多一些,那么可以采用符号检验来比较。 符号检验属于非参数检验,但可采用参数检验所使用的六步方法: 提出假设 选择统计检验和显著水平 选择样本和收集数据 求拒绝区域 计算检验统计量 做出统计推断 提出假设: 零假设:婴儿关注面孔和彩球一样多,P 0.5;备择假设:婴儿对面孔和彩球关注不同P 0.5或P 0.5 选择统计检验和显著水平: 每个婴儿关注面孔和彩球的具体时间没有被记录下来,所以适合的检验是符号检验,显著水平选择0.05双侧. 选择样本收集数据: 二分事件,第一类别为关注面孔更多的事件,总数用X表示,则X 20 求拒绝区域: 由于N 30较大,二项分布近似于正态分布,在显著水平双侧0.05下,拒绝区域为大于1.96或者小于-1.96. 计算检验统计量 对于正态分布曲线是光滑和连续的,而二项分布却是离散和阶梯状的。 对于二项分布而言,取某个值X的概率等于X-1到X之间长方形的面积;而对正态分布而言,X对应的概率是从X-0.5到X+0.5之间的面积。 这个差异需要进行连续性校正,当N 100时可不做连续性校正。 做出统计推断 Z分数落在拒绝区域外,接受零假设,即婴儿对面孔没有注意偏好。 符号检验的前提假设: 二分事件:每个简单事件或者试验只属于两个分类中的一个或另一个,而不会同时在两个分类或第三个分类中,P+Q 1; 独立事件:实验中的每次试验互不干扰; 固定过程:P和Q在实验的每轮试验中保持不变; 正态近似:如果N不够大,需要查符号检验对应的表格,不能用正态逼近; 任意分布检验:因变量分布可不是正态分布。 在二分事件中,最常见的就是赌徒谬误,即认为事件的概率会在一串某一分类的结果接连出现后改变来弥补损失——以保证分类间的平衡。 比如,我们知道扔硬币很多次,正面朝上的次数和背面朝上的次数将接近相等,所以当连续几次都是正面朝上时,我们会觉得下次背面朝上的概率会变大
有哪些信誉好的足球投注网站
文档评论(0)