第二章 单样本问题.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 单样本问题

第二章 单 样 本 问 题 我们开始系统地学习非参数统计方法。首先从最简单的,也是最基础的单样本情况着手研究。即我们的第二章,单样本问题,对应与课本上的第三章和第四章,另外还有补充的内容。 本章主要内容: 1.符号检验 2.Wilcoxon符号秩检验(单一样本或两配对样本) 3.Cox-Stuart趋势检验 4.关于随机性的游程检验 具体介绍: 本章主要内容分四部分,首先开始学习最经典的非参数方法——符号检验。这一部分主要是关于中位数和分位数的检验问题和置信区间,中位数实际是1/2分位数,我们把它们分开讲,主要是希望可以先了解简单的中位数的情况,再过渡到一般的分位数情况,而且中位数的检验也是比较独立感兴趣的部分,例如:“人均收入”,“平均房价”;研究分位数的实例,比如:研究北京市市民的收入为多少才算是“最富的20%”范围等等。 第二部分内容是Wilcoxon符号秩检验,对象是单一样本或两配对样本,我们学过成对样本的检验(正态的t检验),当时是将两成对样本作差,观察它们的差值,将其视为新的样本,所以两配对样本实际上就是单一样本。Wilcoxon符号秩检验主要是检验总体中位数,它是符号检验的改进,引入秩,从而比符号检验利用了更多的样本信息。但Wilcoxon符号秩检验要求总体服从对称分布,在此条件不易满足的情况下,符号检验还是有效些! 第三部分是Cox-Stuart趋势检验,即我们希望通过对数据的分析,判断其对应的实际问题有没有增长或减少的趋势。例如,人口有无增长趋势,机场的旅客吞吐量有无增长或降低的趋势,通过病患人数判断疫情是否得到控制,或者还在进一步的发展等等。这是对回归分析的一个补充。 最后一个部分是随机性的游程检验。也就是数据的随机性检验,例如,通过编程,可以让计算机随机生成数据,但生成的数据是不是随机的呢?我们可以通过随机游程检验来判断。 这些分位数检验,数据的发展趋势检验,数据的随机性检验,都没有简单的参数方法与之对应,所以在这些情况下,非参数方法是有绝对优势的! 第一节 符号检验 符号检验(sign test)是非参数统计中最古老的检验法。最早可追溯到Arbuthnot于1710年一项有关伦敦出生的男婴性别比是否超过1/2。这个报告可能是第一个公开出版的非参数检验的报告,它考察了伦敦82年来每年的出生记录,并比较了每年出生的男性和女性的数目,将记录的数目用于假设检验,在本课程中我们会介绍这个结果。 符号检验虽然是简单的非参数方法,但是最经典的非参数统计,体现了非参数统计的基本思想。 符号检验主要包括两个问题: (1)中位数的符号检验; (2)分位数的符号检验。 这实际上是一个问题,即分位数检验。刚才说过,把中位数单独拿出来讲有其独立的意义。 提问:我们为什么不是检验均值呢? 这是因为:均值和中位数都可以表示数据的中心位置,在参数统计中,总体的中心位置常用总体的均值表示,所以检验中心位置就是检验均值,例如正态的;而在非参数统计中,总体的中心位置常用总体中位数表示,也就是检验总体中心位置就是检验其中位数。 关于这点,可以这样理解:均值和中位数相比,第一,均值不一定存在,但中位数一定存在,且可能不唯一。参数统计中,一般假设总体是正态的,其均值一定存在!而在非参数统计中,分布未知,均值是否存在也未知。第二,在总体分布对称,且均值存在的条件下,均值和中位数是相等的。在参数统计,且假设总体服从正态分布时,因正态分布对称,所以检验其均值即相当于检验其中位数! 关于均值和中位数的进一步的知识,可参见课本P13-P15。 先看一个例子,即课本P28例3.1。 例2.1 某市劳动和社会保障部门的资料说明,1998年高级技师的年收入的中位数为21700元。该市某个行业有一个由50名高级技师组成的样本。这些高级技师的年收入如下:略 经计算,这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700。那么,在总体中该行业高级技师的年收入的中位数是否比全市高级技师的年收入的中位数高? 显然,这个假设检验问题的原假设和备择假设分别为: , 符号检验操作很简单。将每一个样本数据与21700相比较,然后计算有多少个样本数据比21700大,本例有32个样本数据大于21700。 一般来说,在原假设下,即中位数为21700时,比21700大和比21700小的样本数据应该差不多是一样的,但现在比21700大的样本多于比21700小的样本,这就说明总体中该行业高级技师的年收入的中位数要大于21700。 (一)中位数的符号检验问题的一般提法如下: 设样本独立同分布,总体为。符号检验对于总体的

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档