第十四讲统计班孙铭远翻译.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十四讲统计班孙铭远翻译

第十四讲平移参数的Wilcoxon的置信区间针对两组总体,我们已经讨论了两组基于秩的检验。配对数据的Wilcoxon符号秩检验独立数据的Wilcoxon秩和检验本章中内容是估计两组数据位置差的置信区间,在两组总体中,可能会出现中位数差异(正如符号秩检验)或仅出现一般的“位置平移”,在任意一个情况下,我们使用符号“△”表示平移参数。14.1回顾 两组不同总体均值差的置信区间让我们简单回顾参数分析中,比较两组样本均值μ1 μ2时使用的t检验。若我们拒绝原假设H0: μ1 – μ2 = 0,我们的结论就是一个样本与另外一个样本的区别明显(高于或低于),那我们自然就会提出一个问题,它们究竟相差多少?我们通常求得μ1 – μ2的置信区间来回答这个问题,置信区间给定了一个范围,在这个范围中我们可以确保存在组间均值差。(想了解更多细节实例,请翻阅3.8)顺着这种思路,我们思考在非参数条件的情况。如你所望,处理方式多种多样(包括一个更为先进的技术,我们将在之后的学习中涉及到)但现在我将介绍一个经常使用的传统方法14.2独立样本时△的置信区间接下来我们将研究独立样本中Wilcoxon秩和检验的置信区间,先介绍它的原因是我们对Wilcoxon秩和检验更熟悉。让我们已饮食习惯数据为例(我保证最后一次)再上一章中运行Wilcoxon秩和检验,我们有充分理由认定A习惯下实际增长速度大于B,下面我们来复习一下操作步骤 wilcox.exact(A, B, paired=FALSE, alternative=greater)Exact Wilcoxon rank sum testdata: A and BW = 56, p-value = 0.02154alternative hypothesis: true mu is greater than 0现在的问题是:A饮食习惯增加的生长速度究竟有多高?首先,我们不要在意均值差(因为Wilcoxon秩和检验不比较均值),而是关注位置的差异,两组饮食习惯AB数据分布的差异记为平移参数,我们记做△,有些人认为△是两组数据分布中位数的差异,但从技术上考虑这并不是△的定义,我们的目的是为了估计△并求得的其置信区间Hodges-Lehmann估计,Hodges-Lehmann估计是△的非参数点估计量,作为检验均值差的备选估计量。对于独立样本,Hodges-Lehmann式所有可能的Xi-Yi形式差值的中位数,其中Xi是首个样本的任意值,其中Yi是第二个个样本的任意值。下面是计算△的例子。例:研究以下来自两个不同群组的相互独立样本这个例子中,m=4,n=3,为估计△,我们建立一个4×3的直线坐标系,其包含所有可能组合,如下所示,括号内即为样本值:△是12组差的中位数,R中点估计△的过程可以使用以下代码表示 x - c(14,22,31,16) y - c(23,19,19) diffs - as.vector(outer(x, y, -)) diffs[1] -9 -1 8 -7 -5 3 12 -3 -5 3 12 -3 median(diffs)[1] -2经计算,从X到Y的总体平移为-2△的置信区间首先,将上例中的差值进行排列 sort(diffs)[1] -9 -7 -5 -5 -3 -3 -1 3 3 8 12 12将排列值记为 D(1),D(2),…,D(12),同第7章表示中位数置信区间的方式类似,△的置信区间表示形式如下(D(k),D(mn+1-k))M为第一个样本的长度,n为第二个样本的长度,k记为kth,我们所做的(与前文类似)从每个排列好的差值两端计算K值,以求得置信区间,置信登机并非由二项分布决定的,我们无须考虑繁杂的数据来源。以下给出R中计算△的运行代码conf.level - 0.95m - length(x)n - length(y)diffs - sort(as.vector(outer(x, y, -)))mn - length(diffs)alpha - 1 - conf.levelk - qwilcox(alpha/2, m, n)if (k == 0) k - k+1kcat(Achieved confidence level:, 1 - 2*pwilcox(k-1, m, n), \n)c(diffs[k], diffs[mn+1-k])将其运行于饮食习惯数据例:饮食习惯比较(真的最后最后一次了!)求两组饮食习惯生长水平位置差异95%置信水平下的置信区间解: A - c(156,183,120,113,138,145,142) B - c(109,107,119,162,121,123,76,111,130,115) conf.level - 0.95 m - length(A)

文档评论(0)

ipad0e + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档