- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.R语言卡方检验皮尔森拟合优度塔防检验。假设H0:总体具有某分布F 备择假设H1:总体不具有该分布。我们将数轴分成若干个区间,所抽取的样本会分布在这些区间中。在原假设成立的条件下,我们便知道每个区间包含样本的个数的期望值。用实际值Ni 与期望值Npi可以构造统计量K 。皮尔森证明,n趋向于无穷时,k收敛于m-1的塔防分布。m为我们分组的个数。有了这个分布,我们就可以做假设检验。#如果是均匀分布,则没有明显差异。这里组其实已经分好了,直接用。H0:人数服从均匀分布 x - c(210,312,170,85,223) n - sum(x); m - length(x) p - rep(1/m,m) K - sum((x-n*p)^2/(n*p)); K #计算出K值[1] 136.49 p - 1-pchisq(K,m-1); p #计算出p值[1] 0 #拒绝原假设。在R语言中chisq.test(),可以完成拟合优度检验。默认就是检验是否为均匀分布,如果是其他分布,需要自己分组,并在参数p中指出。上面题目的解法:chisq.test(x) Chi-squared test for given probabilitiesdata: xX-squared = 136.49, df = 4, p-value 2.2e-16 #同样拒绝原假设。例,用这个函数检验其他分布。抽取31名学生的成绩,检验是否为正态分布。 x - c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100) A - table(cut(x,breaks=c(0,69,79,89,100))) #对样本数据进行分组。 A (0,69] (69,79] (79,89] (89,100] 8 5 13 5 p - pnorm(c(70,80,90,100),mean(x),sd(x)) #获得理论分布的概率值 p - c(p[1],p[2]-p[1],p[3]-p[2],1-p[3]) chisq.test(A,p=p) Chi-squared test for given probabilitiesdata: AX-squared = 8.334, df = 3, p-value = 0.03959 #检验结果不是正态的。例:大麦杂交后关于芒性的比例应该是无芒:长芒:短芒=9:3:4 。我们的实际观测值是335:125:160 。请问观测值是否符合预期? p - c(9/16,3/16,4/16) x - c(335,125,160) chisq.test(x,p=p) Chi-squared test for given probabilitiesdata: xX-squared = 1.362, df = 2, p-value = 0.5061在分组的时候要注意,每组的频数要大于等于5.如果理论分布依赖于多个未知参数,只能先由样本得到参数的估计量。然后构造统计量K,此时K的自由度减少位置参数的数量个。2.R语言ks检验。R语言中提供了ks.test()函数,理论上可以检验任何分布。他既能够做单样本检验,也能做双样本检验。单样本例:记录一台设备无故障工作时常,并从小到大排序420 500 920 1380 1510 1650 1760 2100 2300 2350。问这些时间是否服从拉姆达=1/1500的指数分布? x - c(420,500,920,1380,1510,1650,1760,2100,2300,2350) ks.test(x,pexp,1/1500) One-sample Kolmogorov-Smirnov testdata: xD = 0.3015, p-value = 0.2654alternative hypothesis: two-sided双样本例:有两个分布,分别抽样了一些数据,问他们是否服从相同的分布。 X-scan()1: 0.61 0.29 0.06 0.59 -1.73 -0.74 0.51 -0.56 0.3910: 1.64 0.05 -0.06 0.64 -0.82 0.37 1.77 1.09 -1.2819: 2.36 1.31 1.05 -0.32 -0.40 1.06 -2.4726: Read 25 items Y-scan()1: 2.20 1.66 1.38 0.20 0.36 0.00 0.96 1.56 0.4410: 1.50 -0.30
文档评论(0)