- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总体均值假设检验
第十一章 单变量的推论统计 本章主要内容:概率分布与抽样分布、参数的区间估计方法、假设检验的原理与方法 第一节 推论统计的基础知识 一、概率与概率分布 二、正态分布 三、均值抽样分布 一、概率与概率分布 1.概率 是随机事件发生可能性大小的数量表示 2.概率的性质 (1)对于任何事件A,有 0≤P(A)≤1; (2)必然事件的概率为1,即 P(Ω)=1; (3)不可能事件的概率为0,即 P(ф)=0。 概率是一个介于0到1之间的数,用以描述一个事件发生的经常性。 3.概率的统计定义 在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一常数值p,那么就把p称为随机事件A的概率。记为P(A)。 此为统计概率(statistics probability),或者称后验概率(posterior probability)。 4.概率分布 是指随机变量的所有取值以及每一种取值对应的概率分布。 随机变量有如下特点: (1)取值的随机性,即事先不能确定取哪个值; (2)取值的统计规律性,即可确定某一可能取值的概率。 要了解随机变量X的统计规律,就必须知道它的一切可能取值Xi及每种可能值的概率Pi。 频率分布与概率分布的比较 ①频率分布是实验值,是可以变化的;而概率分布是理论值,是唯一的。 ②频率分布又称为随机变量的统计分布或经验分布;概率分布则称为随机变量的理论分布。 二、正态分布 正态分布的特征 1.正态分布密度曲线是单峰钟型曲线,它关于直线 x=μ对称,曲线在x=μ(均值)最高. 2.其曲线为一条渐近线,即曲线的左右延伸只是趋近于横轴,而不会与横轴相交。 3.服从该分布的变量的众值、中位值、均值三者重叠。 4.曲线在μ±σ处有拐点。 标准正态分布(standard normal distribution) 也称为Z分布。其均值μ=0,标准差σ=1。 Z的单位与标准差σ的长度相同,即可以把随机变量Z的值看成是偏离均值的标准差的倍数。 要计算Z值在某一范围的概率, 也就是计算相应范围内概率分布曲线下的面积。 标准正态分布记为N(0,1) 一般正态分布标准化 对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换,将其变换为服从标准正态分布的随机变量Z。 三、均值抽样分布 根据总体分布和样本大小的不同,可分以下三种情况来讨论样本均值的分布。 总体为正态分布N(μ,σ2),且方差σ2为已知; 总体为正态分布N(μ,σ2),但方差σ2未知; 任意总体,大样本情况 在此只学习大样本情况 任意总体,大样本情况 在社会研究中,总体情况往往是未知的 但由中心极限定理可得出:若总体平均数μ和方差σ2有限,当样本容量n充分大时,无论总体分布形式如何,样本均值近似服从正态分布N(μ,σ2/n) 在统计学中,大样本为n30,而在社会研究中一般要求n50. 当样本量n→∞ , 以及 的极限分布均为N(0,1) 第二节 参数估计 一、参数的点估计 点估计 就是以样本统计值来估计总体参数值,而不考虑抽样误差的一种方法; 点估计常用的方法有两种:矩估计法和最大似然估计法。在此不做介绍 点估计主要为许多定性研究提供一定的参考数据,或在对总体参数要求不精确时使用 二、参数的区间估计 区间估计的实质就是在一定的可信度下,用样本统计值的某个范围来估计总体的参数值。 当用一个数值区间去估计总体参数时, 一要由样本计算出点值; 二要给出估计的区间; 三要说明所给区间包含未知参数的概率(可靠程度)是多少。 区间估计的表述: 设?是待估的参数, ?为概率值。如果由样本确定的两个统计量?L和?U满足下式 P(?L ? ?U)= 1– ? 就称随机区间(?L ,?U)是?的置信区间; ?L和 ?U则为置信上限和置信下限; 1– ?为置信度; ?称为显著水平。 区间估计的概念 置信区间 用样本值估计参数值时,所确定的取值范围。 置信度 也称作置信概率或置信系数,它表示用置信区间估计未知参数的可靠性。用1-?表示。 显著性水平(significance level) 它表示用置信区间估计未知参数时不可靠(或出错)的概率。用?表示。 总体均值估计 当样本容量为大样本时,根据中心极限定理可知,抽样分布以正态分布为极限,此时可以不用考虑总体的分布形式。 总体均值区间估计公式: 第三节 假设检验 假设检验问题是推论统计中的另一种类型。它是由经验资料验证理论假设的一个重要环节。 假设检验是评估一个
文档评论(0)