- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从样本统计量估计整体参数.ppt
第六章 从样本统计量估计 总体参数 第一节 点估计 第二节 区间估计 一、样本平均数的抽样分布 二、总体平均数的区间估计 小 结 正如总体平均数的估计那样,要确定达到一定估计精确度的样本容量,往往要先抽取一个样本,计算出样本比例p。为了省去这个麻烦,统计学家们提出了一个粗略的计算样本容量的方法。 总体比例p的取值范围只能在0和1之间, 那么p(1-p) 就不可能大于0.25。所以,我们可以在任何情况下都用p(1-p)=0.25(即把0.25作为一个常数)。 从样本统计量估计或推断总体参数是推断统计的一个重要部分。 我们在引入 “样本” 和 “总体 ” 这两个概念时看到, 语言研究所涉及的总体往往非常大 (甚至是无限大的) , 因而难以对其中所有个体都加以研究,研究者们所能做的只是通过随机的方法从总体中抽取一个具有代表性的样本加以研究,然后再从有关样本统计量来估计或推断未知的总休参数,例如从样本平均数来估计总体平均数。本章只讨论如何从样本平均数X和比 分别估计总体平均数 μ 和比 。估计的方法有两种: 点估计与区间估计。 第一节 点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 一个理想的点估计值至少应具备以下两个条件: (1)无偏性 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 因而样本平均数是一个无偏点估计值(在第四章里,我们在讨论样本方差和标准差时曾经指出,公式中要用N-1 (而不能用N) 做分母, 就是要保证方差和标准差具有无偏性, 因为用N做分母时,样本方差一般要小于总休的方差) 。 (2)一致性。 样本容量越大,根据样本计算出的估计值越接近总体参数的真值。作为总休平均数的估计值,样本平均数就具有一致性。 第二节 区间估计 即便是一个理想的点估计值,也无法克服点估计的一个致命缺陷,那就是它易受样本变化的影响:每次抽取的样本不同,得出的统计量也就不同,因而它所提供的参数估计值也就会不同。如果能把抽样所带来的这种变异性或不确定性考虑进去,对总体参数的估计将会更有意义简而言之,区间估计就是为总体参数计算出一个可能的取值范围或值域,然后指出总体参数处在该值域的可能性有多大。 一、样本平均数的抽样分布 假如有一个变量的总体(至于何种总体无关紧要),我们从中随机抽取取一个含有若干个观测值的样本(记作 S1),计算出样本平均数(记作X1),然后把所抽取的观测值再放回总体。按照此法,再抽取样本S2,得样本平均数X2 ,等等。 从理论上讲, 我们可以无限次地重复这一过程, 抽取n 个样本, 计算出 n个样本平均数。正如我们可以为观测值绘制分布图那样,我们也可以为这些样本平均数绘制分布图(为了便于理解,不妨把这些平均数看作观测值),这个分布就叫做平均数的抽样分布。 1.(渐近) 正态分布 平均数的抽样分布的形态取决于总体的分布和总体方差是否已知,以及样本容量的大小:当总体的分布为正态,总体方差 已知时,样本平均数的分布为正态分布;当总体的分布为非正态,总体方差 已知时,如果样本较大,则样本平均数的分布接近正态分布,其样本越大,总体偏 接近的程度取决于样本容量以及总体的偏斜程度斜程度越轻, 两者就越接近。 这一现象叫做 “中心极限定理” 。 当样本平均数的分布为正态或渐近正态时,分布的平均数与总体平均数相等,而分布的离散程度则小于总休的离散程度。如果横轴上的测量单位相同,那么总体的分布形态较为平阔,而样本平均数的分布则较为尖狭。不过,如前所述,一个呈正态分布的变量可以通过求标准分的方法,转换为标准正态变量 (见第五章) ,我们也可以用此方法把每个样本平均数转换为标准分,进而把正态的样本平均数的抽样分布转换为标准正态分布,公式为 样本平均数分布的离散程度是用样本平均数的抽样分布的标准差来表示的。为了与样本标准差区别开来,抽样分布的标准差习惯上称作“标准误” ,用符号SE表示。 标准误与样本容量 (N)以及总体的标准差
文档评论(0)