第三讲抽样误差与区间估计.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一页,共二十八页,2022年,8月28日 第一节 均数的抽样误差与标准误 抽样误差( sampling error ):由个体变异产生的、抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数的差异。 无倾向性、不可避免 第二页,共二十八页,2022年,8月28日 100份样本的均数和标准差 第三页,共二十八页,2022年,8月28日 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图3-1。 图3-1 随机抽样所得100个样本均数的分布 第四页,共二十八页,2022年,8月28日 100个样本均数的抽样分布特点: ①μ=4.83≠ ②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。 ③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。 ④样本均数的标准差明显变小: 第五页,共二十八页,2022年,8月28日 即样本均数的标准差,可用于衡量抽样误差的大小。 因通常σ未知,计算标准误采用下式: 标准误(standard error, SE) 通过增加样本含量n来降低抽样误差。 第六页,共二十八页,2022年,8月28日 3个抽样实验结果图示 第七页,共二十八页,2022年,8月28日 抽样实验小结 均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n) 。 第八页,共二十八页,2022年,8月28日 标准差与标准误的区别与联系 1、概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小; 标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。 2、用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误用于表示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。 第九页,共二十八页,2022年,8月28日 3、与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0; 4、二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。 第十页,共二十八页,2022年,8月28日 第二节 t 分布(t-distribution) 随机变量X N(m,s2) 标准正态分布 N(0,12) Z变换 均数 标准正态分布 N(0,12) Student t分布 自由度:n-1 第十一页,共二十八页,2022年,8月28日 t分布的特征 ①以0为中心,左右对称的单峰分布; ②t 分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t 值越分散,曲线越低平; 自由度逐渐增大时,t 分布逐渐逼近Z 分布(标准正态分布);当趋于∞时,t 分布趋近Z 分布, Z 分布是t 分布的特例。 第十二页,共二十八页,2022年,8月28日 图4-2 不同自由度下的t 分布图 第十三页,共二十八页,2022年,8月28日 t 界值表 1.812 2.228 -2.228 t f (t) ν=10的t分布图 t0.05/2,10=t0.025,10=2.228 第十四页,共二十八页,2022年,8月28日 t界值表中的变化规律 相同自由度时,∣t∣值越大,概率P 越小; 在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两倍,t0.05/2,10=t0.025,10 。 第十五页,共二十八页,2022年,8月28日 参数估计:用样本指标值(统计量)推断总体指标值(参数)。 包括点估计和区间估计 第三节 总体均数的可信区间估计 第十六页,共二十八页,2022年,8月28日 总体均数的点估计(point estimation)与区间估计(interval estimation) 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 按预先给定的概率(1??),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) 第十七页,共二十八

文档评论(0)

xiaoyao2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档