抽样误差与参数估计.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

抽样误差与参数估计南方医科大学生物统计系谭旭辉

抽样误差与标准误Samplingerrorandstandarderror

populationsamplesamplinginferring统计学的分析思路

抽样实验例7-1:某地区正常成年男子的红细胞计数服从正态分布N(5.00,0.502)(1012/L),随机抽取100份样本,每份样本含有10个个体。

样本101样本202样本9903样本304样本10005

正常男子红细胞计数抽样实验结果No红细胞计数s123…991005.595.494.56…4.824.085.115.564.87…5.304.734.265.475.21…5.194.84………………5.045.194.71…5.304.660.440.420.33…0.390.46

抽样误差通过对研究总体中随机抽取部分有代表性的样本,用统计量(样本均数)来推断总体参数。由于抽样的随机性而造成样本统计量(样本均数)与总体参数(总体均数)间的差别,称为均数的抽样误差。

从总体N(5.00,0.502)中抽样实验结果

n=30n=10

各样本均数未必等于总体均数添加标题样本均数的分布也是正态分布添加标题样本均数的变异范围较原变量的变异范围大大缩小添加标题各样本均数之间也存在差异添加标题

样本均数的标准误统计上,将统计量(如样本均数、样本率等)的标准差称为标准误,用以衡量抽样误差的大小n固定时,标准差越大,标准误越大标准差固定时,n越大,标准误越小实际工作中,总体标准差常未知

例7-2:已知某样本=5.03,s=0.52,n=10,试计算标准误。实际工作中,只能根据一份样本计算出一个标准误说明抽样误差的大小,即估计μ的可靠程度

例7-3:2003年,在某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。反映了本次调查身高均数171.2cm的抽样误差大小(估计值)

样本均数的分布新分布可用样本均数的均数和均数的标准差来描述其特征,其理论值分别为原分布为正态分布,则新分布也为正态分布,如原分布为非正态分布,当n足够大时(如n≥60),新分布也近似正态分布

t分布(t-distribution,studentdistribution,Gosset,1908)

?=∞,标准正态分布?=1?=5

t分布特征单峰分布,以t=0为中点,两侧对称;样本(自由度)越小,t分布曲线峰值越低,t值越分散;随着自由度的增大,t分布接近于标准正态分布,当ν→∞时,t分布的极限分布是标准正态分布。

图中阴影部分表示tα/2,ν以外尾部面积占总面积的百分比P同一ν时,t与P呈反向关系当ν=∞时,tα/2,∞=uα/2当ν相同时,单侧P与双侧2P对应相同的t界值,如t0.05,ν=t0.10/2,ν

可(置)信区间Confidenceinterval,CI

StatisticalinferenceParameterestimationHypothesistestingIntervalestimationPointestimation

点估计(pointestimation):就是用样本指标直接地估计总体指标。总体均数总体率即样本均数和样本率分别是总体均数和总体率的估计值。

标准误的估计值样本统计量区间估计(confidenceintervalestimation)指用和确定一个具有较大置信度的包含总体参数的区间,该区间包含总体均数的概率为1-α,称为总体均数的1-α可信区间。1-α一般取0.95或0.99。

或总体均数的可信区间未知时,按t分布的原理的概率之和为α

已知时,或未知但n足够大n足够大,用样本标准差S来估计σ

例7-4:已知某样本的,s=0.52,n=10,试计算该总体正常成年男子平均红细胞计数的95%可信区间。解:v=9,α=0.05(双侧),查t界值表,得

例7-5:试估计2003年当地20岁应征男青年身高总体均数的95%可信区间。解:n=85,大样本时用代替

可信区间的解释从总体中做随机抽样,据每个样本可算得一个可信区间,如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个包括μ,只有5个不包括。实际工作中,为估计总体均数,我们只做一次抽样,只算得一个可信区间,用以估计μ的范围,理论上有95%的可能是正确的(1-α),只有5%的可能发生错误。

可信区间两个要素准确度:反映可信度(1-α)的大小。1-α越接近1,越准确如可信度99%比95%准确精确度:反映区间范围宽窄。范围越窄越好95%

文档评论(0)

SYWL2019 + 关注
官方认证
文档贡献者

权威、专业、丰富

认证主体四川尚阅网络信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6716HC2Y

1亿VIP精品文档

相关文档