第10章 参数估计精要.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章 参数估计精要

山东轻院皮革教研室 第 十 章 参数估计 (parameter estimation) §10.1 参数估计的一般问题 §10.2 一个总体参数的区间估计 §10.3 两个总体参数的区间估计 §10.4 样本容量的确定 学习目标 估计量与估计值的概念 点估计与区间估计的区别 评价估计量优良性的标准 一个总体参数的区间估计方法 两个总体参数的区间估计方法 样本容量的确定方法 参数估计在统计方法中的地位 统计推断的过程 二战中的点估计— 德军有多少辆坦克? 二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编号则是样本。 假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种估计N的公式的缺点是:不能保证均值的2倍一定大于记录中的最大编号。 二战中的点估计— 德军有多少辆坦克? N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是50,那么坦克总数的一个估计是(1+1/10)?50=55。此处我们认为坦克的实际数略大于最大编号。 从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮! 估计量与估计值 估计量与估计值 (estimator estimated value) 估计量(estimator) :用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值? 的一个估计量 参数用? 表示,估计量用 表示 估计值(estimated value) :估计参数时计算出来的统计量的具体值 如果样本均值 ?x =80,则80就是?的估计值 点估计 参数估计的方法 点估计 (point estimation) 用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均值之差的估计 2. 没有给出估计值接近总体参数程度的信息 点估计的方法有矩估计法、顺序统计量法、极大似然法、最小二乘法等 评价估计量的标准 无偏性 (unbiasedness) 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 有效性 (efficiency) 一致性 (consistency) 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数 区间估计(interval estimation) 研究者想知道电池的使用寿命,抽样了若干个电池,发现寿命的平均数为50小时。如果对所有的电池寿命进行普查,总体的均值会介于哪段区间?研究者关心初生男婴体重的方差,随机抽样若干个初生男婴,得体重的方差为40kg2,如果普查的话,总体的方差会介于哪段区间内?以上这些研究问题,都在探讨总体某个参数,如均值、方差到底介于哪段区间内,这就是所谓的区间估计。 区间估计 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减边际误差(margin of error)(抽样极限误差、误差范围)而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示 置信水平 (confidence level) 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - ???? ??为是总体参数未在区间内的比例? 常用的置信水平值有 99%, 95%, 90% 相应的 ??为0.01,0.05,0.10 置信区间 (confidence interval) 由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档