计量经济学第4章统计推断:估计与假设检验.doc

计量经济学第4章统计推断:估计与假设检验.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量经济学第4章统计推断:估计与假设检验

PAGE  PAGE 11 统计推断:估计与假设检验 4.1 统计推断的含义 总体和样本 总体是指我们所关注现象出现的可能结果的全体,样本是总体的一个子集(例如,杭州的人口;下沙开发区的人口)。 宽泛地说,统计推断研究的是总体与来自总体的样本之间的关系。 国内股票交易市场共有1500多支股票。假定某一天从中随机选取50支,并计算这50支股票价格与收入比的平均值—即P/E比值。(例如,一支股票的价格为50元,估计年收益为2.5美元,则P/E为20;也就是说,股票以20倍的年收益出售。) 根据50支股票的平均P/E值,能否说这个P/E值就是总体的1000多股票的平均P/E值呢? 如果令X表示一支股票的P/E值,表示50支股票的平均P/E值,能否得知总体的均值E(X)呢?此处统计推断的实质就是从样本值均值()归纳出总体值E(X)的过程。 4.2 参数估计 通常假定某一随机变量X服从某种概率???度,但并不知道其分布的参数值。例如,X服从正态分布,想知道其两个参数,均值E(X)=uX,及方差。 为了估计未知参数,一般的步骤是: 假定有来自某一总体,样本容量为n的随机样本,根据样本估计总体的未知参数。因此,可将样本均值作为总体均值(或期望)的估计量,样本方差作为总体方差的估计量。 这个过程称为估计问题,估计问题有两类: 点估计(point estimation)和区间估计(interval estimation)。 假定随机变量X(P/E值)服从某一未知均值和方差的正态分布。但是,有来自该正态总体的一个随机样本(50个股票的P/E值),如何根据这些样本数据计算总体的均值uX (=E(X))和方差? 表4 - 1 点估计 据表4 - 1的数据 50个P/E的样本均值为11.5,显然我们可以选择 作为uX的估计值。我们称这个单一数值为uX的点估计值。 (注意:点估计量是一个随机变量,因为其值随样本的不同而不同。) 某一特殊的估计值(比如11.5)的可信度有多大呢?虽然可能是总体均值的“最好的”估计值,但是某个区间,比如8~10,更可能包括了总体均值。这正是区间估计的基本思想。 区间估计 区间估计的主要思想源于估计量的概率分布的概念。如果随机变量X~N(uX,),则(回忆第三章中心极限定理): ~ N(uX,) 或, 即样本均值的抽样分布也服从正态分布。 如前所述,通常未知,可用其估计量代替,则: 服从自由度为(n-1)的t分布。 在P/E一例中,共有50个样本观察值,因此自由度为49。查附录中的t分布表可得: P(-2.0096≤t≤2.0096)=0.95 也即区间(-2.0096,2.0096)包括t值的概率为95%。-2.0096和2.0096称为临界t值,表明了在临界值区间内,位于t分布曲线下区域的比例。 把代到P(-2.0096≤t≤2.0096)=0.95中,得到: P(-2.0096≤≤2.0096)=0.95 整理得: 上式为真实的uX一个区间估计量。 10.63≤uX≤12.36(近似值) 即为uX的95%的置信区间。 一般地,称 为未知的总体均值uX的一个95%的置信区间。0.95称为置信系数。上式表示随机区间()包括真实的uX概率为0.95。()称为区间的下限(lower limit),()称为区间的上限(upper limit)。 特别强调: 给出的区间是随机的区间,因为它依赖于和的取值,而和的值随样本的不同而变化。虽然总体均值uX是未知的,但是它取某一固定值,因而它是非随机的。简言之,区间是随机的,而参数uX不是随机的。 也可以理解为,如果建立类似上式这样的置信区间100次,将有95次的区间包括真实的uX。 4.3 点估计量的性质 在P/E一例中,用样本均值作为uX的点计量,同时还得到了uX的区间估计量。但除了样本均值以外,样本中位数同样可用作uX的点估计量,为什么要选择样本均值为uX的估计量呢? 在实践中,样本均值是度量总体均值最广泛使用的统计量,因为它满足了下面的一些统计性质: (1) 线性(linearity) (2) 无偏性(unbiasedness) (3) 有效性(efficiency) (4) 最优线性无偏估计量(BLUE) (5) 一致性(consistency) 4.4.1 线性 若估计量是样本观察值的线性函数,则称该估计量是线性估计量。 4.3.2 无偏性 如果重复使用某种方法,得到的估计量的均值与真实参数值一致,那么,这个估计量就是无偏估计量。 如果称为无偏估计量,则有: E()=uX 如果不是这样,则称该估计量是有偏的估计量,比下图中的估计量X*。 4.3.3 有效性 虽然无偏性是令人想往的性质,但却不是充分的。如果有两个

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档