第5章数据分析第2节推论统计.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章数据分析第2节推论统计

§2 推论统计 O、预备知识 一、抽样分析 二、参数估计 三、假设检验的基本概念 四、t检验 五、F检验 六、 检验 七、示例; 管理研究和社会研究绝大部分都采用样本研究,从较大的研究对象总体中抽样收集数据。最终目的是从样本来判断样本所在的总体的特性。 统计推断是一套有清晰逻辑程序的统计计算,对于从样本观测值得出的发现(findings),作出是否适用于总体的判断。发现亦即研究的结果,这些结果不外乎以下几个方面的内容: ; 假设中的自变量和因变量之间有无关联? 这种关联的趋向和形式如何? 这种关联的强度如何? 这种关联是否是因果 ★ 自变量的属性值变化引起因变量的属性值变化,说明两变量间存在关联。 ★ 关联强度的判断则是指观测值中有多大比例的因变量属性值可以从自变量的属性值来解释。 ★ 统计技术用统计显著性来检验所观测到的关联是随机性的还是系统性的原因。 ;★ 自变量和因变量之间存在关联并非表明自变量就是因,因变量就是果,因果辨析一般属于实证研究之后机理分析的内容。 数据分析的主要内容主要围绕变量间关联的存在性、趋向和形式、强度和统计显著性四个方面。描述统计已涉及到存在性、趋向和形式的内容,推论统计则主要回答统计显著性问题。 ;§2 推论统计(inferential statistics); ◆当μ=0, σ2=1时,我们称X服从标准正态分布,即X ~N(0, 1). 标准正态分布的密度和分布函数分别为: ;◆定理 1 设 X~N(μ, σ2),则 (X-μ)/σ~ N(0,1). ◆定义 设X1,X2,…,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量 服从自由度为n的 分布,记作Y~ (n).;◆定理 2 设X1,X2,…,Xn独立,同N(μ,σ2)分布,记;;◆定理3 设X1,X2,…,Xn独立,同N(μ,σ2)分布,记;;◆定义 3 设 X~ ,Y~ , X与Y独立,则称随机变量 服从自由度为(n1,n2)的F分布,记作F~F(n1,n2);一、抽样分析 ●样本统计值(sample statistics):描述样本分布情况的特性值。 ●总体参数值(population parameter):描述总体分布情况的特性值。 ●样本统计值是否能代表总体参数值,怎样才能代表参数值,这正是推论统计解决问题的出发点。 ●统计值和参数值两者的关系可以通过“抽样分布” (sampling distribution)这个概念连通起来。统计值的分布情况就是抽样分布。 ●统计推论可分为参数估计(parameter estimation)和假设检验。;二、参数估计 参数估计分为点估计(point estimation)和区间估计 (interval estimation) 1、点估计 常用的点估计方法有矩法和极大似然估计(Maximum Likelihood Estimation)。 样本均值 样本方差 参数是概率分布的特征值,各种概率分布有不同的特征值,最常用到的参数有平均数μ和方差σ2。;2、区间估计 ●估计偏差(bias) ●无偏估计:设 是未知参数的一个估计量,若有 则称 是θ的无偏估计量。 ●抽样误差:每次估计值和长期估计的平均值(long-run average value)之间的随机误差称作抽样误差。 ●抽样误差的一个很有用的特点是它符合正态分布。; 点估计值给出了参数的一个近似值且是随机的,它跟随着样本的抽取而随机变化,估计值本身既没有反映这种近似的精确度,又没有给出误差范围。为了弥补这些不足,人们希望估计出一个范围,并知道这个范围包含参数真值的可靠程度。这样的范围通常以区间的形式给出,同时还要给出该区间包含参数真值的可靠程度。这种形式的估计称为区间估计。 ; ● 定义 对于参数θ,如果有两个统计量 和        ,对给定的α∈(0,1),有 则称    是θ的一个区间估计或置信区间,1- α为置信水平(置信度)。;三、假设检验的基本概念 1、对立假设 2、显著性试验 3、甲种误差和乙种误差 4、单边检验和双边检验 5、自由度 6、参数检验和非参数检验 ; 根据样本提供的信息判断总体是否具有预先指定的特性。   进行假设检验的基本思想:某种带有概率性质的反证法。基于的原则

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档