人民大2024上海财大版《统计学》PPTChapter6 方差分析.pptx

人民大2024上海财大版《统计学》PPTChapter6 方差分析.pptx

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

统计学;第六章假设检验;6.1方差分析引论

6.2单因子方差分析

6.3双因子方差分析;

方差分析(Analysisofvariance,简称ANOVA),是由英国著名的统计学家费歇尔(R.A.Fisher)于1923年提出的。方差分析主要用来研究一个定量变量与一个或多个定性变量的关系,是通过对方差的比较来同时检验多个总体均值之间差异的显著性。

;6.1.1方差分析的思想及基本概念

例6.1.

为了减小失业保险支出、促进就业,政府试图为失业者提供再就业奖励。为了评估此奖励政策是否有效,以及确定合适的奖励金额。对奖励金额设计为四个水平:无奖金、低奖金、中奖金、高奖金。采用随机试验,每组各9人,观测记录受试失业人员再就业所需时间(天),其结果如表6.1。

;

;?;?;在方差分析中,我们实际测量的、作为结果的定量变量称为因变量,例如再就业所需时间。因变量也称试验指标,其不同的取值常称为观察值或试验数据。对定量因变量可能产生影响的属性变量称为因子,例如奖励金额。因子的不同表现状态,即每个自变量的不同取值称为因子的水平,例如奖励金额这一因子有4个水平:无奖金、低奖金、中奖金、高奖金。试验中我们考察的因子可以是一个也可以是多个,当仅考察一个因子对因变量的影响时,我们采用的方差分析方法称为单因子方差分析;当同时考察两个因子对因变量的影响时,我们采用的方差分析方法称为双因子方差分析;当方差分析中考察的因子个数超过2时,我们采用的方差分析方法称为多因子方差分析。;

6.1.2方差分析的基本假定及检验

方差分析通过不同来源的变差构造F检验,因此数据要满足以下三个基本假定:

样本是随机的且样本之间是相互独立的;

(2)各总体均服从正态分布;

(3)在各总体中因变量的方差都相等(方差齐性)。;6.1.2.1正态性检验

方差分析对于正态性分布假定的偏离比较稳健,一般只要分布与正态分布偏离不是很大,方差分析检验的功效不会受到太大影响。我们可以通过正态Q-Q图或者箱线图等直观的图示方法来评估每组样本是否正态,除此之外,还可以构造综合统计量进行假设检验。本小节我们着重介绍被广泛使用的Shapiro-Wilk检验。;?;?;?;?;《统计学》;《统计学》;《统计学》;

值得注意的是,对于本例我们没有进行D’AgostinoD检验。这是由于每组数据只有9个观测值,样本量不够大。当每组样本量足够大且组数不多时,可以对原始数据的分组数据分别进行正态性检验;但当每组样本量不够大或组数较多时,则建议对模型的残差进行正态性检验。在后面的分析中,我们将再从模型残差的角度进行正态性检验。;6.1.2.2方差齐性检验

方差分析的第三个假定要求等方差,判断数据是否满足方差齐性假定,除了通过箱线图这类直观的图示方法之外,我们还可以从假设检验的角度对数据的方差齐性进行检验。Bartlett检验(Bartlett,1937)是常用的两个或多个正态分布总体的方差齐性检验,对于各总体的样本量相等或不等的场合均适用。本小节将着重介绍Bartlett检验,而对于其它的方差齐性检验,例如Levene’s检验(Levene,1960)和Fligner-Killeen检验(Conoveretal.,1981)等,请读者参阅相关文献。;?;?;大多数统计软件均包括常用的方差齐性检验。下面我们依然以例6.1的数据为例,使用R软件完成方差齐性检验。为此,我们首先需要使用Stack函数整理数据。;《统计学》;《统计学》;《统计学》;

在进行多个总体均值检验时,若只有一个影响因子,如例6.1,我们将采用单因子方差分析。在这一小节中我们将以单因子为例,详细地讲解方差分析原理以及F检验原理。

6.2.1数据结构及问题表述

对于只考虑一个影响因子的单因子方差分析,设因子有k个水平,其数据结构及其各水平下的描述性统计量如表6.3所示;;?;?;6.2.2方差分解原理及F检验

对于假设(6.2)如何进行检验呢?简单来说,就是通过这些样本的变差来检验他们的均值是否相等。回想方差分析的基本假定,因子不同水平(总体)的方差相等。因此,我们可以通过比较方差两种不同估计的大小来判断这两种方差估计的差异是否是由因子水平的差异引起还是只是随机误差的影响。为此,在单因子方差分析中,我们将样本间的总离差(Totalvariation)分解为两部分(见图6.3)。其一是由因子效应,即组间的差异性引起的离差,称为组间离差(Among-groupvariation);其二是由各组内部随机因子带来的随机误差引起的离差,称为组内离差(Within-groupvariation).

;《统计学》;《统计学》;《统计学》;《统计学》;《统计学》;《统计

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档