- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
(PPT2)同学,你好,今天我们讨论多元统计分析中的回归分析。
由回归分析基本概念、一元线性回归、多元线性回归、非线性回归、模型拓展五个部分组成。本节课介绍回归分析基本概念和一元线性回归。
(PPT3)首先介绍第1部分,回归分析基本概念
(PPT4)让我们先通过两个例子来对回归分析有个直观印象。
(动画1)第一个例子,一种农作物的亩产量与播种量、施肥量有重要联系,这种数量之间的关系可用回归分析来进行研究。但他们不能严格决定产量。除了播种量和施肥量外,其它因素如灌溉情况、气温变化、自然灾害等等,都会影响到亩产量,我们把除播种量和施肥量以外影响产量的因素归于随机误差。
(动画2)第二个例子,人的身高和体重存在关联,一般表现为身高越大体重也倾向于越大,可用回归分析来研究,但身高不能严格地决定体重。
(PPT5)(动画1)那么,什么是回归分析?
?根据样本信息来描述两种或两种以上变量间的相互依赖的定量关系的统计分析方法称为回归分析。
(动画2)?实际问题中往往涉及多个变量。在这些变量中,有一个是需要特别关注的称为因变量,
(动画3)而其他变量看作是影响这一变量的因素,称为自变量。
?第1个例子中亩产量为因变量,播种量、施肥量为自变量。
(PPT6)回归分类
(动画1)回归模型根据其自变量的个数可分为
(动画2-4)一元回归和
(动画5-6)多元回归
(动画7-12)根据自变量的结构可分为线性回归和非线性回归
(PPT7)下面介绍回归分析模型
(动画1)现设一个问题中有因变量Y以及自变量X1,X2,...,X_p,有模型
(动画2)Y=f(X_1,X_2,...,X_p)+epsilon
(动画3)其中epsilon为观察值Y围绕它的期望值E(Y|X1,...,X_p)的离差,是一个不可观测的随机变量,又称为随机干扰项或随机误差项。
(动画4)称函数f(X1,...,Xp)=E(Y|X1,...,Xp)为Y对X1,...,Xp的回归函数
(动画5)称方程Y=f(X1,...,Xp)为Y对X1,...,Xp的回归方程
(动画6)利用自变量X1,...,Xp的值更好地逼近因变量Y就是在均方误差最小的意义下使回归函数效果最好。
(PPT8)相关性分析和回归分析是研究现象之间相关关系的两种常用方法,二者有着密切的联系,它们不仅有共同的研究对象,而且在具体运用时,常常需要互相补充。在相关分析中,相关系数能确定两个变量之间的相关方向和相关的密切程度;而回归分析是对具有相关关系的两个或两个以上的变量之间数量变化的一般关系进行测定。相关分析需要借助回归分析表明现象数量相关的具体形式,同时,回归分析需要依靠相关性分析来表明现象数量变化的相关程度,只有变量之间高度相关时,进行回归分析才有意义。但是,相关性分析和回归分析在研究目的和具体研究方法上有着明显的区别。
(动画1)1、相关性分析分析只研究变量间的相关方向和相关密切程度,无须明确自变量和因变量;而回归分析必须明确自变量和因变量,并且只能从自变量推测因变量。
(动画2)2、相关性分析无法指出变量之间相关关系的具体形式;而回归分析能得到变量之间的定量关系,从而可以通过已知量预测未知量。
(动画3)3、相关性分析一般涉及的变量都是随机的;而回归分析中的因变量是随机的,自变量则作为研究对象,是给定的。
(PPT9)下面我们介绍第二部分——一元线性回归
(PPT10)(动画1)设y是一个可观测的随机变量,它受到一个非随机变量因素x和随机因素epsilon的影响,且y与x有如下线性关系:
y=beta_0+beta_1*x+epsilon
(动画2)其中,(动画3)epsilon是一个随机变量,服从均值为0,方差为sigma^2的正态分布。
(动画4)beta_0,beta_1称为回归系数
(动画5)x为自变量(动画6)y为因变量
称上式为一元线性回归模型。
(PPT11)(动画1)通常,我们对总体(x,y)进行n次独立的观测,获得n组观测数据(x_1,y_1),(x_2,y_2),...,(x_n,y_n),在直角坐标系中画出这些数据点,如果这些点大致位于同一条直线的附近,则认为y与x之间的关系符合一元线性回归模型。具体结构为
(动画2)y_i=beta_0+beta_1*x_i+epsilon_i(i=1,...,n)
(动画3,动画4)其中,epsilon_i独立与epsilon同分布。
(动画5)一元线性回归分析的主要任务有三个:
(动画6)(1)利用样本观测值估计回归系数
(动画7)(2)对方程的线性关系作显著性检验
(动画8)(3)利用回归方程作预测
(PPT12)先看第一个任务:回归系数的估计。
基本思想是:选取参数beta_0,b
文档评论(0)