统计学第七章相关回归分析.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
19世纪末,英国著名统计学家Francis Galton研究孩子及他们父母的身高时发现,身材高的父母,他们的孩子也高,但这些孩子平均起来并不像他们的父母那样高;对于比较矮的父母,他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应。回归这个术语便开始传播开来。 现在的回归分析已经没有原来的含义,但这种说法一直沿袭下来,重在表明这是研究数值变量之间关系的方法。 “回归”的本来含义 二、回归分析的主要内容 1.根据研究目的和现象之间的内在联系,确 定自变量和因变量 2.确定回归分析模型的类型及数学表达式 3.对回归分析模型进行评价与诊断 4.根据给定的自变量数值确定因变量的数值 三、回归分析的特点 1.回归分析必须根据研究目的确定其中一个为因变量,其余为自变量而相关分析可以不用区分自变量和因变量 2.相关分析中,两个变量要求都是随机的,而在回归分析中,要求因变量是随机的,而自变量的值则是给定的 3.若变量之间互为因果,则可以求出两个回归方程,而两个变量之间只能求出一个相关系数 4.回归方程有较强的应用性 四、回归模型的类型 一个自变量 两个及两个以上自变量 回归模型 多元回归 一元回归 线性回归 非线性回归 线性回归 非线性回归 第四节 回归分析的模型 一、简单线性回归模型 二、多元线性回归模型 三、非线性回归模型 一、简单线性回归分析 (一)简单线性回归模型 理论模型 估计模型 回归参数 回归参数的估计值 两点说明: 1. a是直线的截距,b是直线的斜率 2.因变量y的估计值记为yc 误差项 (二)参数估计 销售额 w w w w w w w w w w The question is: Which straight line fits best? 思路:离差的平方和最小 最小二乘法 整理得: 最后解得: 设估计模型为 斜率b的含义为:自变量x每增加(或减少)一个单位,因变量y将平均增加(或减少)b个单位。 例:某企业对车间9名学徒工进行调查,得到学徒期限与每天产量情况如右表所示,要求建立以日产量为因变量的回归方程。 所以回归方程为yc=0.83+87.5x 斜率b的其他公式 回归系数b和相关系数r是有联系的 (三)回归估计标准误 在散点图上可以拟合一条与各观测点配合最佳的直线,但这些观测点所代表的若干对观测值,只是从总体中抽取的一个样本。由观测值求出的回归直线称为样本回归直线,它只是总体回归直线的一个估计线,因此在做回归分析时需要对拟合的回归方程的代表性进行衡量。 估计误差的大小能反映估计值的准确性。但实际值y与估计值yc离差之和为0,因为正离差与负离差抵消了。显然离差的平方和可以衡量准确性 * 第一节 相关分析的基本问题 第二节 相关关系的测度 第三节 回归分析的基本问题 第七章 相关回归分析 第三节 回归分析的模型 ①了解相关关系的概念及种类; ②掌握相关分析的原理、几种常用相关系数的测定方法及相关系数取值含义; ③掌握回归分析的原理、方法及应用,重点掌握简单线性回归方程的拟合及应用,明确直线回归方程中待定参数的含义。 具体要求 第一节 相关分析的基本问题 一、相关关系与函数关系 二、相关关系的种类 三、相关分析的主要内容 一、相关关系与函数关系 1. 函数关系 现象之间存在的确定性的数量依存关系 圆的面积S与半径r之间的数量关系 GDP与总产出及中间投入之间的关系 例: S = ? R2 GDP=总产出-中间投入 2.相关关系 也称统计相关,是指现象之间存在的非确定性的数量依存关系 非一一对应 商品价格与商品需求量之间存在的变动关系 例: 施肥量与农作物产量的关系 1.是一一对应的确定关系 2.设有两个变量 x 和 y ,变量 y 完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 3.各观测点落在一条线上 1.变量间关系不能用函数关系精确表达 2.一个变量的取值不能由另一个变量唯一确定,当变量 x 取某个值时,变量 y 的取值可能有几个 3.各观测点分布在直线周围 ? ? ? ? ? ? ? ? ? x y ? ? ? ? ? ? ? ? ? x y 2.函数关系与相关关系的联系与区别 联系 区别 函数关系有时也可能表现为相关关系 相关关系通常要利用相应的函数关系式来表现 确定性依存关系与非确定依存关系 函数关系往往因为有观察或测量误差以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;而在研究相关关系时,其数量间的规律性了解得越深刻的时候,

您可能关注的文档

文档评论(0)

管理学科 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档