- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 相关与回归分析 第一节 相关分析 第二节 一元线性回归分析 第三节 线性相关的显著性检验 第四节 可线性化的回归方程 第一节 相关分析 变量间的关系 变量间的关系有两种类型:函数关系和相关关系。 函数关系—— 是一一对应的确定关系。 设有两个变量 x 和 y ,变量 y 完全依赖于 x ,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量。 各观测点都严格落在一条线上。 例如: 圆的面积(S)与半径之间非关系可表示为S = ? R2 ; 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价) 相关关系—— 变量间确实存在、但数量上不固定的相互依存。这种关系不能用函数关系精确表达; 一个变量的取值不能由另一个变量惟一地确定;当变量 x 取某个值时,与之相关的变量 y 的取值可能有若干个; 各观测点分布在一条直线或曲线周围. 相关关系的例子 概念 上述定义将相关关系区别于: 函数关系—— 假 相 关——没有本质联系,只是表面数字的偶然的巧合; 如上证指数与气温的关系。 相关关系比因果关系包括的范围更广泛。 因果关系属于相关关系; 相关关系不一定是因果关系。 相关关系的类型 (续) 3、按相关方向分为: 正相关——两变量大体上呈同方向变化; 负相关——两变量大体上呈反方向变化。 二、相关关系的测定 (一)相关表和相关图 相关表——将一个变量按大小顺序排序,另一个变量对应排列而成的表格。 相关图——也称为散点图。一对数据对应坐标图上一个点,将成对的观察数据表现为坐标图的散点而形成的图。 编制相关表、图的意义——有助于分析者判断 相关的有无、方向、形态、密切程度。 相关关系的图示 (二)相关系数和判定系数 都是对变量之间关系密切程度的度量; 判定系数=相关系数的平方; 不同类型的相关,相关系数的计算方法也不同. 对两个变量之间线性相关程度的度量称为简单相关系数(也称直线相关系数),常简称相关系数. 此外还有复相关系数、非线性相关系数、偏相关系数 3. 有总体相关系数与样本相关系数之分: 总体相关系数ρ——根据总体数据计算的, 样本相关系数 r ——根据样本数据计算的。 相关关系的计算公式 相关系数取值及其意义 r 的取值范围是 [-1,1] |r|=1,为完全相关; r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关; -1?r 0,为负相关;0r ?1,为正相关 (续) 一、回归分析的意义 从一组样本数据出发,确定变量之间的数学关系式——建立回归模型; 借助于数学模型来表达变量之间的平均数量关系 对这些关系式的可信程度进行各种统计检验并从某一特定变量的诸多影响因素(变量)中找出哪些变量的影响显著,哪些不显著; 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。 回归分析与相关分析的区别 相关分析中,变量 x、 变量 y 处于平等地位。 回归分析中, y 为因变量,处在被解释的地位;x 为自变量,用于解释和预测因变量的变化。 2. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。 3. 相关分析主要描述两个变量之间相关关系的密切程度;回归分析揭示变量之间数量变动的统计规律性(不仅可以由回归方程揭示变量 x 对变量 y 的平均影响大小,还可以进行预测和控制 )。 回归模型的类型 二、一元线性回归方程的确定 具有线性相关关系的两个变量的关系可表示为: y = α + b x + e 线性部分反映了由于 x 的变化而引起的 y 的变化. 误差项 ? 是随机变量; 反映了除 x 和 y 之间的线性关系之外的随机因素对y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 α 和 ? 称为模型的两个待定参数。 一元线性回归模型的基本假定 E(ε)=0,即误差项ε是一个期望值为0的随机变量。 从平均意义上,总体线性回归方程 E ( y ) = α + ? x ε的方差σ2 相同(对于所有的 x 值); 误差项ε是一个服从正态分布的随机变量,且相互独立,即ε~N(0,σ2)。 (总体)回归方程 描述 y 的平均值或期望值如何依赖于 x 的方程称为(总体的)回归方程; 一元线性(总体)回归方程的形式如下: E( y ) = α + ? x 样本(估计的、经验的)回归方程 估计参数的最小二乘法最小平方法(L S ) a 和 b 的计算公
文档评论(0)