应用统计学课件第11章相关分析与回归分析.pptx

应用统计学课件第11章相关分析与回归分析.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 相关分析与回归分析 11.1、变量间的关系 11.2、相关系数的测度 11.3、简单线性回归模型 11.4、回归模型的应用 11.1、变量间的关系 1 、函数关系和相关关系 Y=f(x) 变量之间不确定性的依存关系,我们称之为相关关系. 2、相关关系的种类 例1、 下面是19个家庭食品消费支出和家庭收入数据(数据教材11-1),试用图表分析食品消费支出与家庭收入的相关关系。 11.2 相关系数的测度 1、线性相关系数 性质: -1≤r≤+1 r0,负相关;r0,正相关;|r|=1完全相关 强相关和弱相关 相关系数的另一种形式计算式 在手工计算样本相关系数时,通常先列计算表得到∑X,∑Y,∑XY,∑X2,∑Y2。然后代入公式。 Excel计算相关系数的函数CORREL 2、相关系数的检验 总体相关系数ρ=0时,样本相关系数r趋近于正态分布。而当ρ接近于+1或-1时,除非n非常大,r的分布是有偏的。 在实际的检验中,通常情况下采取费舍尔提出的t检验, 检验适用于小样本,也适用于大样本。因为在总体相关系数 接近0时, t的分布接近正态分布。 t检验的步骤: 第一步:提出假设 H0: ρ=0 H1: ρ≠0 第二步:计算检验统计量值 第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值ta/2(n-2) 。 若t ta/2(n-2) ,则拒绝原假设。 反之,不能拒绝原假设。 例11.2 针对数据11.1,19个家庭食品消费支出和家庭收入数据计算的样本相关系数r=0.9785,检验两者之间的线性相关系数是否显著(a=0.05)。 解: 第一步:提出假设 H0: ρ=0 H1: ρ≠0 第二步:计算检验统计量值 第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值t0.025(17)=2.1098 。 因为t=19.56 ta/2(n-2) ,故拒绝原假设。表明家庭食品支出与家庭收入变量总体上相关性显著。 11.3 简单线性回归模型 11.3.1模型的基本定义 1、模型的数学形式 Y:因变量、应变量、被解释变量 X:自变量、解释变量 2、模型包含随机误差项ε的原因 1)引起变量观察值随机误差的诸多因素,使模型产生的误差。变量观察值的误差往往是不可避免的,无论是试验数据还是观察数据。但是在多次观察中有理由认为绝对值相同的正、负误差出现的机会大致相同。 2)模型设定的误差。这其中既有模型的函数形式设定的误差,也可能有遗漏解释变量的误差。引起设定误差的原因可能是我们对于引起 变动的机理尚不清楚,有时也是为了简化模型的需要。 3)存在一些无法观测的解释变量。 3.关于随机误差项ε的假定 1)对于ε本身而言,具有零均值,即 E(εi)=0 ; 2)对于ε本身而言,具有等方差,即: D(εi)=σ2; 3)对于ε本身而言,即εi和εj不相关,可以表示为: COV(εi,εj)=0 ; 4) ε与解释变量X不相关,可以表示为: COV(εi,Xj)=0。 11.3.2 最小二乘估计法(Least Squares Estimate Method) 1. 最小二乘的基本思想 根据Y 和X的样本观察值得到总体参数的估计值 ,最常用的方法就是最小二乘估计法,即假设在拟合Y依X线性关系的所有直线中,有一条直线的预测值和观察值的偏离程度最小,即: 必有: 整理得到参数的估计值: 在手工计算样本相关系数时,通常先列计算表得到∑X,∑Y,∑XY,∑X2,∑Y2。然后代入公式。 例11.3 针对数据11-1,试估计居民食品消费支出依家庭收入的回归方程。 通过计算,可以得到食品消费支出依居民家庭收入的样本回归方程,写成: 根据经济学的知识,对这一回归方程可以做出解释,斜率0.2537表示当家庭收入每增加1万元,用于居民家庭食品的消费支出平均增加2537元,可以理解为收入对食品支出的边际贡献;而截距1.1782可以理解为收入为0时家庭食品支出额。 2. 在EXCEL中回归方程的估计 第一步,选择“数据分析”中的“回归”分析工具,选择Y的输入区域和X的输入区域,如图 第二步,点击确定后得到如图11-3b的三张表:回归统计、方差分析和系数表(Coefficients)。 11.3.3回归方程的显著性检验 1.回归方程整体拟合效果的检验——拟合优度(goodness of fit) Y的总变差: 回归平方和: 残差平方和: 对于给定的样本数据,无论样本回归线如何,总变差

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档