- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八讲 回归分析——Regression 菜单详解孔 明苏州大学 教育学院sandlymm@163.com一、统计知识回顾什么是回归分析回归分析与相关分析回归模型简介回归模型的建立方法线性回归的(适用条件)基本假设线性回归的样本要求二、回归模型的分析步骤三、一元线性回归分析实例四、多元线性回归分析实例五、高级话题:强影响点及多重共线性的诊断及修正一. 统计知识回顾1. 什么是回归分析?回归分析(regression):用一定的数学模型来表述两个及两个以上变量间依存关系的统计方法。线性关系的的回归分析叫做线性回归(linear regression)回归的含义F.Galton和Karl Pearson的研究 父Y 子2/3Y 人类平均数 (1078父亲身高平均数) 子2/3Y 父Y一元线性回归分析涉及一个自变量的回归因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量(dependent variable),用y表示用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一条线性方程来表示2. 回归分析与相关分析回归:用数学方式表示变量间的关系相关:检验或度量关系的密切程度。两者相辅相成!研究目的若是分析变量之间关系密切程度,用相关;若是要确定变量之间数量关系的可能形式,找出适合的数学模型,用回归。回归分析与相关分析的区别相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 3. 回归模型简介例1 测16名成年女子的身高与腿长所得数据如下:以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi)在平面直角坐标系上标出.散点图 (Y对X的回归) a---回归截距(常数项),是当X为0时的Y值。 b---回归斜率(回归系数或偏回归系数),它表示 x 每变动一个单位时, y 的平均变动值。 4. 回归模型的建立方法1、平均数方法2、最小二乘法5. 线性回归的适用条件(基本假设)1.线性关系假设:自变量与因变量关系为线性2.独立性假设:因变量y的取值相互独立,之间没有联系,即:残差之间相互独立3.正态性假设:因变量y正态分布(残差正态分布)4.方差齐性:残差的方差齐性6. 线性回归的样本要求样本数应当在希望分析的自变量数的20倍以上。如:希望分析5个自变量,则样本量应当在100以上,少于此数则可能会出现检验效能不足的问题。7. 线性回归的常用指标1.偏回归系数:即:模型中的b,它反映的是相应的某个自变量上升一个单位时,因变量取值的变动情况,即:自变量对因变量的影响程度。2.标准化偏回归系数:用 表示。由于自变量间的平均数和标准差有时相差非常大,因此无法比较各自变量的影响程度大小,为此,将各自变量进行标准正态变换后再进行分析,此时得到的就是标准化偏回归系数。3. 决定系数(coefficient of determination)决定系数 :表明变量Y的变异中,有多大比例是由变量X的变异引起的 。(Y变量被自变量X所能解释的比例 )Y的变异X的变异8. 线性回归的分析步骤1.做散点图:观察变量间趋势。2.考查数据分布:进行必要的预处理。分析变量的正态性、方差齐等问题。3.进行直线回归分析4.残差分析: 残差间是否独立:Durbin-Watson检验 残差分布是否正态:残差列表、残差图5.强影响点的诊断及多重共线性的判断三、一元线性回归分析一元线性回归——Linear 过程主要功能:主要用于简单线性回归和多元线性回归。(一元)简单线性回归主要分析过程Analyze-Scatter-Simple (做散点图)Analyze-Regression-Linear(做回归分析)数据说明下面是十个家庭的人口数与每月开销的资料,试建立回归方程解释家庭人口数与每月开销的关系。数据:ex15-1.savSPSS操作SPSS操作SPSS结果描述统计相关SPSS结果选入/删除的变量模型摘要SPSS结果方差分析SPSS分析系数SPSS结果说明经过统计检验,发现家庭人口数可以预测每月开销。R2为.885,显示以家庭人口数可解释每月开销的88.5%的变异量,F(1,8)=61.48,p.001,显示回归模型具有统计意义。系数估计的结果指出,家中人口数对于每月开销的Beta系数达.941
文档评论(0)