SPSS系列培训之:相关分析与线性回归模型.pptxVIP

SPSS系列培训之:相关分析与线性回归模型.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

SPSS系列培训之:相关分析与线性回归模型安木

相关分析任意多个变量都可以考虑相关问题任意测量尺度的变量都可以测量相关强度常用术语直线相关两变量呈线性共同增大呈线性一增一减曲线相关两变量存在相关趋势并非线性,而是呈各种可能的曲线趋势正相关与负相关完全相关SPSS统计分析系列培训安木2

相关分析Bivariate过程进行两个/多个变量间的参数/非参数相关分析如果是多个变量,则给出两两相关的分析结果Partial过程对其他变量进行控制输出控制其他变量影响后的相关系数SPSS统计分析系列培训安木3

相关分析Distances过程对同一变量内部各观察单位间的数值或各个不同变量间进行相似性或不相似性(距离)分析前者可用于检测观测值的接近程度后者则常用于考察各变量的内在联系和结构一般不单独使用,而是作为MDS的预分析过程典型相关分析SPSS统计分析系列培训安木4

相关分析Bivariate过程案例:考察信心指数值和年龄的相关性散点图非参数相关系数SPSS统计分析系列培训安木5

相关分析Partial过程在控制家庭收入QS9对总信心指数影响的前提下,考察总信心指数值和年龄的相关性。SPSS统计分析系列培训安木6

相关分析和回归分析的关系SPSS统计分析系列培训安木7

回归分析概述研究一个连续性变量(因变量)的取值随着其它变量(自变量)的数值变化而变化的趋势通过回归方程解释两变量之间的关系显的更为精确,可以计算出自变量改变一个单位时因变量平均改变的单位数量,这是相关分析无法做到的除了描述两变量的关系以外,通过回归方程还可以进行预测和控制,这在实际工作中尤为重要SPSS统计分析系列培训安木8

回归分析概述回归分析假定自变量对因变量的影响强度是始终保持不变的,如公式所示:对于因变量的预测值可以被分解成两部分:常量(constant):x取值为零时y的平均估计量,可以被看成是一个基线水平回归部分:它刻画因变量Y的取值中,由因变量Y与自变量X的线性关系所决定的部分,即可以由X直接估计的部分SPSS统计分析系列培训安木9

回归分析概述?:y的估计值(所估计的平均水平),表示给定自变量的取值时,根据公式算得的y的估计值a:常数项,表示自变量取值均为0时因变量的平均水平,即回归直线在y轴上的截距多数情况下没有实际意义,研究者也不关心b:回归系数,在多变量回归中也称偏回归系数。自变量x改变一个单位,y估计值的改变量。即回归直线的斜率SPSS统计分析系列培训安木10

回归分析概述估计值和每一个实测值之间的差被称为残差。它刻画了因变量y除了自变量x以外的其它所有未进入该模型,或未知但可能与y有关的随机和非随机因素共同引起的变异,即不能由x直接估计的部分。为了方程可以得到估计,我们往往假定?i服从正态分布N(0,σ2)。SPSS统计分析系列培训安木11

案例:销量影响因素分析某专门面向年轻人制作肖像的公司计划在国内再开设几家分店,收集了目前已开设的分店的销售数据(Y,万元)及分店所在城市的16岁以下人数(X1,万人)、人均可支配收入(X2,元),数据见reg.sav。试进行统计分析。实际上拟合的模型如下:SPSS统计分析系列培训安木12

模型适用条件线性趋势独立性正态性方差齐性如果只是探讨自变量与因变量间的关系,则后两个条件可以适当放宽样本量根据经验,记录数应当在希望分析的自变量数的20倍以上为宜实质上样本量和模型的决定系数有关,可通过迭代的方法进行计算SPSS统计分析系列培训安木13

常用指标偏回归系数相应的自变量上升一个单位时,因变量取值的变动情况,即自变量对因变量的影响程度。标化偏回归系数:量纲问题决定系数相应的相关系数的平方,用R2表示,它反映因变量y的全部变异中能够通过回归关系被自变量解释的比例。SPSS统计分析系列培训安木14

线性回归模型简介分析步骤做出散点图,观察变量间的趋势SPSS统计分析系列培训安木15

线性回归模型简介分析步骤考察数据的分布,进行必要的预处理。即分析变量的正态性、方差齐等问题进行直线回归分析残差分析残差间是否独立(Durbin-Watson检验)残差分布是否为正态(图形或统计量)SPSS统计分析系列培训安木16

线性回归模型简介分析步骤残差分析强影响点的诊断多重共线性问题的判断这两个步骤和残差分析往往混在一起,难以完全分出先后SPSS统计分析系列培训安木17

案例:固体垃圾排放量与土地种类的关系本例来自GoluekeandMcGauhey1970年对美国40个城市的固体垃圾排放量(吨)的调查资料,所关心的问题是不同种类土地使用面积(单位,英亩)与固体垃圾排放量之间的关系。可能的影响因素有:indust(工业区土地面积的大小)、metals(金属制造企业用地面积)、trucks(运输及批发商业用地面积)、retail(零

文档评论(0)

gcmguochunming + 关注
实名认证
文档贡献者

高级工程师持证人

该用户很懒,什么也没介绍

领域认证该用户于2025年07月19日上传了高级工程师

1亿VIP精品文档

相关文档