第八讲SPSS主成分分析和因子分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八讲SPSS主成分分析和因子分析.ppt

第八讲 主成分分析和因子分析 一、概述 意义和作用: 解决变量间多重共线性。在社会经济研究工作中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且由于分析前提不满足,得出错误结论。 变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。 变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。 因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。 Factor1.sav 、 Factor2.sav 二、主成分分析 1、基本原理 统计信息实际上是指数据变异信息 右图中,在椭圆的长轴方向数据变异明显大于短轴方向 如由两个原始变量X1和X2,可提取两个主成分:   F1 =a11X1 +a21X2   F2 =a12X 1 +a22X2 依次类推:由N个原始变量可提取N个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义. 一般情况下按贡献率由大到小,取累计贡献率达到85%的前2~3个主成分,其他的忽略不计。 在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。 2、应用 利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。 利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。 三、因子分析 1、概述 与主成分分析相同,也是一种多变量化简、降维技术。 在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。 在实际应用中,有时两者不加区分 2、适用条件 为了找出变量间内在结构,要求因子分析满足以下条件: 样本量 样本量与变量数的比例应在5: 1以上 总样本量最好大于100,而且原则上越大越好 各变量间必须有相关性 KMO统计量:在(0,1)之间,大于0.9最佳, 0.9-0.7尚可, 0.7-0.6很差,0.5以下放弃 Bartlett’s球形检验:对变量间的独立性进行检验,若变量间相互独立(Sig.大于0.05),因子分析无效 3、步骤 判断数据是否符合要求,是否有必要进行主成分/因子分析 对原有变量标准化,以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化) 根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量 进行分析,按一定标准确定提取的主成分/因子数 如果进行的是主成分分析,步骤到此结束 如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向0、1分化,以寻求最佳解释 如有必要,计算因子得分等中间指标供进一步分析使用 4、输出统计量 特征根(Eigenvalue ):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于1,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于1作为抽取因子的标准。 方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。 累计贡献率 变量Xi的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量(方差)由公因子决定的比例 旋转前/后因子载荷:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数 因子得分函数系数 5、公因子数的确定 公因子数量的确定 主成分的累积贡献率:85%以上 特征根:大于1 综合判断。 因子分析时更重要的是因子的可解释性,必要时保留特征根小于1的因子 利用碎石图帮助确定因子数量 6、在SPSS中的实现 例:在Factor2.sav中,有重庆市40个区县的GDP、工业总产值等九个指标数据,试根据这些指标对各区县经济发展状况进行综合评价。 在SPSS中的实现: 分析(Analyze)---数据降维(Data Reduction)---因子分析(Factor Analyze) 在因子分析对话框中,将原变量选入“变量”列表框中 在“描述”按钮对话框,在“相关矩阵”部分选择“系数”和“KMO和Bartlett球形度检验” 在“抽取”按钮对话框,“方法”设定为“主成分” 在“旋转”按钮对话框,“方法”设定为“最大方差法” 在“得分”按钮对话框,选择“保存为变量”、“方法”设定为“回归”,选择“显示因子得分系数矩

文档评论(0)

我的文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档