因子主成分.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
因子主成分

程建华 jhcheng0724@163.com Tel* 概 述 解决变量间多重共线性(data reduction) 有太多的变量,希望能够消减变量,用一个新的、更小的由原始变量集组合成的新变量集作进一步分析。 新的变量集能够更好的说明问题,利于简化和解释问题。 探讨变量内在联系和结构(structure detection) 观测变量之间的存在相互依赖关系 由量表所反映出的受访者对某项服务的真实满意度 概 述 本讲课程中涉及的方法其实质均为数据化简、信息浓缩,即将分散在多个变量中的同类信息集中、提纯,从而便于分析、解释和利用。 目的为浓缩信息 目的为探讨内在结构 正因如此,这些信息浓缩方法、特别是其中的因子分析方法,往往成为更复杂的多元分析方法的基石。 主成分分析 概 述 只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且可能因多元共线性而无法得出正确结论。 主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,便于进一步分析。 尽可能保留原始变量的信息,且彼此不相关。 主成分分析 概 述 在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合 如有两个原始变量x1和x2,则一共可提取出两个主成分如下: z1=b11x1+b21x2 z2=b12x1+b22x2 主成分分析 概 述 原则上如果有n个变量,则最多可以提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前2~3个主成分已包含了90%以上的信息,其他的可以忽略不计。 在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定非要有准确的实际含义。 主成分分析 方法用途 主成分评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。 主成分回归:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。 因子分析 概 述 是一种多变量化简技术。目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性较低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。 探索性因子分析 证实性因子分析 因子分析 概 述 比如在市场调查中收集了食品的五项指标:味道、价格、风味、是否快餐食品、能量。经过因子分析后发现结果如下: x1=0.02z1+0.99z2+ε1 x2=0.94z1-0.01z2+ε2 x3=0.13z1+0.98z2+ε3 x4=0.84z1+0.42z2+ε4 x5=0.97z1-0.02z2+ε5 因子分析 概 述 第一公因子主要影响价格、是否快餐食品和能量,代表“价廉” 第二公因子则主要影响味道和风味,代表“味美” ε代表特殊因子,只对当前变量有影响,表示该变量中独特的,不能被公因子所解释的特征 用途 研究设计阶段/问卷效果评估阶段 评价问卷的结构效度 统计分析阶段 解决变量间多重共线性 寻找变量间潜在结构 内在结构证实 适用条件 样本量 样本量与变量数的比例应在5:1以上 总样本量不得少于100,而且原则上越大越好 各变量间必须有相关性 KMO统计量:0.9最佳,0.7尚可,0.6很差,0.5以下放弃 Bartlett’s球形检验 这些条件均是为了保证能够寻找出内在结构 分析步骤 判断是否需要进行因子分析,数据是否符合要求 进行分析,按一定标准确定提取的因子数目 如果进行的是主成分分析,则将主成分存为新变量用于继续分析,步骤到此结束 如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式 如有必要,可计算出因子得分等中间指标供进一步分析使用 因子分析 公因子数量的确定 主成分的累积贡献率:80~85%以上 特征根:大于1 综合判断 因子分析时更重要的是因子的可解释性 必要时可保留小于1的因子 碎石图可以帮助确定因子数量 有关概念 因子负荷 即表达式中各因子的系数值,用于反映因子和各个变量间的密切程度,其实质是两者间的相关系数 公因子方差比(Communalities) 指的是提取公因子后,各变量中信息分别被提取出的比例,或者说原变量的信息量(方差)中由公因子决定的比例 有关概念 特征根(Eigenvalue) 可以被看成是主成分影响力度的指标,代表引入该因子/主成分后可以解释平均多少原始变量的信息。 正因如此,一般对特征根大于1的因子才加以注意 分析实例 汽车销售数据:car_sales.sav 相关系数考察相关性 散点图直观考察 根据信息提取的比例确定主成分

文档评论(0)

sd44055 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档