- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分剖析与因子剖析[精品]
主成分分析与因子分析;英国统计学家Moser Scott 1961年在对英国157个城镇发展水平进行调查时,原始测量的变量有57个,而通过因子分析发现,只需要用5个新的综合变量(它们是原始变量的线性组合),就可以解释95%的原始信息。对问题的研究从57维度降低到5个维度,因此可以进行更容易的分析。 ;美国统计学家Stone在1947年关于国民经济的研究,它根据美国1927年到1938年的数据,得到17个反映国民收入与支出的变量要素,经过因子分析,得到了3个新的变量,可以解释17个原始变量97.4%的信息。根据这3个因子变量和17个原始变量的关系,Stone将这3个变量命名为: Z1——总收入。 Z2——总收入率。 Z3——经济发展或衰退的趋势(时间t的线性部分)。 ;根据这3个变量的命名含义,可以看出这3个新的变量是可以测量的。Stone把实际测量3个变量的值(C1,实际测量总收入;C2,实际测量总收入率;C3,时间因素)和因子分析得到的3个变量值进行相关性分析,得到的结果如下表所示。 ;在社会、政治、经济和医学等领域的研究中往往需要对反映事物的多个变最进行人量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有可能用较少的综合指标分析存在于各变量中的各类信息,这些被抽象出来的综合指标之间彼此不相关,且能反映原来众多变量的主要信息,称之为因子。 因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计学方法。即是一种通过显在变量来测评潜在变量,通过具体指标测评抽象因子的统计分析方法。 ;因子分析的特点 ;因子分析的数学模型 ; 因子分析中的几个概念 ;公共因子Fj的方差贡献:为因子载荷矩阵A中第j列各元素的平方和,即: ;因子分析的个基本步骤 ;确定待分析的原有若干变量是否适合于因子分析 ;1、巴特利特球形检验(Bartlett Test of Sphericity) ; 反映像相关矩阵检验以变量的偏相关系数矩阵为出发点,将偏相关系数矩阵的每个元素取反,得到反映像相关矩阵。偏相关系数是在控制了其他变量对两变量影响的条什下计算出来的相关系数,如果变量之间存在较多的重叠影响,那么偏相关系数就会较小。因此,如果反映像相关矩阵中有些元素的绝对值比较大,那么说明这些变量不适合作因子分析。 ;3.KMO(Kaiser-Meyer-Olkin)检验 ; Kaiser给出了一个KMO的标准: 0.9KMO:非常适合; 0.8KMO0.9:适合; 0.7KMO0.8:一般; 0.6KMO0.7:不太适合; KMO0.5:极不适合。;构造因子变量 ;主成分分析通过坐标变换手段,将原有的p个相关变量xi,作线性变化,转换为另外一组不相关的变量yi,可以表示为: ; 主成分分析放在一个多维坐标轴中看,是对x1、 x2、 x3… xp组成的坐标系进行平移变换,使得新的坐标系原点和数据群点的重心重合,新坐标系的第一个轴与数据变化最大方向对应(占的方差最大,解释原有变量的能力也最强),新坐标的第二个轴与第一个轴正交(不相关),并且对应数据变化的第二个方向…因此称这些新轴为第一主轴u1、第二主轴u2…若经过舍弃少量信息后,原来的p维空间降成m维,仍能够十分有效的表示原数据的变化情况。生成的空间L(u1,u2,…,um)称为“m维主超平面”。用原样本点在主超平面上的投影近似地表示原来的样本点。 ;主成分分析的步骤 ;计算数据 的协方差矩阵R ; 确定m有两种方法: 一是,根据特征值的大小确定,一般取大于l的特征值; 二是,根据因子的累计方差贡献率来确定。 ;如果数据已经标准化,则:;因子变量的命名解释 ;载荷矩阵A中某一行中可能有多个aij比较大,说明某个原有变量xi可能同时与几个因子有比较大的相关关系。 载荷矩阵A中某一列中也可能有多个aij比较大,说明某个因子变量可能解释多个原变量的信息。但它只能解释某个变量一小部分信息,不是任何一个变量的典型代表。 会使某个因子变量的含义模糊不清。在实际分析中,希望对因子变量的含义有比较清楚的认识。这时,可以通过因子矩阵的旋转来进行。 正交旋转、斜交旋转、方差极大法,其中最常用的是方差极大法。;计算因子得分 ;估计因子得分的方法有: 回归法 Bartlette法 Anderson-Rubin法;合作性;呜丽溺狼紊板绩股艾殃磅扭还琼饼膳凋能朋越惩磺爆望蔑聪淳礼材晒坟块主成分分析与因子分析主成分分析与因子分析;Statistics: Univariate descrip
文档评论(0)