部分因子分析.docVIP

部分因子分析.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共69页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
部分因子分析

第五部分 因子分析 本部分内容:一、主成分分析 二、因子分析 三、SPSS操作路径 一、主成分分析 (一)一个简化分析事例 1、坐标变换 假定小学某班级学生的语文成绩(X1)数学成绩(X2)的相关系数r12 = 0.6,且X1和X2都是标准化分数,其散点图如图1所示。现通过旋转(X1,X2)变换出新坐标(Y1,Y2),使新坐标的Y1轴对准散点分布方差最大的方向。下面给出由原坐标系(X1,X2)变换为新坐标系(Y1,Y2)的方法。椭圆较长的直径的方差的65%,则可进行变量简化。把变量标准化,λ即方差。 图1 图2 记随机矢量X′=(X1,X2)的协方差矩阵为∑,则 ∑= 设u是以λ为特征值的特征矢量矩阵,把上述结果代入特征值矩阵方程(∑-λI)u = 0,得 , 。 得方程组 (1-λ)u1 + 0.6u2 = 0, 0.6u1+(1-λ)u2 = 0。 要使该方程组有非零解,系数行列式必须为零,故 。 由此解得特征值的两个取值 λ1 = 1.6, λ2 = 0.4。 代入原方程组,取 特征矢量为单位矢量,即要求 求得对应的特征矢量 =(u11,u21)=(), =(u12,u22)=()。 最后求得新坐标系(Y1,Y2)与原坐标系(X1,X2)的关系为 , 。 结果显示,新坐标是通过原坐标逆时针旋转45°得到的。如此求得的新坐标即可满足“Y1轴对准散点分布方差最大的方向”这一要求。 2、特征值λi与散点分布方差的关系 矢量Y1和Y2的方差的计算公式为 Var(Y1)= Var(X)= , 其中∑为协方差矩阵。同理 Var(Y2)= Var(X)= 。 上述结果表明,散点分布的最大变差方向由变换所得到的特征向量Y1给定,而相应的特征值λ1和λ2刻画了与各特征向量Y1和Y2对应的散点分布方差。 并且,散点分布在Y1方向上的方差占全部方向Y1和Y2上的方差的比例为 。 也就是说,散点分布变差特点的80%可以在Y1方向得到解释,而Y2方向只占20%。Y1就是本例中的第一主成分。 (思考:在原坐标系中,散点分布变差的特点在X1和X2方向上的情况如何?) (二)主成分的一般推导 1、主成分的三个特征 寻找主成分的目的,是为了根据原有统计指标体系(即原有坐标系),建立更加符合数据散点分布特征的新坐标系,在保证大部分统计信息得到反映的前提下,选择尽可能少的统计指标,简化统计描述,使统计数据中隐含的因果性因素更为清晰。主成分分析就是要揭示统计数据的变差主要出现在哪些方向上,然后选择这些方向作为简化的新坐标,用以描述统计数据的多维分布特征。 因此,主成分应满足以下三个特征: (1)在p个指标Xi(i = 1,2,3,…,p)的统计描述体系X中,表征主成分的特征矢量Yi应为原坐标Xi的线性组合,若记Yi在Xi中的分量为,则 这一要求的意思是,新坐标只能由原坐标轴产生,而不能撇开原坐标的统计内容不顾。这是为了保证,新坐标表征的统计体系在内容上与原坐标表征的统计体系相同,改变仅限于描述方式的不同。 (2),即,其中i = 1,2,3,…,p(该要求在求解λi时自然满足),并且,相应的Yi的p个特征值λi中的少数几个已包含绝大部分可解释的方差。这一要求的含义是,特征矢量为单位矢量,其中少数几个穿过数据散点分布方差较大的方向,用新坐标Yi描写数据的统计特征时,只需采用其中这些穿过数据散点分布方差较大方向的新坐标就足以描述绝大部分变差的情况,从而可以比原坐标Xi的描述简化。能否实现这一要求,须由实际的推导决定。 (3)Yi和Yj(i≠j)相互无关(正交),即新坐标轴两两独立。以数学方式表述为协方差Cov(Yi , Yj) = 0, i≠j。这一要求,在运用标准化数据的相关矩阵求解特征值λi和特征矢量Yi的过程中,将自然得到满足,无须特别处理。 2、主成分的导出步骤 综上所述,主成分可以通过以下步骤求解: (1)把数据标准化,写出标准化数据矩阵X; (2)写出相关系数矩阵: (3)通过矩阵方程

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档