- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章因子分析教程
《多 元 统 计 分 析》
Multivariate Statistical Analysis
统计学院应用统计学教研室
第五章 因子分析
【教学目的】
让学生了解因子分析的背景、基本思想;
掌握因子分析的基本原理与方法;
掌握因子分析的操作步骤和基本过程;
学会应用因子分析解决实际问题。
【教学重点】
因子旋转与因子得分;
因子分析与主成分分析的联系与区别。
§1 概述
引言
1.问题提出(研究背景)
在上一章,已经介绍了一种简化数据结构的方法——主成分分析法。其基本目的是从尽可能多地占有原始数据的总变差出发来构造少数变量的线性组合变量——综合变量。本章来讨论另外一种简化数据结构的方法——因子分析,它不同于主成分分析,可以看成是其推广形式。
在经济学、人口学、社会学、心理学、教育学等领域中,有许多基本特征,例如:“态度”、“认识”、“爱好”、“能力”、“智力”等,实际上是不可直接观测的量。但是这些基本特征常常对事物的结果起着决定性作用。比如学生通过考试得到英语、高等数学、大学物理、计算机、统计学、多元统计、数理统计、经济学等课程的成绩。把每门课的成绩看作一个变量,显然这些变量必定受到一些共同因素的影响,比如全面智力,或者细分一点,如逻辑思维能力,形象思维能力和记忆力等,都是影响这些课程成绩的公共因素。另外,每门课程的成绩还可能受自己特点因素的影响,如英语的语言能力、大学物理的动手实验能力、高等数学的推理能力等。
2.因子分析的产生
1904年Charles Spearman发表《对智力测验得分进行统计分析》一文,标志着因子分析方法的产生。因子分析最早用于心理学和教育学方面的研究,目前广泛应用于各领域。
3.什么是因子分析
因子分析就是要利用少数几个潜在变量或公共因子去解释多个显在变量或可观测变量中存在的复杂关系。换句话说,因子分析是把每个原始(可观测)变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子构成的;另一部分是每个原始变量独自具有的因素,即所谓的特殊因素部分或特殊因子部分。正是特殊因子的存在,才使一原始变量有别于其它原始变量。属于多元统计分析中处理降维的一种统计方法。由此可知,因子分析注重的是因子分析的具体形式,而不考虑各变量的变差贡献大小。
例如,某公司对100名招聘人员的知识和能力进行测试,出了50首题的试卷,其内容包括的面较广,但总的来讲可以归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中的因素。现假设100人测试的分数可以用上述六个因子表述为线性函数:
其中,表示六个因子,它对所有是共有的因子,通常称为公共因子。它们的系数称为因子载荷,它表示第个应试人员在六因子方面的能力。是第个应试人员的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定:。
因子分析的任务,首先估计出和方差,然后将这些抽象因子赋予实际背景的解释或予以命名。因子分析有两种类型:R型,对变量作因子分析;Q型,对样品作因子分析。
基本思想
因子分析的思想是通过变量(或样品)的相关系数矩阵(相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间相关(相似)关系。这样因子分析一方面可简化观测系统,简化原始变量结构,再现变量之间的内在联系,达到降维的目的;另一方面可对原始变量进行分类,把相关性较高,即联系比较紧密的变量归为同一类,而不同类的变量之间的相关性较低。
§2 因子分析的数学模型
实际工作中,我们所掌握的只是搜集到的样本数据资料,例如学生的各科成绩,企业的各项指标等。所以这里我们帖变量出发,通过变量模型,即总体因子分析模型引伸出样本因子分析模型。
因子模型(正交因子模型)
1.总体因子模型
用矩阵表示:
简记为:
或
满足条件:
①;
②;
③,,即不相关且方差均为1;
④,,即不相关且方差不同;
⑤,即与不相关。
模型解释:
①模型将原始变量表为个公共因子的线性组合,即将原始变量置于个公共因子张成的空间下进行研究,因子分析的实质是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系;
②称为的公共因子(综合变量),是不可观测的向量,可以理解为在高维空间中互相垂直的个坐标轴;
③为因子载荷,是第个变量在第个公共因子上的负荷。如果把看成维空间中的一个向量,则表示在坐标轴上的投影。矩阵被称为因子载荷矩阵;
④为的特殊因子,理论上要求的协方差矩阵为对角阵;
⑤不相关,若相关,模型称为斜交因子模型;
⑥因子分析与主成分分析的联系
联系:同属降维
文档评论(0)