- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析、因子分析、聚类分析
主成分分析、因子分析、聚类分析
主成分分析
设题目中m个有一定相关关系的变量表示原始指标,记为??1,??2,..,????,样本数为n,则观测样本数矩阵为:
?x11x12?x1m??x?x?x21222m? X??????????xx?xnm??n1n2
为了用原始指标的线性组合表示主成分,将原始数据进行标准化处理:
Xik?xik?xk i=1,2,?,n;k=1,2,?,m Sk
1n1n
式中: xk??xik;Sk?(xik?xk)2。 ?n?1i?1ni?1
计算相关系数矩阵。
??11?12???22R??21
??????m1?m2
式中: ?ij??ji, ??1m???2m????????mm?
?ij??(
k?1nXki?Xkjn)??(xnki?i)(xkj?j)
j=1,2,?,m 用雅可比方法解相关系数矩阵的特征方程?I?R?0,得到矩阵R的m个非负特征值,并求得对应于特征值i的特征向量,并按从大到小的顺序排列: ?
?1??2????m?0,
Cik?(Ci1,Ci2,?,Cim) i=1,2,?,m。
由特征向量组成m个新指标:
?Z1?C11X1?C12X2???C1mXm?Z?CX?CX???CXm ????Zm?Cm1X1?Cm2X2???CmmXm
由线性代数的知识我们可知主成分的如下特征:
各特征向量之间互不相关,那么主成分也是互不相关的。
全部m个成分所反映的n例样本的总信息等于m个原变量的总信息。 第j个主成分的贡献率是
?i
??
k?1
p
?i?1,2,?,p?。
k
前面P个成分的累计贡献率是
????
k?1k?1p
i
k
?i?1,2,?,p?。
k
选取累计贡献率已经达到85%以上的特征值??1=,??2= ,??3= ,….作为主成分。计算各变量x1,x2,……,x9在各主成分上的载荷得到主成分载荷矩阵
因子分析
计算原始数据的相关矩阵,若相关矩阵的大部分系数都小于0.3,则不适合进行因子分析。我们只选择有较强相关性的变量作为因子分析的原始变量。
将p个可观测变量????(??=1,2,..,??)标准化得到新变量????(??=1,2,..,??)以消除变量间在数量级和量纲上的不同。
将标准化后的变量表示成m+p个不可观测的随机量???? ?? = 1,2,…,?? ,????(??=1,2…,??)的线性组合,即:
????= ????+????1??1 + ????2??2 +?+ ?????????? +????(?? = 1,2,…,?? ),(1)
其中??称为公共因子,它们的含??(??= 1,2,…,??)对 X 的每个分量都起作用,义要根据具体问题来解释,????(??= 1,2,..,??) 仅与变量????有关,称为特殊因子,系数?????? (??=1,2,..,??,??=1,2,…,??)称为因子载荷,??=(??????)称为载荷矩阵。
为得到载荷矩阵[在这里用主成分法],先求出标准化数据的相关矩阵如下:
??11?12
???2221?R?????
??m1?m2
式中: ?ij??ji,
n
??1m??
???2m??=?
????
??
??mm??
??? ???
?ij??(
k?1
Xki?Xkj
n
)?
?(x
n
ki
?i)(xkj?j)
j=1,2,?,m
前m个因子包含的数据信息总量(即其累积贡献率)为***%gt;80%,故选择??1,??2,…,??并计算其特征值对应的特征向量,得到因子载荷矩??为主因子,阵。
若所得的m个因子无法确定实际含义义或含义不清,为获得较为明确的实际含义,根据因子载荷阵不唯一的性质,用方差最大法[或正交旋转法,或四次方最大法,或等量最大法]对因子载荷阵进行旋转,从而简化因子载荷阵的结构,使载荷矩阵每列或行的元素平方值向0和1两级分化。
用原指标的线性组合,在这里用用回归估计法[或Bartlett估计法,或Thomson估计法]来求各因子得分。
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指
您可能关注的文档
- 【解析版】山东省泰安市新泰一中2014-2015学年高一(下)期中化学试卷解析.doc
- 一路向“羲” 风景这边独好——淮阳羲城中学六大办学特色解析.doc
- 七怪谈结局介绍 七怪谈通关心得攻略.doc
- 一个绚丽的Downloading动效分析与实现.doc
- 一起长圆线圈干式变压器噪声超标问题的分析处理.doc
- 万能材料试验机定期检定中量程误差超标的成因分析.doc
- 三五教育心得体会.doc
- 三五英语教学工作总结.doc
- 三七深度解析之预测: 历史一波三折,未来低谷徘徊.doc
- 七种潜能学生类型分析.doc
- 电力控制系统(PCS)系列:Siemens Siprotec_(4).Siprotec硬件架构与设计.docx
- 分布式能源控制系统(DECS)系列:ABB Ability DCS_14.用户培训与认证.docx
- 水处理控制系统系列:Siemens SITRANS W_(12).通信协议与接口.docx
- 电力控制系统(PCS)系列:GE Multilin_(2).电力控制系统基础知识.docx
- 电力控制系统(PCS)系列:Schneider Electric ION_(2).硬件架构与组件.docx
- 电力控制系统(PCS)系列:Schneider Electric ION_(9).安全性与合规性.docx
- 电力控制系统(PCS)系列:Siemens Siprotec_(10).Siprotec安全性评估与合规性要求.docx
- 分布式能源控制系统(DECS)系列:ABB Ability DCS_7.通信协议与网络设计.docx
- 分布式能源控制系统(DECS)系列:Emerson Ovation_(4).EmersonOvation系统设计与配置.docx
- 水处理控制系统系列:Siemens SITRANS CS Water_(3).SITRANSCSWater系统组成及功能.docx
文档评论(0)