同济医学院-《医学多元统计》课件-主成份_因子分析.pptVIP

同济医学院-《医学多元统计》课件-主成份_因子分析.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
同济医学院-《医学多元统计》课件-主成份_因子分析

主成份分析;常常遇到的问题;何为主成份?;如何去寻找主成份呢?;; ;在所有形如上面的线性变换中,选取这样的线性变换,它使Y1具有最大方差, Y2次之, …,依此类推,即方差的大小顺序是V(Y1)≥V(Y2)≥…≥V(YP),且Y1,Y2,…,YP彼此独立(互不相关)。 这样得到的Y1,Y2,…,YP分别叫做指标变量X的第一,第二,…,第P主成分(principel component)。 有P个原指标变量,相应的就应该有P个主成分,但只有前面的m个主成分具有实际的解释意义,将具体讨论m的确是方法。 由于Y是X的线性变换(即线性组合),所以Yi (i=1,2,…,P)都是X的一个综合指标。;Lagrange 条件极值: V(Y k)= ?k -----R的第k个特征根 ----- ?j 对应的特征向量 ;主成分分析的计算步骤 ;主成分的贡献率与主成分的个数 ; 如果是通过相关矩阵R求主成分,则主成分的贡献率的计算尤为简单: ηi =?i / p 显然有 = 1,即全部主成分对X “总方差”的贡献率率为100%。 ; 2. 累积贡献率; 3. 主成分个数m的确定;因子分析 factor analysis; 1. 因子(factor) : 进行多指标变量(因素)研究时,尽管各指标之间的关系错综复杂,但都可以概括为两个方面。一方面是所有指标(变量)各自都表现出一定的相对独立性;另一方面,它们又表现出一定的相互关联性。对于前者,可以看作为事物“个体特性”的反映;对于后者,则可认为是构成该事物的所有特征的共性反映。共性的背后有一个共同的东西在支配这些指标,使之表现为不同的方式组合,体现出共同的作用。 ;例如,人的收缩血压和舒张血压这两个指标一方面表现出各自的独立性,各自的测量值不同,意义不同。然而,收缩压与舒张压又总是密切相关的,其根本原因在于收缩压和舒张压二者都是受心脏血管系统支配的。心血管系统既要求收缩压和舒张压对心血管的正常活动分担不同的任务,同时又要求二者密切配合,共同为心血管系统的正常功能服务。反过来,假设我们还不知道收缩压和舒张压是受心血管系统的控制。现在,通过医学研究,测得n个个体的收缩压和舒张压,得到了一系列研究数据。问题在于可否通过对这些数据的统计学分析,找出影响这两个血压的“共性”来,即我们称之为因子的东西。 ;2. 因子分析;因子分析的数学模型;   若记Xi*=ai1f1+ai2f2+…+aimfm,则Xi*为Xi的共性部分,系数aij则表示Xi在因子fj上的载荷(负荷),又叫做因子载荷。也有人把aij叫权重系数,其大小表明Xi依赖fj的程度。而矩阵A=(aij)pxm则称为因子载荷矩阵。Ui表示Xi的独立部分,又称为独立因子。Ci为Xi在Ui上的负荷。 ;   所谓因子分析,就是从可以测量的变量(X1,X2,…,XP)的样本观察值,即研究获得的数据资料中,求出因子载荷矩阵A;再运用求出的因子和因子载荷矩阵来预测公因子(f1,f2,…,fm)。;在进行因子分析时,为了消去变量量纲的影响,常常将变量观察结果首先进行标准化处理。如果把标准化处理后的结果仍然记为(X1,X2,…,XP),则有E(Xi)=0,V(Xi)=1。如果运用标准化的数据进行分析,所得的结果包括共性因子和独立因子也都是标准化的了,即有E(fj)=0,V(fj)=1,E(Ui)=0,V(Ui)=1。 ; 进行因子分析有四个任务:①估计出载荷矩阵A;②确定共性因子个数m;③确定有实际意义的载荷矩阵B;④计算因子得分。 ; 1. 因子载荷aij的意义       Xi=ai1f1+ai2f2+…+aimfm + CiUi 那么,第i个变量Xi与第j个因子fj的协方差便为:      r xifi=…=aij    因子f1,f2,…,fm的系数ai1,ai2,…,aim是用来度量变量Xi可用f1,f2,…,fm线性组合表达的程度的。也就是说,因子载荷aij反映了Xi依赖fj 的程度,常常把aij叫做权重。;2. 变量共同度的统计意义; V(Xi)=共性方差Hi 2 +剩余方差 Ci 2 显然Hi 2大则Ci 2必减少,故Hi 2的大小表明了Xi对于f1,f2,…,fm的共同依赖程度之大小,这是为什么我们称Hi 2为Xi的共同度的原因。;3. 公因子fj方差贡献的统计意义;因子载荷矩阵A的求法; R=AA+?

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档