数据挖掘理论2因子分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 厚德载物 自强不息 * 主成分分析法—L矩阵 注意L矩阵的下标,是列在前,行在后 * 厚德载物 自强不息 * 迭代主成分(主因子)分析法 1. 收集原始数据并整理为下表 * 厚德载物 自强不息 * 2.对各指标进行标准化 3.求指标间的相关系数矩阵RX 4.求指标间的约相关系数矩阵R* (1)R*的非对角线元素与相关矩阵RX的 非对角线元素相等 (2)R*的对角线元素为共性方差 * 厚德载物 自强不息 * 5. 求出约关系数矩阵R*所有大于零的特 征值及相应的特征向量 6. 写出因子载荷阵A,得出原始指标X的 公因子表达式 * 厚德载物 自强不息 * 要求: 1. 保留公因子个数q小于指标个数m,原则: ?j≥1 前k个公因子累积贡献率≥70% 2. 各共性方差 接近于1。 3. 各原始指标在同一公因子Fj上的因子载荷 之间的差别应尽可能大。 * * 林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:100米跑( ),跳远( ),铅球( ),跳高( ),400米跑( ),110米跨栏( ),铁饼( ),撑杆跳高( ),标枪( ),1500米跑( )。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型: 其中 表示四个因子,称为公共因子, 称为 在因子 上的载荷, 是 的均值, 是 不能被四个公共因子解释的部分,称之为特殊因子。 * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * 一、主成分法 * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * * 厚德载物 自强不息 * 因子旋转 当各公因子的专业意义难以解释时,可以 通过因子旋转来解决。 如求得的因子载荷阵A不甚理想,可右乘 一个正交阵T,使AT有更好的实际意义, 使各原始指标在同一公因子上 之间 差别尽可能增大。称因子正交旋转。 正交旋转可保持各指标的共性方差不变; 各公因子互不相关。 常用方差最大旋转法等。 * 厚德载物 自强不息 * 假设公因子Fj的解释能力能够以其因子载荷平方的方差来度量,考虑两个因子的平面正交旋转,设因子载荷矩阵为: 正交阵 记 * 厚德载物 自强不息 * 经过旋转要求 两组数据的方差达到最大。 即 * 厚德载物 自强不息 * 将V对φ求导,并令其为零,经过计算,其旋转角度可按下面公式求得 其中 由此就可以得出φ的取值范围。 * 厚德载物 自强不息 * 几点注意 1.因子分析的解不唯一 (1)同一问题可以有不同的因子分析解: 主成分解、主因子解、极大似然解 (2)进行因子旋转以获得更为满意的解。 2.因子得分 不能直接进行计算,但可以估计。 * 厚德载物 自强不息 * 3.主成分分析与因子分析间的关系 (1)两者的分析重点不一致 Z=AX 主成分为原始变量线性组合,重点在综合原始变量信息。 X=AF+e 原始变量为公因子与特殊因子线性组合,公因子重点反映支配原始变量的不可观测的潜在因素。 重要 * 厚德载物 自强不息 * (2)两者之间有密切的关系 因子分析完全能够替代主成分分析,并且 功能更为强大。 主成分分析是一种思想,是一种得到目的 的中间手段,是其它多元统计分析方法的 基础,如因子分析常用主成分法求解。 主成分分析单独应用有其独到之处,如应 用于综合评价与主成分回归时非常实用、 科学。 * 厚德载物 自强不息 * Thank you! * 厚德载物 自强不息 * Thank you! 生物医学研究的统计方法 * 厚德载物 自

文档评论(0)

好文精选 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档