第7章主成分.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章主成分

第7章 主成分分析(PCA) principal component analysis 主成分分析的基本思想 (以两个变量为例) 主成分分析的基本思想 (多维变量) 主成分分析的数学模型 1 计算步骤 (1)对原变量的样本数据矩阵进行标准化变换 1 计算步骤 1 计算步骤 方法一: 利用SPSS进行主成分分析 SPSS没有提供主成分分析的专用功能,只有因子分析的功能。但是因子分析和主成分分析有着密切的联系。因子分析的重要步骤——因子的提取最常用的方法就是“主成分法”。利用因子分析的结果,可以很容易地实现主成分分析。具体来讲,就是利用成分矩阵(因子载荷阵)和相关系数矩阵的特征根来计算特征向量。即: 其中,aij为第j个特征向量的第i个元素;tij为因子载荷阵第i行第j列的元素;λj为第j个主成分对应的特征根。然后再利用计算出的特征向量来计算主成分。 主成分分析 某市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是: X1:年末固定资产净值,单位:万元; X2:职工人数据,单位:人; X3:工业总产值,单位:万元; X4:全员劳动生产率,单位:元/人年; X5:百元固定资产原值实现产值,单位:元; X6:资金利税率,单位:%; X7:标准燃料消费量,单位:吨; X8:能源利用效果,单位:万元/吨。 (一)利用SPSS进行因子分析 将原始数据输入SPSS数据编辑窗口,将5个变量分别命名为X1~X5。在SPSS窗口中选择分析→降维→因子分析菜单项,调出因子分析主界面,并将变量X1~X5移入变量框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程 (二)利用因子分析结果进行主成分分析 1. 将成分矩阵中的数据输入SPSS数据编辑窗口,分别命名为t1和t2。 2. 计算第一个特征向量,点击菜单项中的转换→计算变量,调出对话框,在对话框中输入等式 a1=t1 / SQRT(3.105) 点击OK按钮,即可在数据编辑窗口中得到以a1为变量名的第一特征向量。 同样方法可以得到以a2为变量名第二特征向量。 7.4主成分的应用之 二——聚类 综合评价:如何选择评价指标体系? 如何对这些指标进行综合? 指标权重如何更加客观? 主成分根据样本数据提供的信息计算指标的权重,客观加权,可以避免综合评价者的主观影响,在实际应用中越来越受到人们的重视。 如何确定权重? 将主成分的权数根据方差贡献率来确定,因为方差贡献率反映了各个主成分的信息含量多少。 主成分综合评价实例 某市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是: X1:年末固定资产净值,单位:万元; X2:职工人数据,单位:人; X3:工业总产值,单位:万元; X4:全员劳动生产率,单位:元/人年; X5:百元固定资产原值实现产值,单位:元; X6:资金利税率,单位:%; X7:标准燃料消费量,单位:吨; X8:能源利用效果,单位:万元/吨。 计算这些指标的主成分,然后通过主成分的大小进行排序 利用主成分得分进行综合评价时,从特征向量我们可以写出所有8个主成分的具体形式: 以特征根为权,对8个主成分进行加权综合,得出各工业部门的综合得分,具体数据见表。 综合得分的计算公式是: 计算出各工业部门的综合得分,并可据此排序。 特征根和方差贡献率表 。 利用第一、二个主成分进行分类 若第一、二个主成分的 累积贡献率 , 则由第一、二个主成分在平面上 的散点图,实现对样品进行分类 7.4主成分的应用之 三——综合评价 某市工业部门13个行业8项指标 如何从这些经济指标出发,对各工业部门进行综合评价 与排序? Z1 Z1 Z1 Z1 特征根和累计贡献率 特征向量 各行业主成分得分及排序 从上表可以看出,机器行业在该地区的综合评价排在第一, 原始数据也反映出机器行业存在明显的规模优势,另外从 前两个主成分得分上看,该行业也排在第一位,同样存在 效益优势;而排在最后三位的分别是皮革行业、电力行业 和煤炭行业。 7.1 主成分分析的基本思想 7.2 样本主成分的计算过程 7.3 选择主成分的方法 7.4 主成分的应用 背景:一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。 在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原1

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档