- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三主成分 中的 应在, 的条件下,使 达到最大。 主成分定义 称线性组合 为 x1, x2,…, xp 的第 j 个主成分 其系数向量 应满足如下条件: 1、正则条件: 2、正交条件: 3、最大方差条件: 使 达到最大 4、主成分的方差依次递减: 由定义可知,要确定 m 个主成分实际上就是要确定 m 个 p 维向量 引 理 设A是n 阶对称阵, 其特征根为 , 对应的单位化特征向量为 则 且当 时,二次型 达到上确界。 求 法 由引理可知,求主成分便是求相关系数矩阵 R 的特征根及对应的单位化特征向量。 主成分在几何图形中的方向就是 R 的特征向量的方向 问 题 引入主成分的目的是为了减少指标的个数,那么 m 取多大? 样本主成分y1, y2,…, yp的协方差阵为Λ 性质1 性质2 由性质1和性质2可知, p个主成分所反映的数据总差异等于原指标所反映的数据总差异。 协方差矩阵Λ的对角线上的元素之和等于特征根之和 贡献率和累计贡献率 为第 j 个主成分 yj 的贡献率 为前m个主成分y1 , y2,…,ym的累计贡献率 选取m的标准: 根据问题的性质和要求,可选取 m 使累计贡献率达到70%~90%。即只要用前 m 个主成分就可以基本反映个体间的差异,从而达到减少指标的目的。 主成分的表述形式 若从原p个指标提取了m个主成分,则 第 j 个主成分 第 i 个分量(第 i 个原指标) 如何对主成分作出解释? 这里借助于原指标 xj 关于主成分y1, y2,…, ym 的回归作某些解释。 xj 关于y1, y2,…, ym 的回归方程 性质3 回归系数 回归平方和 残差平方和 复相关系数 贡献率和负荷量 m 个主成分y1, y2,…,ym对指标 xj 的贡献率。 反映了 m 个主成分所能反映指标 xj 差异的比例。 贡献率: 负荷量: 在主成分 yi 上指标 xj 的负荷量 原指标 xj 与主成分yi 的相关系数 反映了原指标 xj 与主成分 yi 的关系的密切程度,它为对主成分的解释提供了一定的依据。 主成分分析需要注意的主要问题 原始数据大部分变量的相关系数较大,主成分分析会取得较好效果 基于相关系数矩阵还是基于协方差矩阵做主成分分析 没有定论,建议都试一下,分析结果的差别及发生明显差异的原因何在 一般而言,当分析中所选择的变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。否则,基于协方差阵做主成分分析效果更好。 选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。 如何解释主成分所包含的经济意义。 应 用 聚类分析 判别分析 回归分析 先根据累计贡献率选择主成分的个数,进行主成分分析,得 到因子得分,即得到每个样品的主成分值,然后再做相应的 统计分析 主成分回归 所谓主成分回归是根据累计贡献率的要求,选p个自变量的m个主成分,然后建立因变量y关于这m个主成分的回归方程。 主成分回归的主要步骤 计算相关系数矩阵 观察是否存在多重共线性现象(变量之间相关系数较高),若存在,则进行主成分分析 根据累计贡献率选择主成分的个数 计算主成分得分( zy 1, zy 2 ,…) 对数据进行标准化(zx1, zx2,…, zy) 建立zy关于zy 1, zy 2 ,…的回归方程 还原成y关于x1, x2, … xp的回归方程 * 解释y的方差为l’Rl,其迹也相等,等于R的迹,即为p 主成分分析Principal Components 本章主要内容 前言 主成分的几何解释 主成分的数学模型 样本主成分的求解及其性质 主成分分析的进一步应用 例子(1) 一个人的身材需要用多项指标完整描述:身高、体重、臂长、腿长、肩宽、胸围、腰围、臀围等,但人们购买衣服时一般只用身高和肥瘦两个综合指标就够了 例子(2) 一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息、外贸平衡等等。 在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰
您可能关注的文档
- 《财务分析》课件第二章 财务分析信息基础.ppt
- 《财务分析》课件第五章 所有者权益变动表分析.ppt
- 《财务管理》课件第2章 财务报表分析.ppt
- 《财务管理》课件第5章 投资决策与风险分析.ppt
- 《财务管理》课件第7章 杠杆效应与资本结构.ppt
- 《财务管理》课件第11章 财务预测与短期融资计划.ppt
- 《采油工程》课件第四章.ppt
- 《操作系统》课件第7章 文件系统.ppt
- 《产业经济学》课件第3章 市场集中度.ppt
- 《产业经济学》课件第4章 进入与退出壁垒.ppt
- web business analysis《网络业务分析》(英文版)Lecture1 TextIntro.pptx
- web business analysis《网络业务分析》(英文版)Lecture2 Text Representation.pptx
- 可见光助铁取代杂多酸降解印染废水.ppt
- 山大《医学免疫学》课件 第二章 抗原.pptx
- 2014年山东省菏泽市中考生物试题及参考答案.pdf
- 2014年山东省菏泽市中考物理试卷及参考答案.pdf
- 2014年山东省菏泽市中考物理试题及参考答案.pdf
- 2014年山东省济南市中考物理试卷及参考答案.pdf
- 2014年山东省济宁市中考物理试题及参考答案.pdf
- 2014年山东省聊城市中考化学答案.pdf
最近下载
- 2024年北京市人力资源市场薪酬状况白皮书.pptx
- 2025年融资租赁行业资产质量提升与环保产业业务拓展研究报告.docx
- 印尼法律须知.pdf VIP
- 2023年深圳市育才中学新高一分班考试物理模拟试卷及答案解析.pdf VIP
- 16G908-3 建筑工程施工质量常见问题预防措施(装饰装修工程)(OCR).pdf VIP
- 2025年滨州市中考英语试题卷(含答案逐题解析).docx
- 旋转蒸发仪设备确认方案.pdf VIP
- 化工园区安全.pptx VIP
- SAE ARP4754B-2023 (R) Guidelines for Development of Civil Aircraft and Systems 民用航空器和系统开发指南.pdf
- 未来产品研发路线图.pptx VIP
文档评论(0)