- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析matlab理论 实验.ppt
如果你是一个公司的财务经理,掌握公司的所有财务数据,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等。 如果让你在董事会上介绍公司状况,你能够把这些指标和数字原封不动地摆出去吗? 当然不能。 你必须将各个方面进行高度概括,用几个代表指标简单明了地把情况说清楚。 引言 6.5 主成分分析 在处理实际问题中,在很多情况下,不同指标之间可能存在一定的相关性,即变量反映样本的信息有一定重叠。 由于指标较多再加上信息的重叠,势必增加了问题的复杂性。我们希望通过克服相关性、重叠性,用较少的变量代替原来较多的变量,而这些较少变量可以反映原来众多变量的大部分信息,这实际上是一种“降维”的思想。 主成分分析(principal component analysis)是一种通过降维技术将多个变量化为少数几个主成分(即综合变量)的统计分析方法。这些主成分通常表示为原始变量的某种线性组合,能够反映原始变量的绝大部分信息。 一. 什么是主成分分析 一般来说,主成分分析得到的主成分与原始变量间有如下基本关系: 二. 关系 1.每一个主成分都是各原始变量的线性组合 2.主成分的数目大大少于原始变量的数目 3.各主成分之间互不相关 4.主成分保留了原始变量绝大部分信息 主成分分析在几何上是一个坐标变换,在二维空间中有明显的几何意义。 三. 几何解释 假设共有n个样品,每个样品测量两个指标(X1,X2), x1 x2 在坐标系x1Ox2中,这n个点沿x1 和x2方向都有较大的分量,若 仅考虑其中一个分量,包含在另一分量中的信息将会损失,因此直接舍弃某个分量不是“降维”的有效办法。 若将该坐标系按逆时针方向旋转某个角度θ变成新坐标系,变换公式为 y1 y2 x1 x2 记x1,x2,…,xP为原变量指标,z1,z2,…,zm(mp)为新变量指标 ② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP的所有线性组合中方差最大者。 新变量z1,z2,…,zm称为原变量指标x1, x2, …,xP 的第1,第2,…,第m主成分。 系数aij的确定原则: ① zi与zj(i≠j;i,j=1,2,…,m)不相关; 第一主成分提取的信息 最大,称为第一主成分, ∑的特征值 对应的单位正交特征向量 第二主成分提取的信息 次大,…… 前m个主成分共解释的方差贡献即贡献率之和称为累积贡献率。 总方差中属于第i主成分zi(或被zi所解释)的比例称为主成分zi的贡献率。 (1)主成分分析目的是用少的主成分z1,z2,…,zm(mp)代替原来的p个指标,究竟应该选择多少个主成分? 一般来说,实际工作中,要求累积贡献率≥85%,常见的情况是2到3个。 五. 主成分分析中注意的问题 (2) 为使主成分分析能够均等地对待每一个原始变量,消除由于单位的不同可能带来的影响,常将各原始变量作标准化处理,由于经标准化变换后的协方差阵就是相关系数矩阵,因此通常从相关系数矩阵出发进行主成分分析。 (3)计算相关系数阵的特征值 对应的单位正交特征向量 (4)由累积贡献率确定主成分个数m,并写出主成分 实际应用中,主成分分析的具体步骤可归纳为: (1)将原始数据标准化; (2)建立相关系数矩阵; 六. 主成分分析过程 七. 主成分分析的应用 进行综合评价时,如何选择评价指标以及对这些指标进行综合评价?一般做法是通过对各指标加权的办法。 由于主成分分析能从选定的指标体系中归纳出大部分信息,根据主成分提供的信息进行综合评价,不失为一个可行的选择。 1. 综合评价 利用主成分进行综合评价时,对主成分进行加权综合,权数根据其方差贡献率确定 。 本质上,综合评价函数是对原始指标的线性综合,从计算主成分到加权,经过两次线性运算后得到综合评价函数。 将各主成分作为新自变量代替原来自变量做回归分析。用主成分分析筛选变量,可用较少的计算量获得选择最佳变量子集合的效果,并且由于各主成分两两不相关,不存在由于多重共线性带来的影响。 2.主成分回归 3.主成分聚类 主要用于样品的聚类,先构建主成分,再进行聚类。 保留多少主成分取决于保留部分的累计方差
有哪些信誉好的足球投注网站
文档评论(0)