- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分析:本题目可先尝试一般的线性回归模型,但拟合的效果一般,故可尝试主成分回归分析方法 解:首先对各个变量数据进行标准化处理,其次, 建立指标之间的相关系数阵并求出相关阵的特征值分别为: 前2个主成分的累计贡献率在99%以上,故取2个主成分( 表示xi的标准化变量): 由主成分回归得到的标准化回归方程为 用原变量表示的回归方程 服务理念中的“点点” ◆理解多一点 真情浓一点 ◆学习勤一点 品质高一点 ◆理由少一点 效率高一点 ◆处理问题灵活点 工作过程用心点 ◆对待同事宽容点 互相协作快乐点 主成分分析 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 问题的提出: 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。 例如,某人要做一件上衣要测量很多尺寸,如身长、袖长、胸围、腰围、肩宽、肩厚等十几项指标,但某服装厂要生产一批新型服装绝不可能把尺寸的型号分得过多 ?而是从多种指标中综合成几个少数的综合指标,做为分类的型号,利用主成分分析将十几项指标综合成3项指标,一项是反映长度的指标,一项是反映胖瘦的指标,一项是反映特体的指标。 一、主成分分析的基本原理 假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵 (1.1) 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。 定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标 (1.2) 系数lij的确定原则: ① zi与zj(i≠j;i,j=1,2,…,m)相互无关; ② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。 二、主成分分析的计算步骤 设有 n 个样品,每个样品观测 p 个指标,将原始数据写成矩阵 1.将原始数据标准化。这里不妨设上边矩阵已标准化了。 2.建立变量的相关系数阵: 3.求R的特征根 及相应的单位特征向量: 4.写出主成分 计算主成分贡献率及累计贡献率 贡献率 累计贡献率 一般取累计贡献率达85%~95%的特征值 所对应的第1、第2、…、第m(m≤p)个主成分。 三、 实例演示 例 对全国30个省市自治区经济发展基本情况的八项指标作主成分分析,原始数据如下: 第一步 将原始数据标准化。 第二步 建立指标之间的相关系数阵R如下 第三步 求R的特征值和特征向量。 从上表看,前3个特征值累计贡献率已达89.564%,说明前3个主成分基本包含了全部指标具有的信息,我们取前3个特征值,并计算出相应的特征向量: 因而前三个主成分为: 第一主成分: 第二主成分: 第三主成分: 在第一主成分的表达式中第一、二、三项指标的系数较大,这三个指标起主要作用,我们可以把第一王成分看成是由国内生产总值、固定资产投资和居民消费水平所该划的反映经济发展状况的综合
文档评论(0)