(5.2.1)--3.1 主成分分析——投资效益分析.doc

(5.2.1)--3.1 主成分分析——投资效益分析.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

脚本-数据建模中的统计模型——多元统计分析

(PPT1,PPT2)同学,你好,今天我们介绍数据建模中的统计模型——多元统计分析。

(PPT3)(动画1)多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。(动画2)主要内容包括(动画3)主成分分析、(动画4)因子分析、(动画5)聚类分析、(动画6)相关性分析和(动画7)回归分析。

(PPT4)(动画1-3)下面,我们先介绍主成分分析

由模型背景、数学模型、模型建立步骤、案例分析和模型应用5个部分构成。

(PPT5)(动画1)首先我们来讲一下模型背景

(PPT6)(动画1)现在有一门非常热门的技术——人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术,其常见应用场景有(动画2)手机的屏幕解锁、(动画3)刷脸取件等等。一般来说,人脸识别系统包括人脸图像采集、人脸图像预处理、人脸图像特征提取和人脸图像匹配与识别。我们知道,人脸的不同主要体现在几个主要特征上,很多的输入像素在识别人脸时实际所起的作用并不大,这就是主成分分析的一个思想。

(PPT7)(动画1)概括来说,在研究实际问题时,往往需要涉及多个变量,而通常多个变量间存在较强的相关关系,即这些变量间存在较多的信息重复,假如直接利用它们进行分析,不但模型复杂,还会因为变量间存在多重共线性而引起较大的误差。

(动画2)主成分分析,就是用较少的新变量代替原来较多的旧变量,但同时这种代替仍可以反映原来多个变量的大部分信息。

(PPT8)(动画1)接下来,我们来介绍第2部分,主成分分析的数学模型描述。

(PPT9)(动画1)主成分分析(简写为PCA),是一种数学降维的方法。

(动画2)该方法通过构造原变量的一系列线性组合形成一组新的互不相关的变量,使这些新变量尽可能多地反映原变量的信息。

(动画3)这里的“信息”主要由数据变量的方差反映,即方差越大,包含的信息越多。

(PPT10)数学模型具体描述如下:

(动画1)设变量x1,x2,...,x_p经过线性变换后得到新的综合变量y1,y2,...,y_p,即

(动画2)y1=u_11*x1+u_12*x2+...+u_1p*x_p,

y2=u_21*x1+u_22*x2+...+u_2p*x_p,

y_p=u_p1*x1+u_p2*x2+...+u_pp*x_p,

(动画3)满足以下条件:

(动画4)1.新变量的系数向量u_i是单位向量,i=1,...p

(动画5)2.新变量之间线性无关

(动画6)3.新变量的方差单调递减。

称这个数学模型为主成分分析模型,其中(动画7)y1为第一主成分,(动画8)y2为第二主成分,依次下去,(动画9)y_p为第p主成份。从模型可知,要得到主成分分析模型,需做两点:第一点,求主成分的线性变换系数向量,第二点,求主成分的方差。

(PPT11)接下来,通过模型建立步骤,我们介绍解决这两点的方法。

(PPT12)模型建立由以下5个步骤构成:

(动画1)原始数据标准化处理,(动画2,动画3)计算样本相关系数矩阵R,(动画4,动画5)计算相关系数矩阵的特征值和特征向量,根据主成份分析理论,主成分的方差等于相关系数矩阵的特征值,(动画6,动画7)根据累计贡献率选择重要的主成分,(动画8,动画9)计算每个样本的主成分值,并可进一步计算综合得分。

下面我们来一起看每步的具体操作。

(PPT13)第1步.原始数据标准化处理(这一步目的:消除变量在量纲上的的影响。)

(动画1)假设指标变量有p个,共有n个待评价对象,记第i个评价对象的第j个指标为x_ij,构成的指标向量记为x1,x2,...,x_p,将各指标值xij转化成标准化指标值xij’的公式为:

(动画2)xij’=(x_ij-xj指标向量的样本均值)/xj指标向量的样本标准差

(动画3)标准化后的指标向量记为x1’,x2’,...,xp’。

(PPT14)第2步.计算样本相关系数矩阵R

(动画1)样本相关系数矩阵记为R,是一个p*p的方阵。

(动画2)其中元素rij是第i个指标与第j个指标的相关系数,定义为:

(动画3)rij=第i个标准化指标xi’与第j个标准化指标xj’的样本协方差除以它们标准差的乘积。

(PPT15)第3步.计算相关系数矩阵的特征值和特征向量

(动画1)解特征方程|lambda*I-R|=0,求得特征值并按从大到小排列,即lambda1=lambda2=...=lambda_p=0。

(动画2)对应的单位特征向量记为u1,u2,...,u_p,

(动画3)根据主成分分析理论可知,第j主成分的方差等于特征值lambda_j,该主成分的系数向量为lambda_j对应的单位特征向量u_j,即第j主成分

文档评论(0)

158****6446 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档