主成分分析—-2.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析—-2

;第五章 主成分分析 (principal component analysis);主成分分析 主成分回归;问题来源 在处理多变量问题时,由于变量太多, 变量之间往往存在着一定的相关性,。。。 一种解决的思想:降低变量个数,即用少数综合变量 代替原来变量的信息,综合变量之间互不相关。;是将原来p个指标线性组合,作为新的综合指标,分别记为F1,F2,…,而这些新的线性组合必须满足: F1尽可能的反映原来指标的信息(经典的方法是用方差来表达信息,即选取使var(F1)最大的线性组合)称F1为第一主成分. 如果F1不足以代表原来p个指标的信息,再选取第二个线性组合即F2,同时要求F1已包含的信息不需要再出现在F2中(数学上表示为cov(F1, F2)=0). 称F2为第二主成分.;三 数学模型;满足;四 几何解释;举例说明:P=2, 有n个样本点. 在变量xl和x2 所确定的二维平面中,n个样本点的散布情况如椭圆状(见图). 由图可以看出n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl 的方差和x2 的方差表示。 如果只考虑xl和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。; 如果取椭圆长轴和短轴方向取为Fl和F2,即相当于平面上的坐标变换:即将xl 轴和x2轴先平移,再按逆时针方向旋转?角度,则新老坐标有以下关系:;从图上可看出: n个样本点的波动大部分可以归结为在Fl方向上的波动,即Fl的方差最大。 变量Fl代表了原始数据的绝大部分信息,F2方向的波动不大. Fl,F2具有不相关的性质. 如果椭圆是相当扁平的(x1,x2相关性越强),可以只考虑Fl方向上的波动,F2可以忽略不计.;?;?;?;五 主成分的推导及性质;设X的协方差阵为 ;其中?1,…,?p为Σx的特征根,不妨假设?1? ?2 ? … ??p .而U是由特征根对应的特征向量组成的正交阵。;设有P维正交向量; 当且仅当a1 =u1时,即 时, Var(F1)=U’1?xU1=?1.即F1有最大方差.(即第一主成分 是以特征向量为系数的组合,其方差就是对应的特 征值). ;2. 第二主成分; 类推可以得到第三,第四主成分: ;主成分的性质;3.精度分析 ;4. 原始变量与主成分之间的相关系数; 可见, 和 相关的密切程度取决于对应线性组合系数的大小。;夷韩歧函园耍斑骗计屋侈岛乙豫输铀焦荷欢彼界识榆鸭拍荚椒旱过氦讯貌主成分分析—2主成分分析—2;五. 原始变量被主成分的提取率 ; 如果有m个主成分,则第i 原始变量信息的被提取率为:; 例 设 的协方差矩阵为 ;; 定义:如果一个主成分仅仅对某一个原始变量有作用,则称为特殊成分。 如果一个主成分对所有的原始变量都起作用称为公共成分。 (该题无公共因子);六 主成分分析的步骤 ; 第二步:求出分别所对应的特征向量U1,U2,…,Up, ; 2.基于相关系数矩阵(标准化变量的主成分) 如果变量有不同的量纲,则必须基于相关系数矩阵进行主成分分析。不同的是计算得分时应采用标准化后的数据。(标准化变量的协方差矩阵就是原始变量的相关系数矩阵); 例一 应收账款是指企业因对外销售产品、材料、提供劳务及其它原因,应向购货单位或接受劳务的单位收取的款项,包括应收销货款、其它应收款和应收票据等。出于扩大销售的竞争需要,企业不得不以赊销或其它优惠的方式招揽顾客,由于销售和收款的时间差,于是产生了应收款项。应收款赊销的效果的好坏,不仅依赖于企业的信用政策,还依赖于顾客的信用程度。由此,评价顾客的信用等级,了解顾客的综合信用程度,做到“知己知彼,百战不殆”,对加强企业的应收账款管理大有帮助。某企业为了了解其客户的信用程度,采用西方银行信用评估常用的5C方法,5C的目的是说明顾客违约的可能性。 ; 1、品格(用X1表示),指顾客的信誉,履行偿还义务的可能性。企业可以通过过去的付款记录得到此项。 2、能力(用X2表示),指顾客的偿还能力。即其流动资产的数量和质量以及流动负载的比率。顾客的流动资产越多,其转化为现金支付款项的能力越强。同时,还应注意顾客流动资产的质量,看其是否会出现存货过多过时质量下降,影响其变现能力和支付能力。 3、资本(用X3表示),指顾客的财务势力和财务状况,表明顾客可能偿还债务的背景。 4、附带的担保品(用X4表示),指借款人以容易出售的资产做抵押。 5、环境条件(用X5表示),指企业的外部因素,即指非企业本身

文档评论(0)

xxj1658888 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档