主成分聚类与熵值法集成评价的研究.docxVIP

主成分聚类与熵值法集成评价的研究.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分聚类与熵值法集成评价的研究 主成分法广泛应用于社会学、经济和管理评价中,逐渐成为一门独特的多指标评价技术。然而,在实践中也存在一些问题。许多研究人员在这些问题上进行了研究,许多研究人员从不同角度分析了问题的原因,并给出了相应的改进方法。例如,陈云和张崇福认为,在应用中,主要成分分析中有两个主要元素的分类顺序。也难以客观地描述主要症状的经济解释,这使得对主要症状的综合评价非常困难。严慈林认为,在综合评价的过程中,主要成分的分类是基于线性分析的。提供了分析非线性的主要元素的方法,并考虑了主要症状的经济意义。雪梅和赵松山从主成分分析和因子分析的差异出发,分析了主成分的综合评价。对于主次成分的综合评价,为了强调同一资源对应于两个方向的对立资源向量,选择不同的资源向量组合可能导致综合评价的结果非常不同。作者认为,要对主成分进行综合评价,必须对主成分进行分类。叶双峰从数据总量分析的标准物质提取方法和主成分的非线性变换理论的评价出发,给出了主成分的优化模型。对于第一主成分的选择和评价模型的限制因素,本研究没有解决。在第一次主要成分的贡献率不达到标准的情况下,仅选择第一主成分进行综合评价,然后选择主要成分的多个主要成分进行综合评价。在上述研究和分析的基础上,本研究提出了:在进行综合评价时,选择第一主成分的得分作为综合评价的平均值,并在第一主成分公式中选择系数较小的评价指标,即第一主成分没有显著贡献的评价指标。然后用抗值法获得综合评价结果,并采用主成分的聚类法。如果两种评价方法不兼容,则采用主成分的聚类法进行评估。 1 主成分分析 1.1 综合指标的线性化 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标.同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息. 设有n个样本, 每个样本共有p个变量, 构成一个n×p阶的样本数据矩阵 X=[x11x12?x1px21x22?x2p???xn1xn2?xnp] 记X的第i个列向量为Xi(i=1, 2, …,p) , 数据矩阵X的p个向量 (即p个指标向量)X1,X2, …,Xp作线性组合 (即综合指标向量) 为: Fi=a1iX1+a2iX2+?+apiXp,i=1,2,?,p 记ai= (a1i,a2i, …,api)T, 为了加以限制则要求组合系数ai·aTi=1,i=1, 2, …,p, 即ai为单位向量且由下列原则确定: 1)Fi,Fj(i≠j,i=1, 2, …,p) 不相关, 即cov (Fi,Fj) =0. 2)F1是X1,X2, …,Xp的一切线性组合 (系数满足上述要求) 中方差最大的, 则称F1是第一主成分.F2是与F1不相关的X1,X2, …,Xp的一切线性组合中方差最大的,F2为第二主成分, 次类推可定义出p个主成分. 这p个主成分从原始指标所提供的信息总量中所提取的信息量依次递减, 每一个主成分所提取的信息量用方差来度量, 且主成分方差的贡献就等于原指标相关矩阵相应的特征值λi, 每一个组合系数ai就是特征值λi的特征向量,Fi的方差贡献率为λi/p∑i=1λi, 方差贡献率越大说明相应的主成分反映综合信息的能力越强. 1.2 均值化矩阵协方差矩阵的主成分分析 根据叶双峰的研究采用数据标准化处理会造成指标信息的丢失, 并采用数据均值化方法进行主成分分析.所谓均值法就是用数据的均值去除原始数据, 即yij=xijˉxj, 其中ˉxj=1nn∑i=1xij,j=1,2,?,p.这样对原始数据矩阵X= (xij)n×p做均值化处理便得到均值化数据阵Y= (yij)n×p.由该均值化矩阵协方差矩阵进行主成分分析.容易推出该协方差矩阵的非主对角线上的元素与用标准化处理所得的协方差矩阵的非主对角线上的元素相同, 也就是说这两种方法均不改变指标之间的相关程度, 而且利用均值处理得到的协方差矩阵的主对角线上的元素为siiˉ(xi)2, 即变异系数的平方.由上可知采用均值化的处理方法没有造成指标变异程度的信息丢失, 同时指标间的相关信息利用程度与用标准化处理的利用程度相同.因此, 我们用均值化方法处理原始数据再做主成分分析. 1.3 评价指标的筛选 计算出第一主成分的表达式F1=α11x1+α21x2+…+αp1xp, 代入数据计算出各样本的第一主成分得分Fi1,Fi1表示第i个样本的第一主成分的评价值.利用第一主成分中的指标系数, 选出对第一主成分贡献较小的指标.根据主成分分析法的数学原理可知第一主成分中的权系数向“高度相关指标子集”中的指标倾斜, 其他的指标的系数将会很小.将系数小的指标筛选出来, 则这些被筛选出来的指标间的相关关系较弱. 2 信息熵与其他指标的关系 熵的概念产生于热力学, 用来描述离子或分子运动的不可逆现象.

文档评论(0)

lczslgy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档