- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
各省市经济类型聚类分析
各省市经济类型分析 SY0906611 陆启超 摘要 判别分析(Discriminate)和聚类分析(Hierarchical Cluster)是进行统计分类的两种常用方法,本文利用这两种方法对于全国几个省市的按经济类和经济状况进行分类,并制定一定的分类规则(即判别函数),以便对于新加的样品能够按照这些规则进行很快的分类。 一个省市的经济类型和地区生产总值、三种产业在国内生产总值占的比重等因素相关。本文利用统计软件SPSS对全国各省市以上各方面2007年的统计数据进行聚类分析,得到了对各省市经济类型的分类结果,并通过验证三个特殊省份的经济类型,保证结果的正确性。分析结果反映了这些省市的经济类型和经济特点。 关键字: 聚类分析 判别分析 经济类型 MATLAB 引言 中国经济在总体上发展迅速,但是区域发展不平衡的矛盾也日益突出,各地区由于各种因素经济类型呈现出巨大差异。英国经济统计学家C.G.Clark在1940年发表的《经济进步的条件》中,从若干国家经济统计数据中证明了随着经济的发展,人口的就业结构亦将发生相应变化。美国著名经济学家S.Kuznetz又对产业结构与经济发展的关系作了更深入的研究,在《现代经济增长》和《各国经济增长的数量分析》中指出经济的发展也必将引起产值结构的变化。 1聚类分析方法简介 聚类分析的基本思想是,从一批样品的多个观测指标变量中,定义能度量样品间相似程度的统计量,在此基础上求出各个样品之间的相似程度的度量值,按相似程度的大小,将样品逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样品都聚集完毕,把不同类型一一划分出来,形成一个亲疏关系谱系图,用以更加直观的显示分类对象的差异和联系。聚类分析的原则是同一类中的个体有较大的相似性,不同类的个体差异很大。 根据分类对象不同,聚类分析分为样本聚类和变量聚类,即统计学上的Q型聚类和R型聚类。常见的聚类分析方法有快速样本聚类和分层聚类。 快速样本聚类的前提是要已知将要聚成的类数,这样在使用这种聚类法的过程中能够很快的将观测量分到各类中去。 分层聚类方法根据聚类过程不同分为凝聚法和分解法。分解法,就是在聚类开始的时候,把所有个体都视为属于一个大类,然后根据距离和相似性逐层分解,直到参与聚类的每个个体自成一类为止;而凝聚法刚好相反,它是在一开始把参与聚类的每个个体视为一类,根据两类之间的距离或相似性逐步合并,直到合并成一个大类为止。 1.1直接聚类法 先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每次归并,都划去该对象所在的列与列序相同的行。经过没m-1次就可以把全部分类对象归类,这样就可以根据归并的先后顺序作出聚类谱系图。 1.2最短距离聚类法 最短距离聚类法在原来的m×m矩阵的非对角元素中找出,把分类对象Gp和Gq归并为新类Gr,然后按计算公式计算原来原来各类与新类之间的距离,这样就得到一个新的m-1阶的距离矩阵;再从新矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,知道各分类对象被归为一类。 1.3最远距离聚类法 其与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。其使用的是最远距离来衡量样本之间的距离。 2 对各省市经济类型的聚类分析 一个省市的经济类型和众多因素比如地理位置、国民生产总值、人口素质等息息相关,本文利用统计软件,对北京市等省市200年的(亿元)、职工平均工资(元)、第一二三产业的比例作为判别经济类型的五个因素,进行聚类分析南部沿海地区、东部沿海地区、北部沿海地区、东北地区、长江中游地区、黄河中游地区、西南地区、西北地区希望通过这八 大经济区的划分,来进行经济区的统一考虑,加强区域间的联系。 京 9353.32 1695 55844 5.6 21.8 72.5 天 津 5050.40 1176 39990 15.5 40.5 44.0 河 北 13709.50 6989 24276 40.8 32.7 26.5 山 西 5733.35 3411 25489 40.6 26.4 33.0 内蒙古 6091.12 2414 25949 50.5 16.9 32.7 宁 11023.49 4315 27179 33.3 25.5 41.2 吉 林 5284.69 2734 23294 44.7 19.9 35.4 黑龙江 7065.00 3825 21764 46.4 20.5 33.0 海 12188.85 1888 52122
文档评论(0)