聚类分析的SPSS实现推荐.pptVIP

下载本文档

44
0
约1.07万字
约 89页
2018-03-14 发布于贵州
举报
版权申诉

聚类分析的SPSS实现推荐.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

聚类分析的SPSS实现推荐

用SPSS作聚类分析用SPSS作聚类分析以经济效益数据为例，用聚类分析法对各省市作分类（见spssex-4/全国各省市经济效益数据）以城镇居民消费资料为例，用聚类分析法对各省市作分类（见spssex-4/城镇居民消费支出资料） SPSS中的聚类分析 Spss中的聚类功能常用的有两种：快速聚类（迭代过程）： K-Means Cluster 系统聚类：Hierarchical Cluster 一、Hierarchical Cluster聚类系统聚类由两种方法：分解法和凝聚法。系统聚类的功能：即可进行样品的聚类，也可进行变量的聚类。系统聚类的原理：即我们前面介绍过的系统聚类方法的原理和过程。系统聚类的中要进行以下的选择：数据的标准化测度方法的选择：距离方法的选择或相似性、关联程度的选择。聚类方法的选择：即以什么方法聚类，spss中提供了7中方法可进行选择。输出图形的选择：树形图或冰柱图。系统聚类 Method Statistics 凝聚状态表的第一列表示聚类分析的第几步；第二列、第三列表示本步聚类中哪两个样本或小类聚成一类；第四列是相应的样本距离或小类距离；第五列、第六列表明本步聚类中，参与聚类的是样本还是小类。0表示样本，数字n(非0）表示由第n步聚类产生的小类参与本步聚类；第七列表示本步聚类的结果将在下面聚类的第几步中用到。 Plot 冰柱图因其样子非常象冬天房顶垂下的冰柱得名，它以图形的方式显示层次聚类分析结果，一般从冰柱图的最后一行开始观察，第一列表示类数。两样品之间的“х”表示将其两边的样品(类)联结起来聚成新类。 K-Means Cluster聚类 K-Means Cluster原理首先，选择n个数值型变量参与聚类分析，最后要求的聚类数为k个；其次，由系统选择k个(聚类的类数）观测量（也可由用户指定）作为聚类的种子。第三，按照距离这些类中心的距离最小的原则把所有观测量（样品）分派到各类重心所在的类中去。第四，这样每类中可能由若干个样品，计算每个类中各个变量的均值，以此作为第二次迭代的中心；第五，然后根据这个中心重复第三、第四步，直到中心的迭代标准达到要求时，聚类过程结束。 K-Means Cluster聚类过程由Analyze——Classify ——K-Means Cluster 将个变量放入Variable ；输入最后聚类的个数；快速聚类 Discriminant对话框 Grouping Variable：已知的观测量所属类别的变量（分类变量） Independents：观测量，即参与判别分析的变量。 Use Stepwise method ：当不认为所有自变量都能对观测量特性提供丰富的信息时，使用该选择项。因此根据对判别贡献的大小进行选择。 Enter independent together ：当所有自变量都能对观测量特性提供丰富的信息时，使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析，建立全模型。不需要进一步进行选择。分类变量范围对话框指定判别分析的自变量在主对话框的左面的变量表中选择表明观测量特征的变量，按下面一个箭头按钮，把选中的变量移到“Independents:”下面的矩形框中，作为参与判别分析的变量。 Indepents对话框数据判别分析完成前面四步骤的操作即可使用各种系统默认值对工作数据集的数据进行判别分析了。可以使用的方法有两种： (1)直接运行：在主对话框中按（用鼠标单击）Ok按钮 (2)生成SPSS命令程序后再运行：在主对话框中按Paste按钮，激活Syntax窗，在该窗中按Run按钮执行该语句窗中的程序。无论哪种方法均可在output窗中显示出分析结果。完全使用系统默认值进行判别分析，其结果有时不能令人满意，因此根据以下步骤指定选择项是很有必要的。选择观测量如果希望使用一部分观测量进行判别函数的推导，而且有一个变量的某个值可以作为某些观测量的标识，则用Select功能进行选择。操作方法是，单击“Select”按钮展开小选择框，在“Vaiable：”后面矩形框中输入该变量的变量名，在“Value：”后面输入标识参与分析的观测量所具有的该变量值。一般均使用数据文件中的所有合法观测量。此步骤可以省略。选择分析方法在主对话框中自变量矩形框下面有两个选择项，被选中的方法前面的圆圈中加有黑点。这两个选择项是选择判别分析方法的。（1）Enter independent together 当你认为所