第8章聚类分析.doc

下载文档 降价啦

8
0
约1.81万字
约 19页
2017-02-12 发布于重庆
举报
版权申诉
保障服务

第8章聚类分析.doc

1、本文档共19页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第8章聚类分析

第 8 章聚类分析在自然与社会科学研究中,存在着大量分类研究的问题，如病虫害种群消长演替规律的研究中，需要从生态系统出发，构造其数量、时间和空间关系的分类模式，以此来研究病虫害的发生规律。聚类分析就是其分类研究的方法之一。聚类分析是根据事物本身的特性研究个体分类的方法。聚类分析的原则是同一类中的个体有较大的相似性，不同类中的个体差异很大。根据分类对象的不同可分为样品聚类和变量聚类。 1)样品聚类样品聚类在统计学中又称为 Q 型聚类。用 SPSS 的术语来说就是对事件(Cases)进行聚类，或是说对观测量进行聚类。是根据被观测的对象的各种特征，即反映被观测对象的特征的各变量值进行分类。 2)变量聚类变量聚类在统计学又称为 R 型聚类。反映同一事物特点的变量有很多，我们往往根据所研究的问题选择部分变量对事物的某一方面进行研究。由于人类对客观事物的认识是有限的，往往难以找出彼此独立的有代表性的变量，而影响对问题的进一步认识和研究。例如在回归分析中，由于自变量的共线性导致偏回归系数不能真正反映自变量对因变量的影响等。因此往往先要进行变量聚类，找出彼此独立且有代表性的自变量，而又不丢失大部分信息。 8.1 快速聚类过程（K-Means Cluster ）调用此过程可完成由用户指定类别数的大样本资料的逐步聚类分析。所谓逐步聚类分析就是先把被聚对象进行初始分类，然后逐步调整，得到最终分类。 [例子 8-1] 根据 1962 年至 1988 年积累的三化螟有关资料进行聚类分析，研究三化螟种群消长规律。数据见表 8-1，其中发生期是指卵盛孵高峰期（2 代以 5 月 31 日和 3 代 7 月 20 日为零计算天数），F2-F3 为 2 代至 3 代的增殖系数，F3-F4 为 3 代至 4 代的增殖系数。对幼虫发生量和发生期数据进行快速聚类，分析各年的发生程度。表 8-1 年份幼虫发生量发生期增殖系数第 2 代第 3 代第 2 代第 3 代 F2-F3 F3-F4 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 344 121 187 500 441 404 328 806 730 263 486 248 2100 333 90 19 230 1392 308 415 34 267 1043 2243 236 558 162 3333 1497 1813 4000 3750 4600 986 1790 1970 333 600 585 2700 287 77 25 2525 1041 41 916 401 803 3500 7452 599 1061 2817 29 27 32 34 36 33 35 32 36 29 32 33 22 38 40 40 39 33 31 36 38 37 39 31 35 33 34 9 19 18 14 14 16 18 15 20 15 19 20 14 19 24 27 20 18 28 18 29 26 26 20 26 24 21 9.69 12.37 9.70 8.00 8.50 11.39 3.01 2.22 2.70 1.27 1.23 2.36 1.28 .86 .86 1.32 10.96 .75 .13 2.21 11.79 3.01 3.36 3.32 2.54 1.90 2.64 1.91 1.34 1.06 1.82 1.87 1.52 1.26 2.14 2.64 1.07 1.47 1.08 1.33 .70 1.87 2.88 .55 4.17 3.34 1.09 .99 .09 .07 .12 .00 .00 .00 8.1.1 操作方法 1）数据准备在数据管理窗口，定义变量名：年份、幼虫 2、幼虫 3、发生期 2、发生期 3、增殖 23、增殖 34，分别代表年份、第 2 代幼虫发生量、第 3 代幼虫发生量、第 2 代发生期、第 3 代发生期、F2-F3 增殖系数、F3-F4 增殖系数。其中年份变量为字符变量，其它为数值变量。然后输入原始数椐。数据保存在配套光盘中（\SPSS\DATA\DATA8-2.SAV）。 2）启动快速聚类过程在 SPSS 主菜单中按“Analyze→Classify→K-Means Cluster”顺序逐一单击鼠标键，打开快速聚类主对话框，如图 8-1 所示。