- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章聚类分析
第 8 章 聚类分析
在自然与社会科学研究中,存在着大量分类研究的问题,如病虫害种群消长演替规律 的研究中,需要从生态系统出发,构造其数量、时间和空间关系的分类模式,以此来研 究病虫害的发生规律。聚类分析就是其分类研究的方法之一。
聚类分析是根据事物本身的特性研究个体分类的方法。聚类分析的原则是同一类中 的个体有较大的相似性,不同类中的个体差异很大。
根据分类对象的不同可分为样品聚类和变量聚类。
1)样品聚类
样品聚类在统计学中又称为 Q 型聚类。用 SPSS 的术语来说就是对事件(Cases)进行 聚类,或是说对观测量进行聚类。是根据被观测的对象的各种特征,即反映被观测对象 的特征的各变量值进行分类。
2)变量聚类
变量聚类在统计学又称为 R 型聚类。反映同一事物特点的变量有很多,我们往往根 据所研究的问题选择部分变量对事物的某一方面进行研究。由于人类对客观事物的认识 是有限的,往往难以找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研 究。例如在回归分析中,由于自变量的共线性导致偏回归系数不能真正反映自变量对因 变量的影响等。因此往往先要进行变量聚类,找出彼此独立且有代表性的自变量,而又 不丢失大部分信息。
8.1 快速聚类过程 (K-Means Cluster )
调用此过程可完成由用户指定类别数的大样本资料的逐步聚类分析。所谓逐步聚类 分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。
[例子 8-1]
根据 1962 年至 1988 年积累的三化螟有关资料进行聚类分析,研究三化螟种群消长 规律。数据见表 8-1,其中发生期是指卵盛孵高峰期(2 代以 5 月 31 日和 3 代 7 月 20 日 为零计算天数),F2-F3 为 2 代至 3 代的增殖系数,F3-F4 为 3 代至 4 代的增殖系数。
对幼虫发生量和发生期数据进行快速聚类,分析各年的发生程度。
表 8-1
年份 幼虫发生量 发生期 增殖系数 第 2 代 第 3 代 第 2 代 第 3 代 F2-F3 F3-F4 1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988 344
121
187
500
441
404
328
806
730
263
486
248
2100
333
90
19
230
1392
308
415
34
267
1043
2243
236
558
162 3333
1497
1813
4000
3750
4600
986
1790
1970
333
600
585
2700
287
77
25
2525
1041
41
916
401
803
3500
7452
599
1061
2817 29
27
32
34
36
33
35
32
36
29
32
33
22
38
40
40
39
33
31
36
38
37
39
31
35
33
34 9
19
18
14
14
16
18
15
20
15
19
20
14
19
24
27
20
18
28
18
29
26
26
20
26
24
21 9.69
12.37
9.70
8.00
8.50
11.39
3.01
2.22
2.70
1.27
1.23
2.36
1.28
.86
.86
1.32
10.96
.75
.13
2.21
11.79
3.01
3.36
3.32
2.54
1.90
2.64 1.91
1.34
1.06
1.82
1.87
1.52
1.26
2.14
2.64
1.07
1.47
1.08
1.33
.70
1.87
2.88
.55
4.17
3.34
1.09
.99
.09
.07
.12
.00
.00
.00
8.1.1 操作方法
1)数据准备
在数据管理窗口,定义变量名:年份、幼虫 2、幼虫 3、发生期 2、发生期 3、增殖
23、增殖 34,分别代表年份、第 2 代幼虫发生量、第 3 代幼虫发生量、第 2 代发生期、 第 3 代发生期、F2-F3 增殖系数、F3-F4 增殖系数。其中年份变量为字符变量,其它为数 值变量。然后输入原始数椐。
数据保存在配套光盘中(\SPSS\DATA\DATA8-2.SAV)。
2)启动快速聚类过程
在 SPSS 主菜单中按“Analyze→Classify→K-Means Cluster”顺序逐一单击鼠标键, 打开快速聚类主对话框,如图 8-1 所示。
您可能关注的文档
最近下载
- 标准图集-陕22G03-墙下条形基础.pdf
- 2023年山东省威海市中考语文真题卷(含答案与解析).pdf VIP
- 辩论赛主题-中国是否应该采取更多措施保护野生动物?正反方辩词,一辩、二辩、三辩发言稿.docx
- 2025 入党积极分子发展对象考试题库(含答案).docx VIP
- 青岛版小学五年级数学下册《分数加减法(一)》单元分析.doc VIP
- 2024年山东省威海市中考数学真题(含答案).pdf VIP
- 青岛版(五四制)小学数学四年级下册《分数加减法(一)》单元整体备课.doc VIP
- 湖北省2023年中考地理真题(含答案).pdf VIP
- 2025入党积极分子发展对象考试题库(含答案).docx VIP
- 张家口(2006)SGZ1000-1400型刮板输送机前部使用说明书.pdf
文档评论(0)