- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9.3 K-均值聚类 第4步 主要结果及分析: 初始聚类中心表 Cluster 1 2 3 学习动机 40 67 77 学习态度 80 70 37 自我感觉 54 84 57 学习效果 44 69 100 迭代历史表 由表可知,第一次迭代后,3个类的中心点分别变化了8.193,9.889和13.472。一共进行了10次迭代,达到聚类结果的要求(达到最大迭代次数),聚类分析结束。 由于没有指定初始聚类中心,列出了由系统指定的类中心。与原数据比较,发现它们分别是第1、第6和第7号个案。 迭代 聚类中心内的更改 1 2 3 1 8.193 9.889 13.472 2 3.909 7.631 4.701 3 1.303 1.526 .672 4 .434 .305 .096 5 .145 .061 .014 6 .048 .012 .002 7 .016 .002 .000 8 .005 .000 3.996E-5 9 .002 9.768E-5 5.709E-6 10 .001 1.954E-5 8.155E-7 a. 迭代已停止,因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 10。初始中心间的最小距离为 48.518。 9.3 K-均值聚类 最终聚类中心表 如第1类的学习动机值为39,学习态度值为77,自我感觉值为55,学习效果值为45。 样本数情况 可看出第1,2,3类中分别含有2,4,6个样本 聚类 1 2 3 学习动机 39 52 76 学习态度 77 76 44 自我感觉 55 83 70 学习效果 45 67 91 聚类 1 2.000 2 4.000 3 6.000 有效 12.000 缺失 .000 9.3 K-均值聚类 分类保存情况 查看数据文件,可看到多出两个变量,分别表示每个个案的具体分类归属和与类中心的距离。 主要内容 9.1 聚类与判别分析概述 9.2 二阶聚类 9.3 K-均值聚类 9.4 系统聚类 9.5 判别分析 9.4 系统聚类 9.4.1 基本概念与统计原理 (1)基本概念 系统聚类是效果最好且经常使用的方法之一,国内外对它进行了深入的研究,系统聚类在聚类过程中是按一定层次进行的。具体分成两种,分别是Q型聚类和R型聚类,Q型聚类是对样本(个案)进行的分类,它将具有共同特点的个案聚集在一起,以便对不同类的样本进行分析;R型聚类是对变量进行的聚类,它使具有共同特征的变量聚在一起,以便对不同类的变量进行分析。 9.4 系统聚类 9.4.1 基本概念与统计原理 (2) 统计原理 系统聚类是根据个案或变量之间的亲疏程度,将最相似的对象聚集在一起。根据系统聚类过程的不同,又分为凝聚法和分解法两种。凝聚法的原理是将参与聚类的每个个案(或变量)视为一类,根据两类之间的距离或相似性,逐步合并直到合并为一个大类为止;分解法的原理是将所有个案(或变量)都视为一类,然后根据距离和相似性逐层分解,直到参与聚类的每个个案(或变量)自成一类为止。 在层次聚类中,度量数据之间的亲疏程度是极为关键的。在衡量样本与样本之间的距离时,一般使用的距离有Eulcidean Distance、Squared Euclidean Distance、切比雪夫距离、Block距离、明可斯基距离(Minkowshi)、夹角余弦(Cosine)等。 9.4 系统聚类 9.4.1 基本概念与统计原理 (2) 统计原理 衡量样本数据与小类、小类与小类之间亲疏程度的度量方法主要有以下7种: 最短距离法(Nearest Neighbor) ; 最短距离法(Nearest Neighbor) ; 最长距离法(Furthest Neighbor) ; 类间平均链锁法(Between-groups Linkage); 类内平均链锁法(Within-groups Linkage) ; 重心法(Centriod Clustering) ; 中间距离法(Median Clustering); 离差平方和(Ward’s Method)。 9.4 系统聚类 9.4.2 SPSS实现举例 【例9-3】已知29例儿童的血中血红蛋白、钙、镁、铁、锰、铜的含量如下表,试对数据进行变量聚类分析。 order ca mg fe mn cu hemogl order ca mg fe mn cu hemogl 1 54.89 30.86 448.7 0.012 1.01 13.5 16 72.28 40.12 430.8 0 1.2 10.75 2 72.49 42.61 467.3 0.008 1.64 13 17 55.13 33.02
文档评论(0)