- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS回归分析参考
9.3 K-均值聚类 根据组成每一类的观测量计算每个变量的均值,每一类中的n个均值在n维空间中又形成k个点,这就是第二次迭代的类中心。 按照这种方法迭代下去,直到达到指定 的迭代次数或达到中止迭代的判据要求时,迭代就停止了,聚类过程也就结束了。 (3)分析步骤 第1步 指定聚类数目k; 第2步 确定k个初始类中心; 第3步 根据距离最近原则进行分类; 第4步 重新确定k个类中心; 第5步 迭代计算。 9.3 K-均值聚类 9.3.2 SPSS实例分析 【例9-2】测量12名大学生对《高等数学》的心理状况和学习效果,主要包括四个因素:学习动机、学习态度、自我感觉、学习效果,具体数据如下表所示。试将该12名学生分成3类以分析不同心理状况下学生的学习效果。 编号 学习动机 学习态度 自我感觉 学习效果 1 40 80 54 44 2 37 73 56 46 3 43 70 75 58 4 50 77 85 77 5 47 87 89 63 6 67 70 84 69 7 77 37 57 100 8 80 37 73 82 9 83 40 76 96 10 87 43 75 91 11 60 57 70 85 12 70 50 69 90 9.3 K-均值聚类 第1步 分析:由于已知分成3类,故可采用快速分类法。 第2步 数据组织:按如上表的表头所示建立变量,将“编号”变量的数据类型设为字符型(作为标识变量)。 第3步 快速聚类设置,按“分析→分类→K-均值聚类”顺序打开“K-均值聚类分析”对话框,将“学习动机”、“学习态度”、“自我感觉”、“学习效果”四个变量选入“变量”列表框。将“编号”变量移入“个案标记依据”框中;将“聚类数”设为3。 其余“迭代”、“保存” 和“选项”设置参见教材。 9.3 K-均值聚类 第4步 主要结果及分析: 初始聚类中心表 Cluster 1 2 3 学习动机 40 67 77 学习态度 80 70 37 自我感觉 54 84 57 学习效果 44 69 100 迭代历史表 由表可知,第一次迭代后,3个类的中心点分别变化了8.193,9.889和13.472。一共进行了10次迭代,达到聚类结果的要求(达到最大迭代次数),聚类分析结束。 由于没有指定初始聚类中心,列出了由系统指定的类中心。与原数据比较,发现它们分别是第1、第6和第7号个案。 迭代 聚类中心内的更改 1 2 3 1 8.193 9.889 13.472 2 3.909 7.631 4.701 3 1.303 1.526 .672 4 .434 .305 .096 5 .145 .061 .014 6 .048 .012 .002 7 .016 .002 .000 8 .005 .000 3.996E-5 9 .002 9.768E-5 5.709E-6 10 .001 1.954E-5 8.155E-7 a. 迭代已停止,因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 10。初始中心间的最小距离为 48.518。 9.3 K-均值聚类 最终聚类中心表 如第1类的学习动机值为39,学习态度值为77,自我感觉值为55,学习效果值为45。 样本数情况 可看出第1,2,3类中分别含有2,4,6个样本 聚类 1 2 3 学习动机 39 52 76 学习态度 77 76 44 自我感觉 55 83 70 学习效果 45 67 91 聚类 1 2.000 2 4.000 3 6.000 有效 12.000 缺失 .000 9.3 K-均值聚类 分类保存情况 查看数据文件,可看到多出两个变量,分别表示每个个案的具体分类归属和与类中心的距离。 主要内容 9.1 聚类与判别分析概述 9.2 二阶聚类 9.3 K-均值聚类 9.4 系统聚类 9.5 判别分析 9.4 系统聚类 9.4.1 基本概念与统计原理 (1)基本概念 系统聚类是效果最好且经常使用的方法之一,国内外对它进行了深入的研究,系统聚类在聚类过程中是按一定层次进行的。具体分成两种,分别是Q型聚类和R型聚类,Q型聚类是对样本(个案)进行的分类,它将具有共同特点的个案聚集在一起,以便对不同类的样本进行分析;R型聚类是对变量进行的聚类,它使具有共同特征的变量聚在一起,以便对不同类的变量进行分析。 9.4 系统聚类 9.4.1 基本概念与统计原理 (2) 统计原理 系统聚类是根据个案或变量之间的亲疏程度,将最相似的对象聚集在一起。根据系统聚类过程的不同,又分为凝聚法和分解法两种。凝聚法的原理是将参与聚类的每个个案(或变量)视为一类,根据两类之间的距离或相似性,逐步合并直到合并为一个大类为止;分解法的原理是将所有个案(或变量)都视
文档评论(0)