- 1、本文档共111页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计分析课件PPT 3 聚类分析
* 中国人民大学六西格玛质量管理研究中心 * §3.7 计算步骤与上机实践 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §3.7 计算步骤与上机实践 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §3.7 计算步骤与上机实践 目录 上页 下页 返回 结束 表3.15是各类的分类系数,由于我们指定分为3类,某个样品在这3类中的某类上系数最大,则将该样品聚为该类。比如第1个样品在第1类的系数最大,说明第1个样品在第1类中。 表3.16是聚类结果。由结果可以看出,与K-均值快速聚类得到的结果是完全一致的。 图3.12是样品的分类图,由图可以看出,各类很明显地被分开。 图3.13是样品的侧影图,类似于水平的冰柱图或者树形图,可以看出三类中,各类包含哪些样品。 我们看到此例中,由模糊聚类得到的结果与K-均值聚类得到的结果是一样的。同时我们应该看到这种分类带有较强的主观性,而且分类结果也比较粗糙。一般仅适合于对大量数据的快速聚类。 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 例3.5 城镇居民消费水平通常用表3.15中的八项指标来描述,八项指标间存在一定的线性相关。为研究城镇居民的消费结构,需将相关性强的指标归并到一起,这实际就是对指标聚类。原始数据列于表3.15。 将原始数据录入SPSS,并依次点击“Analyze”→ “Correlate” →“Bivariate”,打开Bivariate Correlations对话框,把八个变量选入Variables栏中,单击“OK”,得到这八个指标对应的相关系数,列于表3.16。 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 表3.16中最大的相关系数为r4,8=0.837,将G4和G8并成一新类G9,然后计算G9与各类的相关系数,再找最大的相关系数,每次缩小一类得图3-17。 我们可以看出全国城镇居民得消费结构大致可以分为三个方面,一类是各种副食、日用品及交通通信、文化教育和住房等支出,这是在消费结构中起主导作用的方面;其次是居民购买烟、酒、饮料及着装支出;粮食和水电燃料是两项很重要的消费指标,但目前在城镇居民的消费中占的比例较小,可将它们归并为同一类。 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 上面介绍的几种系统聚类方法,并类的原则和步骤基本一致,所不同的是类与类的距离有不同的定义。其实可以把这几种方法统一起来,有利于在计算机上灵活地选择更有意义的谱系图。 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 对例3.5,我们采用欧氏距离分别用类平均法、最短距离法、最长距离法把31个省市分类。 类平均法聚类在SPSS中的操作为:点选“Analyze”→“Classify” →“Hierarchical Cluster”,打开Hierarchical Cluster Analysis对话框,将八个聚类指标选入Variables栏中,将表示地区的变量选入Label Cases By栏中,按“Plots”按钮,在弹出的窗口中选中Dendrogram(谱系图)选项,按“Continue”返回主对话框,在按“Method”按钮,在Cluster Method下拉菜单中选择Between-groups linkage(组间连接法,即类平均法)选项,返回主对话框后按“OK”即可得到聚类结果。 * 中国人民大学六西格玛质量管理研究中心 * §3.8 社会经济案例研究 目录 上页 下页 返回 结束 最短距离法和最长距离法操作步骤与类平均法一样,只不过要在Cluster Method下拉菜单中分别选择Nearest Neighbor和Furthest Neighbor选项。图3.18、图3.19、图3.20分别显示了三种方法的分类结果。为便于对照,将三种方法分类的结果综合列于表3.18。 直观看出,类平均法分为三类:{1,9,11,19}为第一类,{13,2,22,10}为第二类,其他为第三类;最短距离法分为两类,{1,9,11,19}为一类,其余的省市归为一大类;最长距离法也分为三类:{1,9,11,19}为第一类
您可能关注的文档
- 兰溪市江南新区近期建设范围核心地段城市设-中规院.doc
- 关于征求河南省煤田地质局领导班子doc.doc
- 关于提升纳税人税法遵从度的调查与思考.doc
- 关于桐庐县横村镇土地利用总体规划.doc
- 关于湖笔产业发展现状及其对策研究.doc
- 关于税收执法管理信息系统运行问题的探讨.doc
- 关于菊英的出嫁中冥婚现象研究的文献综述.doc
- 关于西柏坡的调查报告.doc
- 关于资兴市建材行业税收征管的调查与思考.doc
- 关于金矿采矿权协议转让公告、转让合同、承诺书、申请书、委托书.doc
- 2025年市国资委党委开展深入贯彻中央八项规定精神学习教育工作方案与开展学习中央八项规定主题教育工作方案(2篇文).docx
- 在2025年市商务局党组研究部署深入贯彻中央八项规定精神学习教育专题会上的讲话稿、教育动员部署会议上的讲话提纲【2篇文】.docx
- 开展2025年学习八项规定主题教育工作方案与领导在局机关深入贯彻八项规定精神学习教育部署会上的讲话稿(两篇文).docx
- 2025年深入贯彻中央八项规定精神学习教育实施方案与全面落实中央八项规定精神情况总结(2篇文).docx
- 2025年落实中央八项规定精神情况总结稿与领导在深入贯彻中央八项规定精神学习教育工作会议的主持讲话稿(2篇文).docx
- 2025年组织部长在八项规定学习教育工作专班座谈会的讲话稿与开展学习中央八项规定主题教育工作方案(两篇文).docx
- 学习2025年深入贯彻中央八项规定精神知识测试题135题【附答案】与全面深入贯彻中央八项规定精神学习教育实施方案.docx
- 2025年县委书记在中央八项规定精神学习教育动员会上的讲话稿遵守党的政治纪律和落实中央八项规定精神情况个人对照检查材料(2篇文).docx
- 2025年在深入贯彻中央八项规定精神学习教育动员部署会上的讲话稿与在市委党的建设工作领导小组会议暨部署深入贯彻中央八项规定精神学习教育专题会讲话稿(两篇文).docx
- 2025年市工业园区党工委开展深入贯彻中央八项规定精神学习教育工作方案与深入贯彻中央八项规定精神学习教育动员部署会讲话提纲【2篇文】.docx
文档评论(0)