[数学]35系统聚类分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[数学]35系统聚类分析

§3.5 系统聚类分析 俗话说:“物以类聚,人以群分” 本节内容 *一 聚类分析的基本思想 二 聚类要素的数据变换处理 三 聚类分析的统计量 四 聚类分析方法 一 聚类分析的基本思想 聚类分析又称为簇分析,群分析,它是根据研究对象的特性进行定量分类的一种多元统计方法。 基本思想 我们的研究对象的样品(或变量)之间存在着不同程度的相似性,根据所获得的多个观测指标寻找能度量样本(或变量)之间亲疏远近关系的统计量,然后根据这些统计量把这些样品(或变量)分成若干类。 3 聚类分析的步骤 (1)数据的变换处理 (2)聚类统计量的计算 (3)选择聚类方法 二 聚类要素的数据变换处理 1 标准差标准化 2 极差标准化 3 总和标准化 这种标准化方法所得到的新数据满足: 4 极大值标准化 三 聚类分析的统计量 (一)距离系数 (二)相似系数 (一)距离系数 1 欧氏距离 2 绝对值距离 3 明科夫斯基距离 4 切比雪夫距离 1.欧氏距离 2.绝对值距离 3 明科夫斯基距离 以两变量绝对差值的q次幂之和的q次根为距离: q=1时为绝对距离,q=2时为欧氏距离。 4 切比雪夫距离 (二)相似系数 1.夹角余弦 2.相关系数 (二)相似系数 1.夹角余弦 2.相关系数 29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表:由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。 四 系统聚类方法 1 直接聚类法 2 最短距离法 3 最长距离法 9个农业区之间的绝对值距离矩阵如下 1 直接聚类法 原理 先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的行及与行序相同的列。经过n-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。 2 最短距离法 分别计算G1,G2,G3,G5,G6,G7,G8与G10之间的距离,得到一个新的8×8的距离矩阵。 d1,10=min{d14,d19}= min{2.19,2.62}=2.19 d2,10=min{d24,d29}= min{1.47,1.66}=1.47 d3,10=min{d34,d39}= min{1.23,1.20}=1.20 d5,10=min{d54,d59}= min{4.77,4.84}=4.77 d6,10=min{d64,d69}= min{2.99,3.06}=2.99 d7,10=min{d74,d79}= min{4.06,3.32}=3.32 d8,10=min{d84,d89}= min{1.29,1.40}=1.29 第二步, 在8×8阶距离矩阵中: 分别计算G1,G2,G3,G6,G8,G10与G11之间的距离,得到一个新的7×7的距离矩阵。 d1,11=min{d15,d17}= min{5.86,5.79}=5.79 d2,11=min{d25,d27}= min{6.02,5.53}=5.53 d3,11=min{d35,d37}= min{3.64,2.93}=2.93 d6,11=min{d65,d67}= min{1.78,1.07}=1.07 d8,11=min{d85,d87}= min{5.14,5.03}=5.03 d10,11=min{d10,5,d10,7}= min{4.77,3.32}=3.32 第三步,在7×7阶距离矩阵中: 分别计算G1,G3,G6,G10,G11与G12的距离,可得到一个新的6×6阶距离矩阵。 d1,12=min{d12,d18}= min{1.52,1.32}=1.32 d3,12=min{d32,d38}= min{2.70,2.24}=2.24 d6,12=min{d62,d68}= min{4.46,3.96}=3.96 d10,12=min{d10,2,d10,8}= min{1.47,1.29}=1.29 d11,12=min{d11,2,d11,8}= min{5.53,5.03}=5.03 分别计算G1,G3,G10,G12与G13的距离,可得到一个新的5×5阶距离矩阵。 d1,13=min{d16,d1,11}= min{4.72,5.79}=4.72 d3,13=min{d36,d3,11}= min{1.86,2.93}=1.86

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档