- 1、本文档共64页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
常用建模方法 c. 计算各类之间的距离,得对角线元素全为0的对称阵D; d. 选择D中最小元素,设为 ,则将 与 合并为一类,记为 ; e. 重复3,计算各类间距离,只需计算 到原来除 、 两类外的距离。 f. 重复4,选择最小元素,合并,再重复3,4,直到所有个体合并成一类止。 如果发现D中最小元素不止一个, 则对应这些最小元素的类可以同时合并。 例:设有8个二维向量(点),数据如下: 试用欧氏距离和最短距离法分类。 解:用下列程序可以计算出类与类之间的距离 程序:x=[2 2 4 4 -4 -2 -3 -1]; y=[5 3 4 3 3 2 2 -3]; for i=1:8 for j=i:8 d(i,j)=sqrt((x(i)-x(j))^2+(y(i)-y(j))^2); end, end 得距离矩阵 5.3852 5.0990 6.7082 7.8102 8.6023 6.7082 8.5440 G8 0 1.0000 1.4142 7.0711 7.2801 5.0990 5.8310 G7 0 2.2361 6.0828 6.3246 4.1231 5.0000 G6 0 8.0000 8.0623 6.0000 6.3246 G5 0 1.0000 2.0000 2.8284 G4 0 2.2361 2.2361 G3 0 2.0000 G2 0 G1 G7 G6 G5 G4 G3 G2 G1 从矩阵中看出D(3,4)和D(6,7)最小,因此,将G3和G4合并成新类G9,G6和G7合并成G10; 计算G9和G10到G1,G2,G5,G8的距离,如 D(9,1)=min(D(3,1),D(4,1))=2.2; 同理计算D(9,2)、D(9,5)、…、 D(9,10)=min(D(3,6),D(3,7),D(4,6),D(4,7))=D(4,6)=6.1 6.1 5.1 1.4 4.1 5.0 G10 0 7.8 8.0 2.0 2.2 G9 0 6.7082 6.7082 8.5440 G8 0 6.0000 6.3246 G5 0 2.0 G2 0 G1 G9 G8 G5 G2 G1 最小元素D(5,10)=1.4。将G5和G10合并到新类G11。 6.1 5.1 4.1 5.0 G11 0 7.8 2.0 2.2 G9 0 6.7 8.5 G8 0 2.0 G2 G9 G8 G2 G1 最小元素D(1,2)=D(2,9)=2.0,将G1,G2,G9合并到新类G12。 4.1 6.7 G12 0 5.1 G11 G11 G8 最小元素D(11,12) = 4.1。将G11,G12合并到新类G13。 最小元素D(11,12) = 4.1。将G11,G12合并到新类G13。 5.1 G13 G8 最小元素D(8,13)=5.1。将G8,G13合并到新类G14。至此,聚类完毕。过程如图 分成三大类:G1~G4为一类;G5~G7为一类;而G8为一类。 (2)综合变量法 综合变量法是采用相似系数进行分类 综合变量法是采用相似系数进行分类。 下面通过一个例子,说明综合变量法的方法和步骤。 例:设有5个个体观测数据: , , , , 。将这些数据作聚类分析。 解:(1)将每个个体视为一类. 计算类之间的归类指标,用如下公式计算 并取绝对值作为归类指标,利用下列程序,得数据表r如下: X=[1 -1 1 3 -2 0;1 0 3 -1 -1 0;-1 0 1 2 4 1;0 -1 3 1 -1 -1;-1 2 0 -1 0 1] [m,n]=size(X) for i=1:m for j=1:m r(i,j)=abs(sum(X(i,:).*X(j,:)))/sqrt(sum(X(i,:).^2)*sum(X(j,:).^2)); end end 得结果为 r = 1.0000 0.2165 0.1043 0.6240 0.5669 0.2165 1.0000 0.2408 0.7206 0 0.1043 0.2408 1.0000 0 0 0.6240 0.7206 0 1.0000 0.4193 0.5669 0 0 0.4193 1.0000 (2)将归类指标相似系数最大的两个个体归为一类。 因为表中 最大,故将 归为一类,记为 ,其余的类不变,从而得到4个类 。
文档评论(0)