第七章模糊聚类分析课件.pptVIP

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 模糊聚类分析 一、模糊聚类分析 聚类分析:按照一定要求和原则对事物进行分类。 聚类:普通分类——清晰事物 模糊分类——带有模糊性的事物 三种模糊聚类方法: 传递闭包法——基于模糊等价关系; 直接聚类法——基于模糊相似关系; 模糊聚类法——基于模糊划分. 二、模糊聚类分析的步骤 1.选取特征指标 特征要有明确的意义,要有较强的分辨力,有代表性,并确定描述特征的变量。 分类事物的特征指标选择的如何,对分类结果有直接的影响。 2.数据标准化(正规化) 3.标定 4.聚类 三、传递闭包法 1. 传递闭包法 求传递闭包的简便方法 四、基于模糊相似关系的直接聚类法 1.最大树法 五、基于模糊划分的模糊聚类法 1. c-划分 * * 令 其中,xi 为原始数据; 是原始数据的均值; 是原始数据的标准差; 是数据处理后的数据。 设 为待分类的对象,uj有m个刻划其特征的 数据, 就是根据实际情况,按一个准则或某一种方法,给论域U中的元素两两之间都赋以区间[0,1]内的一个数,叫做相似系数。它的大小表征两个元素彼此接近或相似的程度。 ,然后对于 ui与 uj ,用 rij 表示 ui 与 uj 的 当rij=0时,表示ui与uj截然不同; 当rij=1时,表示ui与uj可以等同(不能说是完全相同); rij可根据具体问题来选取。方法有: 的相似程度,要求 (1)数量积法 ,其中 显然 .如果 rij 中出现负值,可采用下面方法 将全体 rij 进行重新调整. 方法1 令 ,则 方法2 令 其中 于是 (2)夹角余弦法 如果rij中出现负值,也可采用上面方法调整. (3)相关系数法 其中 (4)最大最小法 (5)算术平均最小法 (6)几何平均最小法 (8)指数相似系数法 其中 sk 适当选择. (9)绝对值倒数法 M 适当选取使 rij 在 [0,1] 中且分散开 (7)绝对值指数法 (11)非参数法 中正数个数, 中负数个数, 令 则 (10)绝对值减数法 (12)贴近度法 如果特征 则 ui, uj 可看作模糊向量 , 以它们的贴近度 D(ui,uj) 为其相似程度. i) 格贴近度 , 其中 ii) 距离贴近度 其中 c,a 为适当选择参数值,d(ui,uj) 为模糊集各种距离. iii) 算术平均最小贴近度 (13)主观评定法 请有实际经验者直接对 ui,uj 的相似程度评分,作为 rij 的值. 通过标定求出相似系数后,便可得到以 rij 为元素的模糊相似矩阵 R(rij) . 选择一种合适的聚类方法,便可得到分类结果. 根据标定所得模糊矩阵R,求出其传递闭包 为模糊等价矩阵,对 ,令λ从1降到0得到 ,根据 进行分类: 归为一类. 2. 最佳阈值λ的选取 聚类图给出各λ值对应的分类,形成一种动态聚类,便于全面了解元素聚类,然后根据实际需要选择其阈值λ,便可确定元素的一种分类,至于如何选择阈值λ,使分类更加合理,除了凭经验外,还可用 F-统计量来选取. F-统计量: 为待分类事物的全体, 设 xjk 为描述元素 uj 第 k 个特征的数据 .设 c 为 对应于 λ 值的类数,ni 为第 i 类元素的个数,第 i 类元素记为 记 为第 i 类元素的第 k 个特征的平均值, 而称 为第 i 类的聚类中心向量; 为全体元素的中 心向量,而 于是,称 为F-统计量,其中 为第i类中元素 与中心 的距离. 可见,F-统计量的分子表征类与类间的距离,分母表征类内元素间的距离. 因此,F 值越大,说明分类越合理,与此分类相对应的 F-统计量最大的阈值λ为最佳值. 设 为模糊相似矩阵,求 t(A). (1) 求 ,假定 , 把 A 中的 a1m,am1,a11,amm 用圆圈 圈起来,并记 (2) 在 A 中第一行、第 m行中剩下的元素中 找最大元素 , 即 . 且设 在第 p 列. 用 即分别代替 a1p 与 amp 以及它们的对称元素, 最后用圆圈将它们及 圈起来. (3) 假定 A 中有圈的 k 行 是 行. 而 所在的列是 ij 列,在这些行中剩下的元素中 找最大元 并设 在第 l 行,用 分别代替 继续此过程,到 k = n-1,得到 t(A) . 还有逐步平方法: 及其对称矩阵,并把 all 圈起来 聚类原则是:ui与uj在λ水平同类当且仅当在相似矩阵R的图中,存在一条权重不低于λ的路联结ui与uj. 画出以被分类元素为结点,以相似矩阵R的元素 rij 为权重的一颗最大

文档评论(0)

cumhuatgw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档