基于划分聚类法的文献综述要点.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于划分聚类法的文献综述要点

基于划分聚类法的文献综述 引言 算法 应用 总结 引言 聚类分析是一种重要的无监督学习方法,作为数据分析的工具,其重要性在各个领域都得到了广泛的认可。 目的:是寻找数据集中的“自然分组”,即所谓“簇”。 通俗地讲, 簇是指相似元素的集合,聚类分析就是一个在数据集中寻找相似元素集合的无监督学习过程。 分类:聚类分析的方法可分为基于层次的聚类方法、基于划分的聚类方法、基于模型的聚类方法、基于密度和网格的聚类方法等。本文将介绍基于划分的聚类方法。 本课题简单地阐述了经典 K-modes与快速全局K-means聚类算法的基本思想及算法流程。 k-modes算法采用差异度来代替k-means算法中的距离。k-modes算法中差异度越小,则表示距离越小。一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数,不相同则记为一,最后计算一的总和。这个和就是某个样本到某个聚类中心的差异度。该样本属于差异度最小的聚类中心。 算法 算法 k-means 算法的工作过程说明如下: 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。 缺点:k-means算法只能处理数值型数据,而不能处理分类属性型数据。 经典k-modes算法 K中心聚类算法(KM)能被形式化描述如下: Step 1.初始化 获得最小化 Set t=1. Step 2.获得 最小化 .如果, 那么算法结束;否则,转到Step 3. Step3.获得 最小化 ,如果 = 那么,算法结束;否则,设t=t+1且转到Step 2。 最小化目标函数F; W=[ ]表示对象Xi与第l类的隶属关系;Z是类的中心,它由m个分量构成; d是用于度量对象和类中心之间的相异测度 应用 聚类分析在市场营销客户细分中的应用 ? 市场营销业利用数据挖掘技术进行市场定位和消费分析,辅助制定营销方案。通过对客户数据库不同消费者消费同一类商品或服务的众多不同数据进行聚类分析,争取潜在的客户,制定有利于市场运行的策略。 聚类分析在金融领域中的应用 聚类分析在检验医学方面的应用 聚类分析在图像处理中的应用 总结 这两类聚类算法在一定程度上还存在一定的缺陷,可以尝试把算法应用到具体的实际问题中,扩展应用领域,来检验算法的可行性。同时,意识到各个学科之间的联系及其重要性,每个学科都与生活存在密切的联系,在做项目时,首先需要联系实际生活,切合实际,然后将所学知识运用到生活,在生活中实现其价值。

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档