模糊聚类方法及其在数据分类中应用研究.doc

模糊聚类方法及其在数据分类中应用研究.doc

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模糊聚类方法及其在数据分类中应用研究

模糊聚类方法及其在数据分类中的应用研究 摘 要:本论文主要研究模糊聚类方法在数据分类中的应用,目的是研究并提出数据分类的一种新方法——分段线性隶属度函数确定的密度聚类方法。本论文主要分析研究了现有的数据分类中的几种方法,通过各种理论和实验仿真证明:本文提出的密度聚类方法克服了现有方法的缺点,特别是避免了模糊均值聚类方法结果严重依赖随机生成的初始聚类中心,能够快速得到聚类中心,是一种更简单和实用的方法。 关键字: 模糊 聚类分析 数据分类 模式识别 数据库 Fuzzy clustering method and its application in data classification research Abstract:This paper mainly studies the fuzzy clustering method in data classification, aims to study and put forward data classification -- a new method of piecewise linear membership function to determine the density clustering method. This paper mainly analysis of existing data classification methods through various theoretical and experimental simulation shows: this density clustering method overcomes disadvantages, especially avoid fuzzy mean clustering method the results depend heavily on randomly generated initial clustering center, can quickly obtain the clustering center, is a more simple and practical method. Key Words: Fuzzy; Cluster analysis; Data classification; Pattern recognition; Database; 引言 随着电子技术、计算机技术、通信技术等先进技术的引入,工厂的信息化建设不断增强,工厂每天都会采集到海量的业务数据,包括各类的设计数据、生产监控数据等。想要弄清楚这些数据有什么作用及其数据的分布情况,就必须对数据进行分类。目前大多数人研究的方法有K-平均算法﹑中心点算法等,然而模糊聚类分析则是许多分类和系统建模的基础。聚类的目的是从大量的数据中抽取固有的特征,以获得系统行为的简洁表示。模糊聚类算法可以对样本空间进行模糊分类,目前已在图像处理、语音识别、数据挖掘等领域得到了诸多应用[1,2]。Bezdek提出的模糊c均值聚类(FCM)方法[3]是目前比较成熟的模糊聚类方法,但算法结果严重依赖随机生成的初始聚类中心。本文采用的密度聚类方法较为快速的确定了分段线性隶属度函数,是一种相对简单的方法。 1.模式识别中的模糊聚类的基本理论和方法 1.1模式识别的概念及发展 模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档