- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊聚类分析在数据挖掘中的应用研究.doc
模糊聚类分析在数据挖掘中的应用研究 第32卷第3期 2011年6月 大连大学 J0URNALoFDALIANUNIVERSITY Vl0l_32NO.3 Jun.2011 模糊聚类分析在数据挖掘中的应用研究 王颖洁 (大连大学信息工程学院,辽宁大连116622) 摘要:聚类分析是数据挖掘的一个重要研究领域,按照一定的要求和规律将事物进行分类的一种数学方法.将 模糊数学的模糊理论应用于数据挖掘的聚类分析中,提出一种快速模糊C一均值聚类算法,并给出模糊聚类分析在 数据挖掘中的应用的主要步骤,大大提高计算效率,收敛速度非常快,对大量数据处理是有实际意义的. 关键词:数据挖掘;模糊聚类分析;模糊c一均值算2~-(FCM) 中图分类号:TP311.1文献标识码:A文章编号:1008—2395(2011)03—0001—04 收稿Et期:2011—03—18 作者简介:_:T-~i$(1977—1,女,讲师,Email:yingjiehappy@hotmail.c0m 1引言 近十几年来,人们利用信息技术生产和搜集数 据的能力大幅度提高.千万个数据库被用于商业管 理,政府办公,科学研究和工程开发等等.要想使 数据真正成为一个公司的资源,只有充分利用它为 公司自身的业务决策和战略发展服务才行.否则大 量的数据可能成为包袱,甚至成为垃圾.因此,数 据挖掘和知识发现技术应运而生,并得以蓬勃发展, 越来越显示出其强大的生命力. 数据挖掘就是从大量的,不完全的,有噪声的, 模糊的,随机的数据中,提取隐含在其中的,人们 事先不知道的,但又是潜在有用的信息和知识的过 程.人们把原始数据看作是形成知识的源泉,就像 从矿石中采矿一样.原始数据可以是结构化的,如 关系数据库中的数据,也可以是半结构化的,如文 本,图形,图像数据,甚至是分布在网络上的异构 型数据. 发现知识的方法可以是数学的,也可以是非数 学的;可以是演绎的,也可以是归纳的.挖掘出的 知识可以被用于信息管理,查询优化,决策支持,过 程控制等,还可以用于数据自身的维护.因此,数 据挖掘是一门很广义的交叉学科,涉及人工智能技 术,统计技术与数据库技术等多种技术.它汇聚了 不同领域的研究者,尤其是数据库,人工智能,数 理统计,可视化,并行计算等方面的学者和工程技 术人员. 聚类是数据挖掘中一种重要的挖掘方法,它从 数据库中寻找数据间的相似性,并依此对数据进行 分类,使得不同类中的数据尽可能相异而同一类中 的数据尽可能相似,即物以类聚,从而优化大规 模数据库的查询和发现数据中隐含的有用信息或知 识.聚类分析就是用数学方法研究和处理给定对象 的分类.聚类已经作为一种基本的数据挖掘方法被 广泛地应用于相似有哪些信誉好的足球投注网站,顾客划分,模式识别,趋 势分析等领域中.所有的聚类方法都有其各自特点. 在数据挖掘中,常用的聚类算法主要有以下几种: (1)基于划分的聚类.先创建个划分,为要创 建的划分个数;然后利用一个循环定位技术,通过 将对象从一个划分移到另一个划分来帮助改善划分 质量.. f2)基于层次的聚类.创建一个层次以分解给定 的数据集.该方法可以分为自上而下(分解)和自 下而上(合并)两种操作方式.基于层次的聚类方 法在进行聚类操作时,都假定数据是一次性提供的, 是一种非增量算法,其中单连接,全连接和平均连 接技术的时间和空间复杂性为0f佗0). (3)基于密度的聚类.根据密度完成对象的聚 类,它根据对象周围的密度(~rlDBSCAN)不断增 长聚类.基于密度的聚类方法主要分为两种:一种 是基于高密度连接区域的密度聚类;另一种是基于 密度分布函数的聚类. (4)基于网格的聚类.首先将对象空间划分为有 限个单元以构成网格结构,然后利用网格结构完成 2大连大学第32卷 聚类. (5)基于模型的聚类.它假设每个聚类的模型并 发现适合相应模型的数据.一个基于模型的算法可 能通过构建反映数据点空问分布的密度函数来定位 聚类[1]o 2模糊聚类分析 人以群分,物以类聚,聚类问题是一个古老 的问题,是伴随着人类的产生和发展不断深化的一 个问题. 人类要认识世界就必须区别不同的事物并认识 事物间的相似性.传统的聚类分析是一种硬划分, 它把每个待辨识的对象严格地划分到某个类中,具 有非此即彼的性质,因此这种分类的类别界限是分 明的.而实际上大多数对象并没有严格的属性,它 们在性态和类属方面存在着中介性,适合进行软划 分.Zadeh提出的模糊集理论[2]2为这种软划分提供了 有力的分析工具,人们开始用模糊的方法来处理聚 类问题,并称之为模糊聚类分析.由于模糊聚类得 到了样本属于各个类别的不确定性程度,表达了样 本类属的中介性,即建立起了样本对于类别的不确 定性的描述,能更客观地反映现实世界. 文献[3-5]指出,一个合适的分类应当满足下
您可能关注的文档
最近下载
- 中央空调能量型计费系统(联网计费)设计方案 参考.doc VIP
- 高二【语文(统编版)】逻辑的力量(第八课时)-教学设计.docx VIP
- 智慧图书馆数字资源建设方案.doc VIP
- 2025年运输企业安全生产规章制度(必威体育精装版版) .pdf VIP
- 2023考研英语二真题.pdf VIP
- 人教版初中八年级数学下册《第十九章 一次函数》大单元整体教学设计.docx
- 三年级上册数学连续进位笔算乘法练习题.docx VIP
- 塌方安全培训.pptx VIP
- 2023—2024学年部编版九年级上册历史期中测试卷(含答案).pdf VIP
- Sterling_Trader最详细中文说明书.pdf VIP
有哪些信誉好的足球投注网站
文档评论(0)