- 1、本文档共72页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析的基本概念 “聚类”就是按照一定的要求和规律对事物进行区分和分类的过程, 在这一过程中没有任何关于分类的先验知识, 仅靠事物间的相似性作为类属划分的准则, 属于无监督分类的范畴。 “聚类分析”是指用数学的方法研究和处理给定对象的分类。 “人以群分, 物以类聚”, 聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化, 人类要认识世界就必须区别不同的事物并认识事物间的相似性。 聚类分析的基本概念 聚类分析是多元统计分析的一种, 它把一个没有类别标记的样本集按某种准则划分成若干个子集(类), 使相似的样本尽可能归为一类, 而不相似的样本尽量划分到不同的类中。 传统的聚类分析是一种硬划分, 它把每个待辨识的对象严格地划分到某类中, 具有非此即彼的性质, 因此这种类别划分的界限是分明的。而实际上大多数对象并没有严格的属性, 它们在性态和类属方面存在着中介性, 具有亦此亦彼的性质,因此适合进行软划分。 聚类分析的基本概念 模糊集理论的提出为软划分提供了有力的分析工具, 用模糊数学的方法来处理聚类问题, 被称之为模糊聚类分析。由于模糊聚类得到了样本属于各个类别的不确定性程度, 表达了样本类属的中介性, 更能客观地反映现实世界, 从而成为聚类分析研究的主流。 模糊聚类已经在诸多领域获得了广泛的应用, 如模式识别、图像处理、信道均衡、矢量量化编码、神经网络的训练、参数估计、医学诊断、天气预报、食品分类、水质分析等。 聚类分析的基本概念 常用的模糊聚类分析方法大致可分为两大类:其一是基于模糊关系(矩阵)的聚类分析方法, 而作为其中核心步骤的模糊分类,有下述的主要方法:模糊传递闭包法、直接聚类法、最大树法和编网法; 其二是基于目标函数的聚类分析方法, 称为模糊C均值(FCM)聚类算法(或称为模糊ISODATA聚类分析法) (Iterative Self-Organizing Data Analysis Techniques Algorithm 迭代自组织数据分析) 。 相似系数法 ----(3)相关系数法 例 细胞染色体形状的模糊识别 蠓的分类 DNA序列分类与模糊识别 取 ,得 取 ,得 取 ,得 取 ,得 画出动态聚类图如下: 0.7 0.63 0.62 0.53 1 对于不同的λ∈[0,1],可得不同的分类方案,从而形成一种动态聚类图。这对全面了解对象的分类情况是比较形象和直观的。但有的实际问题需要选择某个阀值λ,确定一个具体的分类,这就是确定阀值λ的问题。 二、最佳阀值λ的确定 在动态聚类过程中,调整λ的值以得到适当的分类。另外,也可由熟悉专业的专家确定阀值λ,得到阀值λ水平上的分类。 1.按实际需要确定 设对应于λ的分类数为r,第j类的样品数为nj , j类的样本记为: 2.用F-统计量确定λ的最佳值 第j类的聚类中心为向量: 第j类中第k个变量的平均值: 定义F-统计量为: 表征了类与类之间的距离 表征类内样品间的距离 F越大,表明类间的差异越大,分类效果就越好。 为: 与 的距离。 为第j类中样品 与 的距离。 假设各类差异不明显,对于给定的检验水平α,查Fα(r-1, n-r)分布表,得临界值Fα,若FFα,则认为各类之间有明显的差异。 F服从自由度为r-1,n-r的F分布。 简单讲,模型识别就是根据研究对象具有的某些特征对其进行识别并归类。如采集的植物标本识别它属于哪个纲目;又如拨打电话号码识别对应的电话机。这种模型识别具有2个本质的特征: §2 模糊模型识别 一、基本概念 ①事先已知若干标准模型(称为标准模型库), 模型具有明显的界线; 1. 模型识别 ②有待识别归类的对象,并且它所属的类必然是若干标准模型之一。 模糊模型识别是指标准模型库中的模型是模糊的(模型间没有明显的界线)。如据电测或气测资料,建立的储层含油气性(油层、油气层、油水同层、气层、含水油层、干层等)标准模型库,又如由不同沉积相岩样观测值构成的岩样标准模型库,它们中的模型都是模糊的。因此,根据测井信息或者岩样的观测值判断钻穿储层的含油气性、岩样的沉积相是一个模糊集对标准模糊集的识别问题。 对于这类模型识别问题,可据模型的界线对待识别对象进行归类,是标准集对标准集的识别。 2. 模糊模型识别 为了解决模糊集的识别问题,需要一个度量模糊集与标准模糊集靠近程度的指标,这就是下面要介绍的隶属度和贴近度。 (1)模糊向量及其内外积 若0≤ai≤1(i=1,2,…,n),则称向量a=(a1,a2,…,an)为模糊向
您可能关注的文档
- 贫血患者的护理剖析.ppt
- 频带传输及调制技术剖析.ppt
- 模板学习贯彻新廉洁自律准则和纪律处分条例剖析.ppt
- 频率规划剖析.pptx
- 模板之精美图片财务报告与财务报表分析剖析.ppt
- 频率合成讲座剖析.ppt
- 模板专项施工方案剖析.doc
- 频率计论文剖析.docx
- 模电 课程设计剖析.doc
- 频率响应法剖析.ppt
- 2025至2030中国婴儿拉式蚊帐行业发展现状及发展趋势与投资风险报告.docx
- 2025至2030中国半导体陶瓷靶行业项目调研及市场前景预测评估报告.docx
- 2025至2030中国果汁行业供需趋势及投资风险报告.docx
- 2025至2030中国双节距滚子链行业项目调研及市场前景预测评估报告.docx
- 2025至2030全球及中国电子电气中的cPDM行业项目调研及市场前景预测评估报告.docx
- 2025至2030工业风幕行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至20305G技术行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030钛合金行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国冶金工程施工总承包行业运营态势与投资前景调查研究报告.docx
- 2025至2030铁路IT支出行业产业运行态势及投资规划深度研究报告.docx
最近下载
- 2024年中国零售商调查报告—全球化视角之海外门店拓展.pdf VIP
- 八大特殊作业(八大危险作业)安全管理知识与规范培训(PPT132页).pptx VIP
- 银行会计岗位招聘笔试题(某大型集团公司)试题集解析.docx VIP
- 磅房计量考试试题及答案.doc VIP
- 绿化养护标准及收费办法.docx VIP
- 儿童闭塞性细支气管炎的诊断和治疗(2023版)专家共识解读课件.pptx VIP
- CTX-M耐药基因流行病学调查及耐药机制研究.pdf
- 中国共产党纪律处分条例测试题附答案+考试注意事项.doc VIP
- 财务会计与税务会计差异及协调探讨.doc VIP
- (高清版)DG∕TJ 08-2410-2022 文物和优秀历史建筑消防技术标准.docx VIP
文档评论(0)