- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
matlab实现Kmens聚类算法matlab实现Kmeans聚类算法
matlab实现Kmeans聚类算法 简介: Kmeans和应用于混合高斯模型的受限EM算法是一致的。高斯混合模型广泛用于数据挖掘、模式识别、机器学习、统计分析。Kmeans的迭代步骤可以看成E步和M步,E:固定参数类别中心向量重新标记样本,M:固定均值只考虑(估计)了均值,而没有估计类别的方差,所以聚类的结构比较适合于特征协方差相等的类别。 Kmeans在某种程度也可以看成Meanshitf的特殊版本,Meanshift是所以Meanshift可以用于寻找数据的多个模态(类别),利用的是梯度上升法。在06年的一篇CVPR文章上,证明了Meanshift方法是牛顿拉夫逊算法的变种。Kmeans和EM算法相似是指混合密度的形式已知(参数形式已知)情况下,利用迭代方法,在参数空间中有哪些信誉好的足球投注网站解。而Kmeans和Meanshift相似是指都是一种概率密度梯度估计的方法,不过是Kmean选用的是特殊的核函数(uniform kernel),而与混合概率密度形式是否已知无关,是一种梯度求解方式。 k-means是一种聚类算法,这种算法是依赖于点的邻域来决定哪些点应该分在点,也可以对高维的空间(3维,4维,等等)的点进行聚类,任意高维的空间都可以。上图中的彩色部分是一些二维空间点。上图中已经把这些点分组了,并使用了不同的颜色对各组进行了标记。这就是聚类算法要做的事情。这个算法的输入是:1:点的数据(这里并不一定指的是坐标,其实可以说是向量)2:K,聚类中心的个数(即要把这一堆数据分成几组)所以,在处理之前,你先要决定将要把这一堆数据分成几组,即聚成几类。但并不是在所有情况下,你都事先就能知道需要把数据聚成几类的。意味着使用k-means就不能处理这种情况,下文中会有讲解。把相应的输入数据,传入k-means算法后,当k-means算法运行完后,该算法的输出是:1:标签(每一个点都有一个标签,因为最终任何一个点,总会被分到某个类,类的id号就是标签)2:每个类的中心点。标签,是表示某个点是被分到哪个类了。例如,在上图中,实际上有4中“标签”,每个“标签”使用不同的颜色来表示。所有黄色点我们可以用标签以看出,有3个类离的比较远,有两个类离得比较近,几乎要混合在一起了。当然,数据集不一定是坐标,假如你要对彩色图像进行聚类,那么你的向量就可以是(b,g,r),如果使用的是hsv颜色空间,那还可以使用(h,s,v),当然肯定可以有不同的组合例如(b*b,g*r,r*b) ,(h*b,s*g,v*v)等等。在本文中,初始的类的中心点是随机产生的。如上图的红色点所示,是本文随机产生的初始点。注意观察那两个离得比较近的类,它们几乎要混合在一起,看看算法是如何将它们分开的。类的初始中心点是随机产生的。算法会不断迭代来矫正这些中心点,并最终得到比较靠5个中心点的距离,选出一个距离最小的(例如该点与第2个中心点的距离是5个距离中最小的),那么该点就归属于该类.上图是点的归类结果示意图.经过步骤3后,每一个中心center(i)点都有它的”管辖范围”,由于这个中心点不一定是这个管辖范围的真正中心点,所以要重新计算中心点,计算的方法有很多种,最简单的一种是,直接计算该管辖范围内所有点的均值,做为心的中心点new_center(i).如果重新计算的中心点new_center(i)与原来的中心点center(i)的距离大于一定的阈值(该阈值可以设定),那么认为算法尚未收敛,使用new_center(i)代替center(i)(如图,中心点从红色点转移到绿色点),转步骤3;否则,认为算法已经收敛,则new_center(i)就是最终的中心点。现在,所有的中心都不再移动,即算法已经收敛。当然,也许这些中心点还没有达。可以从K=1开始,并且k值不断的增加,通常,随着k的增加,类中的方差会急剧的下降,当k达到一定大的时候,方差的下降会明显减慢(至于慢道何种程度,可以设阈值),此时,就选取到了最佳的k值。如果初始值没设置好,肯定也不能获得理想的聚类效果。针对这种情况,这里提供两种方法:随机的选取多组中心点,在每一组中心点上,都把kmeans算法运行一次。最后,在选取类间方差最小的一组。通过设定的选初始值方法(这里提供一种,当然自己也可以去构想其他的方法) 1.在数据集上随机选择一个点,做为第一个中心点;2:在数据集上,选取离第一个中心点最远的一个点做为第二个中心点。3:在数据集上,选取离第一个和第二个中心最远的点,做为第三个中心。4:依此计算后续的中心点 数据来源描述 本次数据挖掘实验的数据源来自加州大学计算机与信息院,是用于合成控制图时间序列聚类分析的一组数据。数据集中一共包含600组数据,每一组数据都有60个分量,也就
您可能关注的文档
- 汽车空调不制冷的故障判断与维修汽车空调不制冷的故障判断与维修.doc
- 汽车电器课程设计说明书汽车电器课程设计说明书.doc
- 汽车维修厂制度汇编2汽车维修厂制度汇编2.ppt
- 汽车维修工试题精选汽车维修工试题精选.doc
- 汽车维修经营模式汽车维修经营模式.doc
- hadoop大数据培训基础学习hadoop-北京尚学堂hadoop大数据培训零基础学习hadoop-北京尚学堂.doc
- hao八年级生物下册_物复习资料_人教新课标版hao八年级生物下册_生物复习资料_人教新课标版.doc
- 汽车美容店营销策划方案汽车美容店营销策划方案.ppt
- 汽车维修中级工考核试题4汽车维修中级工考核试题4.doc
- HBV相关肝癌高危人群治疗指征及其意义HBV相关肝癌高危人群的治疗指征及其意义.doc
- Matlab程序设计及用实验讲义Matlab程序设计及应用实验讲义.doc
- matlab语言(整数划模型)matlab语言(整数规划模型).doc
- MATLAB考试题MALAB考试题.doc
- 河北省沧州市2012年数学中考模拟测试卷河北省沧州市2012年数学中考模拟测试卷.doc
- Matlab课程复习大1Matlab课程复习大纲1.doc
- matlab遗传算法工箱函数及实例讲解 2matlab遗传算法工具箱函数及实例讲解 2.doc
- MBA 毕业论文细则MA 毕业论文细则.doc
- MBAl论文我国医疗器企业经营战略分析MBAl论文我国医疗器械企业经营战略分析.doc
- MATLAB非线性规划题MATLAB非线性规划问题.doc
- 河北省生物学业水平测试2 人教版生物必修二知识点总结河北省生物学业水平测试2 人教版生物必修二知识点总结.pdf
最近下载
- 中医治疗带状疱疹后遗神经痛的研究.doc VIP
- 江铃-江铃E400-产品使用说明书-E400豪华型-JX70021BEV-江铃E400使用说明书.pdf VIP
- ISO IEC 27017-2015 信息技术--安全技术--基于ISO IEC 27002的云服务信息安全控制实践准则.pdf
- 脑疝病人的护理课件(完整版).pptx VIP
- 4-6岁 《游来游去的水母》-美术课件.ppt VIP
- 100个超级有趣的冷知识.pdf VIP
- 指挥调度系统项目可行性研究报告.docx VIP
- 公司节能减排方案.pptx VIP
- RBANS记录表(精分,重度抑郁,焦虑障碍,正常对照).docx VIP
- 重症医学科绩效考核.ppt VIP
文档评论(0)