基于最短路径的随机游走的图聚类算法.docVIP

基于最短路径的随机游走的图聚类算法.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于最短路径的随机游走的图聚类算法.doc

基于最短路径的随机游走的图聚类算法   摘要:现实世界中的许多系统都以网络图形式存在,并且近年来图聚类作为一种重要的分析手段已经得到越来越多的关注。在众多图聚类算法中,谱图聚类算法以其高效性、易于实现以及坚实的理论基础等特性已经得到越来越多的关注。本文提出一种基于最短路径的随机游走的谱图聚类算法。该算法利用基于最短路径的局部随机游走模型将数据点之间的距离转化为随机游走的转移概率,通过随机游走的转移概率构造相似矩阵,最后利用谱方法得到聚类结果。实验结果表明,使用本文所提出的聚类方法可以有效提高聚类效果。   关键字:随机游走;图聚类;最短距离;谱聚类   中图分类号:TP311文献标识码:A文章编号:2095-2163(2015)06-   Abstract:There are many systems exiting in the form of network in the real world. And the graph clustering as an important analysis method has gained more and more attention in recent years. The spectral graph clustering algorithm is more popular because of its high efficiency, easy to implement and solid theory foundation. This paper proposes a Graph Clustering Algorithm based on Random Walk Model of the Shortest Path. This algorithm uses the random walk model based on the shortest path to transfer the distance between two data points to the transition probability, and structures the similarity matrix by the transition probability. Then the paper gets the result by using the spectral clustering algorithm. The experimental results show that using the presented clustering method can effectively improve the clustering effect.   Keywords: Random Walk; Graph Clustering; Shortest Distance; Spectral Clustering   0引言   聚类是最常用的数据分析技术之一,已经被广泛地应用到模式识别、数据挖掘和图像处理等领域。聚类分析是一个将数据样本划分为由相似对象组成的分组的过程。每一个组称为一个簇,每个簇中的数据对象的相似度大,而不同簇中的对象相似度小。从机器学习的角度来看,有哪些信誉好的足球投注网站簇就是一个无监督学习的过程。大数据图有很多内部具有实际意义的数据对象组成,两个数据对象间的相似关系可以转化成图模型。现实世界中的许多系统都是由网络图形来进行表示的,比如Facebook上的朋友关系网、生物上的蛋白质互质网络、科学家合著网络以及网页之间的超链接都是常见的网络图模型。近年来图聚类作为一种重要的分析手段已经得到越来越多的关注。图聚类[1]主要是将图上的节点划分为一些子图,使得这些节点在类内具有较强的连接而类间的连接则相对较弱。图聚类不仅有助于可视化和发现层次结构[2],还具有实际的意义,比如社区发现[3-4]、孤立点检测[5]等,此外聚类的结果也可以用来构建模块,使得在一些算法中可以降低图或模块的复杂度[6-7]。   谱分析方法已经成功地运用在解决数据聚类和图划分的问题方面。谱聚类是一种基于图论的聚类分析方法,近几年,由于谱聚类的高效性、易于实现以及成熟的理论基础等特性已经得到越来越多的关注,并被广泛应用在图像处理、计算机视觉、数据挖掘、机器学习等领域[8]。其基本思想是通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。关于谱聚类算法已经有很多人做了研究,其中经典的算法有Perona和Freeman提出的PF算法[9]、Shi和Malik提出的SM算法[10]、Ng和Jordan等人提出的NJW算法[11]以及Meila提出的MS算法[12]等。谱聚类克服了传统聚类方法仅

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档