改进的DBSCAN聚类算法在社会化标注中的应用.pdfVIP

改进的DBSCAN聚类算法在社会化标注中的应用.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总第期年第期改进的聚类算法在社会化标注中的应用熊回香叶佳鑫蒋武轩华中师范大学信息管理学院武汉摘要目的改进算法并验证其在社会化标注中的可行性及有效性方法结合社会化标注的特点分析标签被用来标注资源的频次及标签的总出现次数挖掘标签与资源间的联系来改进聚类算法以改进的算法为基础实现标签聚类用户聚类以及用户标签的拓展结果采用豆瓣电影上的数据进行对比实验改进的算法在应用于社会化标注时可以提高簇内对象间相关性与各簇间相关性的比值聚类效果得到改进局限在选择构建向量的数据时存在一定局限性样本数据只能从较笼统的层面

总第24 期 2018 年 第12 期 改进的DBSCAN 聚类算法在社会化标注 中的应用* 熊回香 叶佳鑫 蒋武轩 (华中师范大学信息管理学院 武汉 430079) 摘要: 【目的 】改进DBSCAN 算法并验证其在社会化标注中的可行性及有效性。【方法 】结合社会化标注的特 点, 分析标签被用来标注资源的频次及标签的总出现次数, 挖掘标签与资源间的联系来改进DBSCAN 聚类算法, 以改进的算法为基础, 实现标签聚类、用户聚类以及用户标签的拓展。【结果 】采用豆瓣电影上的数据进行对 比实验, 改进的DBSCAN 算法在应用于社会化标注时可以提高簇内对象间相关性与各簇间相关性的比值, 聚类 效果得到改进。【局限 】在选择构建向量的数据时存在一定局限性, 样本数据只能从较笼统的层面表示用户及 资源特征, 未对其进行深入挖掘。【结论 】本文通过分析社会化标注的特点来改进DBSCAN 算法, 提高算法的效 果, 并为其改进提供新的思路。 关键词: DBSCAN 标签聚类 用户聚类 标签拓展 分类号: G202 DOI : 10.11925/infotech.2096-3467.2018.0358 因此其是系统获得用户个性化特征的良好数据来 1 引 言 源[7] 。如何利用用户标签进行个性化推荐, 是社会化标 社会化标注是目前常用的信息组织方式之一, 又 签领域中的研究重点之一。然而, 用户标签存在数量 称为协同标注、大众分类等, 指用户为资源添加标签 稀缺和缺乏个性化等问题, 解决这些问题的有效途径 的行为[1] 。社会化标注允许用户自由地为资源添加标 之一就是利用相关推荐算法为用户推荐标签。常用的 签, 用户可以使用自然语言, 按照自己的偏好对资源 标签推荐算法有基于协同过滤的推荐算法、基于图模 进行标注, 这种标注方式使标签具有社会性, 能够反 型的推荐算法、基于文本的推荐算法、基于张量模型 映用户特征, 因此标签也称为社会化标签[2-3] 。标签的 与LDA 模型的推荐算法等。例如以协同过滤为基础的 [4] [8] 出现, 一方面能帮助用户方便、低成本地管理信息 ; 博客标签推荐系统TagAssist ; Zhang 等提出的超图模 另一方面也使网站能够更容易地了解用户兴趣, 并以 型[9]; 钟青燕等提出的基于层次聚类和文本语义的推 [5] [10] 此为基础提供个性化服务 。 荐算法 ; 廖志芳等提出的以张量分解为基础的推荐 在以社会化标签为基础的个性化服务领域中, 了 算法[11]; 张斌等提出的基于 LDA 融合对象间关系与 解用户兴趣、挖掘用户个性化特征并以此建立用户模 资源内容的标签推荐算法[12] 。目前的标签推荐算法主 型是个性化服务的核心与基础[6] 。社会化标签是用户 要追求改进传统推荐方式和提高推荐标签的准确性, 个人偏好的反映, 能够较好地反映用户的兴趣、特征, 针对社交网络中现有标签缺乏个性化这一问题的研究 通讯作者: 熊回香, ORCID: 0000-0001-9956-3396, E-mail: hxxiong@。 *本文系国家社会科学基金项目“大众分类中标签间语义关系挖掘研究”(项目编号: 12BTQ038)的研究成果之一。 Data Analysis and Knowledge Discovery 77 应用论文 相对较少。 2.2 DBSCAN 算法改进 为解决上述问题, 本文提出一种以DBSCAN 算

文档评论(0)

zhaohuifei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档