近年来国外Folksonomy改进研究进展.docVIP

近年来国外Folksonomy改进研究进展.doc

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
近年来国外Folksonomy改进研究进展

近年来国外Folksonomy的改进研究进展   [摘要]针对分众分类这种信息组织方式的缺陷,从提取folksonomy标签之间的语义和增强folksonomy的语义关系两个方面总结国外近年来有关分众分类的改进研究。重点阐述增强分众分类语义的三个方面,即扩展folksonomy系统本身的语义关系、语义网增强folksonomy的语义和本体与分众分类的融合;希望通过对国外近年来folksonomy的改进研究,为我国进行相关研究和实践提供参考。   [关键词]folksonomy 标签 本体 语义网   [分类号]G250.76      1 引言      伴随着Web2.0的出现,一种新兴的、自下而上的、分众的网络信息组织方式――Folksonomy逐渐流行起来。Folksonomy一词最初是由Thomas Vander Wal所创,是Folks(一群人、一伙人)和Taxonomy(知识分类法)组合而成的新词汇,称其为“由下而上的社会分类法”。在分众分类法中,用户群体可以自由选择一个或多个标签(tag)描述某个资源,而不必受限于一个预先设定好的规范词表,而且这种描述是所有用户共同参与,系统将不同人标注同一资源的标签汇集起来,以供检索和共享。   笔者通过检索国内相关文献了解到,我国有关分众分类法的研究还处在初级阶段,更不用说folksonomy的改进研究。因此,了解和总结近年来国外有关:folksonomy的改进研究,对我国进行相关方面的研究和实践具有非常重要的意义。笔者主要从两个方面来进行分众分类系统的改进研究,一方面提取folksonomy结构本身的语义;另一方面通过语义网、本体等工具增强folksonomy的语义。      2 提取folksonomy标签之间的语义      2.1 提取folksonomy中的微量本体   2005年,Mika认为从folksonomy中可以提取出部分的语义关系,从而根据语义相关的标签建立“微量的本体”。为实现这个目标,作者建立标签和用户、标签和资源的相关图,每一图形代表一套语义相关的标签,通过这些网络图集合相关的标签。例如,如果许多人同时使用“慢跑”和“跑步”这两个标签标注同一网络资源,就说明这两个标签具有语义关系;如果使用标签“慢跑”的分组用户是使用标签“跑步”的分组用户的一个子集,标签“跑步”就比标签“慢跑”的含义更宽泛。这种方法虽然能表述基本的语义关系,但是这种关系并不明确。   2007年,Lux和Dsinger也试图从folksonomy中提取本体,和Mika相似,他们首先建立了一个基于共同出现(co-occurrence)的标签网,然后根据标签共现关系的策略,过滤错误的标签,整合相似的标签成集合。提取的结果是,作者可以获得一个词汇网以整合所有从原始标签中提取出的词汇。作者应用一个集群技术对所有共同出现的标签进行处理,然后把集群处理后的标签作为一个专门的词汇组,这个组定义了不同背景或不同意义的词汇,以方便更好地提取folksonomy中的语义。   2009年,Meo等人提出一种提取folksonomy的语义关系,进而形成分级的数据结构来支持用户的检索。这种方法有两个创新点:一是提出的概率技术有利于更好地区分标签的相似性和属性关系;二是提出的两个分等级的结构和两个相关的运算法则有利于形成相似标签的等级,这就使用户可通过标签的粒度找到感兴趣的标签,进而找到满足用户检索需求的标签。   上述三种方法所产生的词汇之间的语义关系来自于分众分类的标签,但是词汇之间的关系仍然没有正式本体的准确。   2.2 分析folksonomy的动态变化   2006年,Begelman等人根据folksonomy的动态变化集合相关的标签,首先标注同时出现的不同资源形成标注的空间,然后把这个新的标签空间作为一个无向图,通过标签出现的次数对一组组标签进行加权,把强烈相关的标签作为无向图的顶点和边。这就产生相关标签集,但是因为这些集合非常大,所以应用一个聚类算法去完善它们。   2007年,Halpin等人分析了folksonomies的动态变化,并根据标签使用的频率找到分布的规律。他们假设最常用的标签标注一个资源经过一段时间后还是保持一致,它们的分布遵循此原则。他们证实了假设,即对于受欢迎的网络资源通常与之联系的标签有七到十个。这些资源是社会书签服务网站提供的。作者也在标签相关图的基础上找到了最常使用的标签之间的语义关系。这些关系图的每一个节点表示环上的一个标签,根据这个标签出现的频率来给其直径加权。这些关系图边的长度是根据它们出现的频率加权,可以看成是一个用分众分类法来建立本体的可视化的工具。   2009年,Echarte等人提出一种使用模式匹配技术动

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档