基于用户活动数据建立文献关联的方法和应用.pdfVIP

基于用户活动数据建立文献关联的方法和应用.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012 年全国知识组织与知识链接学术交流会·北京 基于用户活动数据建立文献关联的方法与应用 王丹丹 1,2 (1 中国科学技术信息研究所,北京,100038; 2.河南科技大学 洛阳 471003 ) 摘要:从用户数据来源与价值,推荐类型与呈现方式两个维度入手,分析了基于用户活 动数据实现关联文献推荐的要素;按照所依托的用户数据类型,对当前图书馆基于用户活动 数据实现关联文献挖掘的实践进行总结,深入分析各种关联文献挖掘方法,为拟开展推荐服 务的图书馆提供参考。 关键词:推荐;图书馆;用户数据;活动数据 Abstract: The user data source and value, the types and presentation of recommend are important dimensions to realize the correlation literature recommendation. According to the user data type which recommender system rely on, sum up typical recommendation practice in libraries, analysis related literature mining method especially, provide reference to libraries which going to carry out the recommendation service. Keywords: recommend;library; user data; activity data 1 引言 在信息膨胀的时代,海量信息同时呈现,一方面用户很难从海量信息中发现自己感兴趣 的内容,另一方面大量少人问津的“暗信息”也无法被一般用户获取[1] 。迫切需要一种工具能 够帮助用户找到自己真正需要的信息或是帮助生产者定位自己产品的潜在用户,推荐系统便 应运而生。电子商务网站通过挖掘客户的使用过程数据实现客户全新的推荐体验。在网上购 物时,常会看到“购买本商品的顾客还买了……”、“浏览本商品的顾客还看过……”、“您可 能会感兴趣……”等类型的推荐,其中推荐的商品均是网站购物系统通过挖掘客户的点击数 据产生的。这些基于用户活动数据实现关联推荐的服务也给学术资源的推荐提供了启发,图 书馆利用系统所记录的用户使用资源的具体方法和过程,判断资源的关联性和重要程度进行 推荐,并取得了一些实践进展。本论文从构建文献关联的要素分析入手,总结数字图书馆的 用户数据源以及不同类型推荐的本质;对当前图书馆基于用户活动数据实现关联文献挖掘的 实践进行总结,结合用户活动数据的特点,深入分析各种关联文献挖掘方法。 2 基于用户活动数据实现关联文献推荐的要素 基于用户活动数据挖掘关联文献,就是以丰富用户体验为目的,充分挖掘通过各种渠道 获取的能够反映用户兴趣爱好的数据,利用用户已有的选择过程或相似性关系预测用户兴 趣,建立用户与信息产品之间的二元关系,推荐相关文献,改善用户的检索体验。用户数据 来源以及收集方式,决定着可以实现的推荐类型;反过来,不同的推荐类型对用户数据又有 着不同层级的要求;此外,推荐内容的不同呈现形式,又会影响用户对推荐内容的信任以及 对推荐系统的接纳。 2.1 用户数据来源与价值 简单的说,用户数据是可以被计算机所记录的用户行为的记录(可能是发生在网络环境 中的行为也可能是发生在真实物理环境中的行为)。通常可以划分为三类:一是访问数据, 记录用户对系统的访问,表明用户的访问路径(例如登录/退出,通过路由器或其他的网络 485 2012 年全国知识组织与知识链接学术交流会·北京 工具);二是注意力数据,如系统的导航记录,页面、菜单的选择和检索等数据;三是活动 数据,能够表明用户较强兴趣和意图的购买、借阅、下载、评价、标签、注解、评分等数据 [2] 。使用哪些数据进行推荐,以及如何收集这些数据是推荐系统的开发者考虑的一个关键问 题。 收集用户数据的方法通常被分为隐性和显

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档