基于协同过滤个性化推荐算法的综述.docVIP

基于协同过滤个性化推荐算法的综述.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于协同过滤个性化推荐算法的综述.doc

基于协同过滤个性化推荐算法的综述   摘 要:互联网的发展是呈爆炸式的,无论是用户数量还是信息数量。现在的时代是大数据时代,这个时代的问题已经不是苦于没有数据,没有信息的时代。而是在这么多的数据中找到有用的数据,挖掘潜在的信息的时代。个性化推荐,本质上来说,是为了解决信息的超载问题。当一个用户有哪些信誉好的足球投注网站一个产品或者一条信息,如何在茫茫信息海中提供给用户的商品恰是用户感兴趣的,可以帮助用户减少不必要的时间去筛选用户不感兴趣的东西。本文主要介绍在众多推荐算法中最常见的协同过滤的研究现状,推荐算法,优缺点等问题。通过简单的例子让大家明白协同过滤的主要思想。   关键词:协同过滤;基于用户;基于物品;相似程度   一、协同过滤推荐的研究现状   首先了解一下推荐系统,比较普遍认可的定义是Resnick和Varian在1997年[1]提出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定购买什么产品,模拟销售人员帮助客户完成购买过程。”而协同过滤是推荐系统中最常见也是最广泛应用的推荐方法。Grundy书籍推荐系统[2]是公认的第一个对协同过滤应用的系统。还有Tapes-try邮件处理系统[3],Ringo[4]等。Sarwar等[5]提出的利用夹角余弦来计算产品的相似程度。Chen和Cheng[5]通过观察不同产品在用户的列表次序来计算用户与用户的相似程度.而Yang和Gu[7]利用建立用户的兴趣点来计算用户与用户间的相似程度。   二、协同过滤推荐的主要思想   协同过滤推荐的思路可以说是来源于生活。通过在生活中购买产品你会发现一些有趣的现象。比如说,人们总是更倾向于相信来自熟人的推荐,在你的朋友圈内,很多朋友都在使用同一种产品,那么你就也会很大程度有意的选择此产品。另外就是,在你对某种产品感兴趣时,当你发现有和你感兴趣的这种产品类似的产品,与此同时,其他购买者对这种产品的体验良好,那么你也很可能会购买这种商品。协同过滤的主要思想可以分成两个部分:一是通过分析用户以往的购买或者选择信息,来计算用户之间的相似程度,通过相似程度高的用户可以说是近邻对一个产品或信息的偏好来预测目标用户的对此产品或信息的偏好程度。二是通过分析对用户以往对某类产品的评价情况来预测该用户对此类中新产品的偏好程度,及计算以往评价过的产品与要推荐产品间的相似度。   协同过滤推荐主要有两种,一个是基于User的,另一个是基于iterm的。   1、基于用户的方法主要是寻找与目标用户相似的用户,认为有相似偏好的用户可能对某个产品或信息有相似的评价。通过利用相似近邻的偏好程度来进行对目标用户的评价的预测。比如说有三部电影《饥饿游戏》《千与千寻》《分手大师》。A下载了《饥饿游戏》,播完了《千与千寻》,没播完《分手大师》。B多次观看《饥饿游戏》,播完《千与千寻》,没看《分手大师》。C下载了《分手大师》,没看《饥饿游戏》,没播完《千与千寻》。那么可以看出来A与B很相似,那么再出现一个电影《变形金刚》,A是多次观看,那么应该把变形金刚推荐给B而不是C。关于这个用户之间相似程度的计算,可以通过对电影的评分机制进行量化,然后利用夹角余弦来计算用户之间的相似程度。设用户i和用户j在n维对象的空间上的评分向量为i,j,那么计算cos(i,j)的公式为:   cos(i,j)=i?j|i|*|j|   若两个用户的夹角余弦值相近,则可认为他们是相似用户。   关于相似程度的计算还可以通过皮尔森相关系数和修正余弦函数相似性等很多方法。   2、基于物品的方法主要首先是计算物品与物品之间的相似程度,然后结合用户以前的购买评价过的物品或选择行为,最后对用户进行某种新物品的推荐。比如说A喜欢看《分歧者》,《复仇者联盟》,《超体》。然后有两部电影《何以笙箫默》和《敢死队》。可以很明显的看出可以向A推荐《敢死队》。基于物品的系统过滤在计算物品的相似度时,也是可以通过评分量化,很多时候也是可以加入tag技术,对物品打标签,做标签矩阵。比如A喜欢的电影中《分歧者》是有动作,爱情,科幻三个标签,每个标签的权重不一样可以按0到1之间的分值设定。然后同理其他电影,最后通过量化计算相似度发现《敢死队》更符合推荐。关于tag矩阵也可以是0-1矩阵。关于计算相似程度与(1)中提到过的方法类似。   三、协同过滤推荐的优缺点   协同过滤的优点有:   1、可以进行过滤复杂性的,机器难以进行提取有效自由文本的信息,如音乐,图像等艺术类信息。   2、相对容易给用户制造惊喜。与基于内容的推荐不同,推荐给用户的物品内容可能是用户不太熟悉的内容,很可能发现用户潜在的喜好但用户本身却没有意识到的。   3、用户的不断增加,协同过滤推荐系统的性能也会增高。   协同过滤的缺点:  

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档