- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于云填充和混合相似性的协同过滤推荐算法的研究.doc
基于云填充和混合相似性的协同过滤推荐算法的研究
摘要:针对传统推荐算法的相似性度量准确性不高及数据极端稀疏性等问题,提出一种基于云填充和混合相似性的协同过滤推荐算法。首先通过云模型填充用户-项目评分矩阵,然后对相似性度量方法进行改进,将基于时间序列的用户间影响力融合到基于Jaccard系数的相似性度量方法中。在MovieLens数据集上的验证结果表明,改进后的算法提高了推荐精度同时在一定程度上克服了数据稀疏性的影响。
关键词:协同过滤推荐算法;云填充;时序行为影响力;Jaccard系数
中图分类号:TP391 文献标识码:A
Abstract:A collaborative filtering recommendation algorithm based on cloud model filling and hybrid similarity was proposed to measure the similarity of the traditional recommendation algorithm with low accuracy and extreme sparsity of data. First, the useritem rating matrix was filled by the cloud model, and then the similarity measure method was improved, and the influence of the user based on time series was fused to the similarity measure method based on the Jaccard coefficient. The validation results on MovieLens data sets show that the improved algorithm can improve the recommendation accuracy and overcome the influence of data sparsity to a certain extent.
Key words:collaborative filtering recommendation algorithm; cloud model filling; temporal behavior influence; Jaccard coefficients
1引言
随着信息技术和互联网的发展,信息的产生、加工、传播变得越来越容易,人们每天都接触大量的信息,进入了信息过载的时代。在这个时代,无论是消费者还是商家都遇到了很大挑战:一方面,对于消费者来说,面对如此海量的数据信息,要从中剔除冗余信息、挑选出自己真正需要的信息,犹如大海捞针;另一方面,对于商家来说,要有针对性地推送商品信息,让自己的商品受到广大消费者的关注,也是一件非常困难的事情。在此背景下,电子商务推荐系统应运而生。
协同过滤推荐算法[1-2]是目前电子商务推荐系统中应用最广泛最成功的推荐技术。它的主要思想是利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣[3]。那么,整个推荐算法的关键是找出目标用户的最近邻居集合。然而,其归根结底在于用户或项目间相似性的度量[4-7]。因此,用户或项目间的相似性度量是否准确,直接关系到整个推荐系统的推荐质量。传统的相似性度量方法主要有:余弦相似性、相关相似性和修正的余弦相似都有其不足之处。在现实的数据中,由于用户评分数据的极端稀疏性,导致用户间相似性的度量不够准确,推荐精度较低。而且,大部分的推荐算法并没有考虑用户相互之间的影响关系,导致推荐系统的推荐质量下降。
与上述相关工作不同,本文利用云模型填充用户-项目评分矩阵,在分析基于时序行为的用户影响力和基于Jaccard系数的相似性度量方法的基础上,对用户间相似性的计算方法进行改进。将改进后的算法在MovieLens数据集上进行了相应的实验,实验结果表明,改进后的算法提高了推荐精度,同时在一定程度上克服了数据稀疏性的影响。
当一个推荐系统搭建好后,需要解决的首要问题是如何判断推荐系统的好坏。然而,推荐系统拥有多种评价标准,这些评价标准可用于评价推荐系统各方面的性能。由于不同的系统在不同的应用背景下表现不同,研究者们很难选取恰当的评价标准对系统的表现进行评估。大多数研究者选择采用准确度来评价推荐算法的好坏。预测准确度是度量一个推荐算法的预测打分与用户实际打分的相似程度,其中一个经典方法是度量预测打分与实际打分的平均绝对误差。然而,标准平均绝对误差
文档评论(0)