基于非对称属性SVD推荐算法探究.docVIP

下载本文档

10
0
约3.39千字
约 7页
2017-06-10 发布于福建
举报
版权申诉

基于非对称属性SVD推荐算法探究.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于非对称属性SVD推荐算法探究

基于非对称属性SVD推荐算法探究　　摘要：该文在传统的基于奇异值矩阵分解模型（SVD）的基础上提出一种非对称的协同过滤算法，对电影的评分进行预测。并在Movielens数据集上实验验证，该算法在平均误差方根（RMSE）上比SVD、SVD++的算法更优关键词：电影评分预测；SVD；RMSE；矩阵分解中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2017）03-0079-02 1 研究背景推荐系统现已广泛应用于很多领域，其中最典型并具有良好的发展和应用前景的领域就是电子商务领域，比如亚马逊（Amazon）、谷歌新闻（Google News）以及国内的淘宝网等知名互联网巨头。一般来说，个性化推荐是根据用户的特点或购买行为，向用户推荐其感兴趣的信息。但同时，随着电子商务规模的不断扩大，商品个数和种类快速增长，用户需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决所谓的“信息过载”问题，针对特定每一个用户的个性化推荐系统应景而生。特别是近几年来，随着学术界对推荐系统的研究热度不断攀升，已经形成了一门相对独立的学科 1.1 基于电影评分预测的推荐算法当今社会，人们把欣赏电影当成日常娱乐中一种不可或缺的方式。有很多电影的评分网站允许用户根据其喜好程度对电影进行评分，比如IMDB，豆瓣以及一些提供在?观看的网站。然而，对于某个用户而言，并不是所有的电影都观看并且评分了。对这些缺失的评分有很多算法对其进行预测，其中典型的有基于内容的评分预测和协同过滤算法 2 实验数据集和评价指标 2.1 Movielens数据集实验使用Grouplens网站开放给用户的电影评分数据集，其中Movielens 100K数据集包含943个用户对1682部电影的10万条评分记录（评分范围1-5分，每个用户至少对20部电影进行了评分），此数据集的稀疏度为93.7%。本文采用其中ua.base和ua.test作为训练集和测试集，即80%的数据作为训练集，余下的20%的数据作为测试集，并以此对本文提出的推荐算法进行实验 2.2 评价指标实际上，针对推荐算法性能优劣的衡量方法有很多，如平均绝对误差（MAE）、平均方根偏差（RMSE）、覆盖率（COV）等。本文主要采用RMSE值作为算法优劣的评价标准，即通过计算预测值与真实值的平均绝对误差来判断推荐算法的好坏，推荐精度的高低与RMSE值的大小成反比。其公式如下： [RMSE=1Stest（u，i）∈Stest（rui-rui）2] 其中，Stest为测试集中有评分记录的集合内元素的计数， [rui]为用户u对电影i的预测评分，[rui]为测试集中用户u对电影i的真实评分 3 算法 3.1 基线预测算法多数情况下，人们早已发现用户对电影的评分往往具有很多与电影无关的因素，用户有一些属性和电影无关，电影也有一些属性和用户无关。因此，一种将偏置项加入到推荐算法当中，并将其称为基线预测算法。定义对一部电影评分的预测值为[rui]，那么其公式为： [rui=μ+bi+bu] 其中，[μ]表示所有评分的平均值；[bi]表示电影的偏移量，代表电影在接受评分时与用户无关的因素；[bu]表示用户的偏移量，代表用户在评分中与电影无关的因素 3.2 SVD算法但基线预测无法针对用户的潜在偏好进行评分预测，因人们对电影进行评分的时候极可能有一些偏好，如A用户对科幻片比较感兴趣，那么该用户在对其他具有科幻特征的电影评分很可能偏高，而对非科幻片的潜在评分就很可能偏低。因此我们引入2个特征向量：[pu]和[qi]。其中[pu]表示用户对不同风格的电影的偏好，[qi]表示不同风格的用户对电影的偏好。那么，在基线预测的基础上加入上述向量，对电影评分的预测值公式为： [rui=μ+bi+bu+qTipu] 为了得到更为准确的特征向量值，通常采用随机梯度下降法来训练上述各参量，以防止过拟合。其更新公式分别为： [bu←bu+α1?（eui-β1?bu）] [bi←bi+α1?（eui-β1?bi）] [qi←qi+α2?（euipu-β2?qi）] [pu←pu+α2?（euiqi-β2?pu）] 其中，定义[eui]为每次迭代训练中用户u对电影i的预测评分与真实评分之差 3.3 SVD++算法在SVD算法的基础上，Keron等人提出把隐式反馈信息融入到SVD算法中，形成了SVD++算法。算法使用R（u）表示被用户评分的电影的集合， [yj]为隐主题的维度向量，其向量值与[pu]、[qi