《机器学习项目案例开发》课件 26.推荐系统.pptx

《机器学习项目案例开发》课件 26.推荐系统.pptx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

人工智能技术与应用

6.推荐系统;;推荐系统概述;推荐系统:;推荐系统:

;协同过滤:

如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?

如何确定一个用户是不是和你有相似的品位?

如何将邻居们的喜好组织成一个排序的目录?

;协同过滤:实现步骤

收集用户偏好

找到相似的用户或物品

计算推荐;协同过滤:实现步骤;协同过滤:相似度计算

;协同过滤:相似度计算

欧几里德距离(EuclideanDistance)

皮尔逊相关系数(PearsonCorrelationCoefficient)

Cosine相似度(CosineSimilarity)

;协同过滤:相似度计算

皮尔逊相关系数(PearsonCorrelationCoefficient)

协方差

皮尔逊相关系数

Pearson相关系数是用协方差除以两个变量的标准差得到的;协同过滤:皮尔逊相关系数;协同过滤:皮尔逊相关系数

邻居的选择

固定数量的邻居

基于相似度门槛的邻居;基于用户的协同过滤:;基于用户的协同过滤:

基于用户的协同过滤要解决的问题

已知用户评分矩阵MatrixR(一般都是非常稀疏的)

推断矩阵中空格emptycells处的值;基于用户的协同过滤:

基于用户协同过滤UserCF缺点

对于一个新用户,很难找到邻居用户。

对于一个物品,所有最近的邻居都在其上没有多少打分

注意事项

相似度计算最好使用皮尔逊相似度

考虑共同打分物品的数目,如乘上min(n,N)/Nn:共同打分数N:指定阈值

对打分进行归一化处理

设置一个相似度阈值;基于用户的协同过滤:

基于用户协同过滤UserCF为啥不流行

1.稀疏问题

2.数百万的用户计算,这量?

3.人是善变的注意事项

;基于物品的协同过滤:

;基于物品的协同过滤:

基于物品的协同过滤优势!

计算性能高,通常用户数量远大于物品数量

可预先计算保留,物品并不善变

;基于物品的协同过滤:

;基于物品的协同过滤:

用户冷启动问题

引导用户把自己的一些属性表达出来

利用现有的开放数据平台

根据用户注册属性

推荐排行榜单

物品冷启动问题

文本分析、主题模型

打标签、推荐排行榜单;基于物品的协同过滤:;基于物品的协同过滤:;隐语义模型:;隐语义模型:;隐语义模型:;隐语义模型:;隐语义模型负样本选择:;隐语义模型:;隐语义模型:

重新计算USV的结果得到A2来比较下A2和A的差异,看起来差异是有的,但是并不大,所以我们可以近似来代替;隐语义模型:

将U的第一列当成x值,第二列当做y值,即U的每一行用一个二维向量表示,同理V的每一行也用一个二维向量表示。

从图中可以看到,S5和S6特别相似,Ben和Fred也特别相似;隐语义模型:

寻找相似用户寻找相似用户:

依然用实例来说明:假设,现在有个名字叫Bob的新用户,并且已知这个用户对seasonn的评分向量为:[55ooo5]。(此向量为列向量)

我们的任务是要对他做出个性化的推荐。

我们的思路首先是利用新用户的评分向量找出该用户的相似用户。;敬请指导!

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档