- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4 阿里移动推荐算法 NEU_Smart
阿里移动推荐算法大赛答辩
NEU-Smart团队
回顾
首次模型测评 加入隔天购买特征
3.84 以隔天购买为研究对象。运 5.97 对原隔天购买模型,添加有 8.64
用GBDT模型进行训练,取 针对性的特征,如:用户30
所有预测结果为1的样本。 天内对该类商品隔天购买次
数。来识别经常隔天购买的
用户。
2015.5.5 2015.5.17 2015.6.4 2015.6.8 2015.7.1
规则提交 将重复购买分开训练 最终成绩
对已经被加入购物车的商品 , 对前一天已经购买,第二天 添加隔两天购买模型,提高
按18日最后交互时间递增的 继续购买的u-i样本建立 召回率。并调整现有的几个
顺序,取相应比例的商品作 5.44 GBDT模型。与原有的隔一 6.04 模型结果在递交中所占比例。
为结果 天购买的预测结果结合,调
整二者比例,进行结果递交。
问题分析
二分类
问题归纳
回归问题
Rank问题
已知数据信息 :
字段 字段说明 提取说明
user_id 用户标识 抽样字段脱敏
item_id 商品标识 字段脱敏
behavior_type 用户对商品的行为类型 浏览、收藏、加购物车、购买
user_geohash 用户位置的空间标识,可以为空 由经纬度通过必威体育官网网址的算法生成
item_category 商品分类标识 字段脱敏
time 行为时间 精确到小时级别
任务:根据11月18日~12月18日的用户行为记录 预测 12月19日用户对
O2O商品购买行为
数据分布
行为数据与商品 数据分布一致 ,O2O数据基本上占总体数据的9%
利用纯O2O行为数据的同时,充分考虑如何利用非O2O的行为数据
数据分析
一个月时间内各天的购买情况(基于Season1的数据)
1800
(u,i) pairs
文档评论(0)