- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用户的业务偏好分析应用模型
目录
1
业务偏好应用模型研究的需求
如何根据客户的数据业务行为、基础画像、互联网行为,研究客户的业务偏好以及内容、时间等偏好,针对当前数据业务沉默客户、潜在客户开展激活与推荐。
研究业务偏好应用模型的意义
以用户为导向,满足用户个性化需求,比传统的大众推荐效果更好。
以真实数据为依据进行分析,实现对用户的精准定位和精确推荐。
有利于节约成本、提高利润水平,保留和吸引更多用户。
背景意义
2
基于结构化数据的偏好分析模型
通过用户的月基础画像信息自动对用户分群生成用户标签。
在每个用户群内,通过用户的业务使用行为做内容关联分析针对每类用户推荐不同的内容。
3
输入数据
用户基础画像数据
业务使用行为数据
以手机视频业务为例
手机号码
收看过的视频视频内容ID1
视频内容ID2
视频内容ID3
……视频内容ID1
视频内容ID2
视频内容ID3
……
基本信息
行为信息
费用信息
语音使用行为
短信使用行为
GPRS使用行为
WLAN使用行为
4
业务偏好计算
用户分群:
数据变换、归一化 :解决各个特征的计量单位、大小范围差异大的问题。
K-means聚类:使用基础画像信息自动聚出8个类型不同的用户群。
5
用户群
高资费人群
标准用户群
低资费人群
上网高烧友
上网一族
理性上网群
商务人士
通话达人
业务偏好计算
6
(1)高资费人群:该类人群特征是绝大部分数值均大于平均值,即消费水平高于平均水平,特别是总费用是各类人群中最高的。
(2)标准用户群:该类人群特征是绝大部分数值与平均值持平或低于平均值。值得一提的是,虽然GPRS套餐费较高,但使用时能严格控制流量,使流量不超过标准套餐的额度,不产生额外的GPRS通信费。
(3)低资费人群:该类人群特征是通话时长、短信量、上网流量均低于平均水平,特别是总费用是各类人群中最低的。
(4)上网发烧友:该类人群特征是上网的流量和费用超高,同时通话等传统业务量少。
(5)上网一族:该类人群特征是上网流量经常超出GPRS套餐额度,导致GPRS通信费超高。与上网发烧友相比,通话等传统业务使用显得更活跃。
(6)理性上网群:该类人群特征是订阅GPRS套餐较为理性,套餐费高于平均值,属于喜爱上网的上群。同时,GPRS套餐外产生的额外费用几乎没有。
(7)商务人士:该类人群特征是套餐月租费、漫游通话费、无线上网流量在各类人群中最高,符合商务人士出差、经常无线上网的特点。
(8)通话达人:该类人群特征是语音业务套餐费显著高于其他各个用户群。另外,有了语音业务套餐,本地通话仍很频繁。
7
基于文本的内容过滤推荐模型
功能
根据用户访问过的项集的文本主题特征,向其推荐可能感兴趣的新内容
适用范围
业务产品、互联网内容资讯、广告等内容推荐,要求能够获得项集的文本特征描述
模型输入
有历史访问行为的目标用户u、该用户访问过的内容项(页面、文章、书籍)集合Iu及集合中元素的关键词描述、该用户未访问过的内容项集合RIu以及集合中元素的关键词描述
模型输出
目标用户u可能喜欢的内容项Top-N列表
出于效率考虑,用户数据分析平台以每个用户访问过的项集的文本特征分别建立该用户的Profile并按日更新,然后通过比对Profile和推荐候选项集的文本特征来实现内容过滤推荐。相比于传统算法,主要进行了如下改进:
a.分层多粒度的标签体系。用户偏好特征按照大类-子类-关键词的方式进行组织,能够适应不同的营销场景需求。例如,进行手机阅读推荐时主要使用“阅读”类的标签,进行游戏推荐时主要使用“游戏”类的标签;
b.潜在语义分析。解决不同语境下的多义词问题。
8
基于文本的内容过滤推荐模型
用户A
用户B
用户阅读的文章
雅虎重组自救,胜算几何?
正文……
家用热销2012款新车行情调查
正文……
…
…
Profile数据
[IT/互联网:德克尔_0.227451]
[汽车:经济型_0.160784]
[IT/互联网:杨致远_0.454902]
[汽车:省油_23.470320]
[IT/互联网:总裁_0.5681205]
[汽车:热销_0.176471]
…
…
推荐的文章
雅虎欲撤换杨致远 新一轮裁员不可避
雅虎董事会欲撤换杨致远 新一轮裁员
雅虎股票跌回2月初微软提出收购前价
新宝来现金优惠6000元 店内现车供应
低油耗对抗高油价 5款小排量增压车行情
六款配自动空调时尚小车推荐
示例
9
基于文本的内容过滤推荐模型
对于在某一特定文件里的词语 来说,它的重要性可表示为:
是该词在文件 中的出现次数,而分母则是在文件 中所有字词的出现次数之和。
逆向文件频率IDF则计算一个词语普遍重要性。某一特定词语的
您可能关注的文档
- 宏观压力测试在区域金融稳定评估中的应用研究浅析.doc
- 虚拟轴机床资料.pptx
- 虹吸雨水系统安全技术交底浅析.docx
- 项目3任务1灌浆工程资料.ppt
- 项目04循环结构程序设计资料.ppt
- 应用化学3.4燃料电池资料.ppt
- 机械设计基础说课浅析.ppt
- 洪河农场供热外网竣工资料浅析.doc
- 洪教头招惹林冲浅析.ppt
- 机械设计基础知识大全_新手必备浅析.doc
- 2025届湖北省武汉市新洲区中考历史最后一模试卷含解析.doc
- 辽宁省丹东市第十四中学2025届中考冲刺卷生物试题含解析.doc
- 方兴大道承台砼施工技术交底.docx
- 江苏省扬州市田家炳实验中学2025届中考历史全真模拟试卷含解析.doc
- 2025届黑龙江省杜尔伯特县中考二模化学试题含解析.doc
- 海南省海口九中学海甸分校2025届中考生物模拟试卷含解析.doc
- 江苏省春城中学2025届中考生物全真模拟试卷含解析.doc
- 广东省广州市番禺区广博校2025届中考猜题历史试卷含解析.doc
- 安徽省合肥市重点中学2025届中考四模历史试题含解析.doc
- 河北省衡水市故城县2025届中考生物押题试卷含解析.doc
文档评论(0)