基于图卷积网络的用户画像预测方法研究.pdfVIP

基于图卷积网络的用户画像预测方法研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

互联网技术的发展和智能应用的普及使得人们不仅是信息的接收者,同时也

是信息的发布者。人们在上网过程中会产生大量的行为数据,蕴含着用户基本属

性、兴趣、爱好等信息,为构建出全面的用户画像奠定了基础。用户的性别和年

龄是分析用户兴趣偏好的基础,人格特征反映了用户的心理特征和价值观念,两

者组成了用户画像最基础以及最核心的要素,能够帮助企业更好地理解用户的行

为和需求。因此,本文的研究重点是用户基础画像预测和人格画像预测。

传统的用户基础画像预测方法从用户交互的项目中提取用户的特征,当用户

交互的项目数量不多时,模型就难以提取有效信息。正如社交网络中朋友之间存

在着相似性,在购物平台常常看到“购买过这件商品的人还购买了某商品”这样

的广告,其背后利用项目作为桥梁建立了用户与用户之间的联系。本文根据用户

的交互行为建立用户之间的联系,通过与之相似的用户提取特征,缓解交互项目

稀少的问题。在用户人格画像预测方法中,文本主题未知的特点给用户画像预测

带来了噪声问题,本文利用LIWC(LinguisticInquiryandWordCount)提取文本

的心理语言特征,过滤主题无关的文本。本文的主要研究内容如下:

(1)针对用户交互项目稀少问题,本文提出一种基于图卷积网络的用户基

础画像预测模型(AttributeEnhancedGraphConvolutionalNetworkforUser

DemographicProfiling,AEGCN)。该模型由用户关系提取层、属性提取层和高阶

特征提取层三部分构成。用户关系提取层根据用户的交互行为挖掘用户的相似关

系并构建用户关系图,通过图卷积网络(GraphConvolutionalNetworks,GCN)

提取相似用户间的特征;属性提取层利用注意力机制聚合项目的属性信息,缓解

交互项目稀少的问题;最后利用用户的交互行为构建用户-项目二分图,通过用

户的高阶连通路径提取用户的相似关系,进一步缓解交互项目稀少的问题。

(2)针对主题无关的文本引入噪声的问题,本文提出一种基于文本相似图的

用户人格画像预测模型(TextSimilarityGraphConvolutionalNetworks,SGCN)。

该模型主要由文本嵌入层和图卷积网络组成。文本嵌入层使用BERT

(BidirectionalEncoderRepresentationsfromTransformers)提取文本特征作为文

本相似图中的文本节点,使用LIWC词典提取文本的心理特征作为文本相似图

中的心理节点。然后通过余弦相似度计算使得心理节点只与相关的文本产生联系。

最后利用GCN更新文本相似图,使得心理节点获取与预测主题相关的文本特征

信息。因此,使用GCN输出的心理节点作为用户向量表示有效缓解主题无关文

本的噪声问题。

(3)本文使用MovieLens-1M影评数据集和京东电商数据集验证本文提出

的用户基础画像预测模型,使用KaggleMBTI数据集验证本文提出的人格画像

预测模型。实验结果表明本文提出的两种用户画像预测模型能够有效地从用户行

为记录中提取用户特征,提高了用户画像预测准确度。

关键词:用户画像,人格特征,深度学习,图卷积网络

ABSTRACT

Thedevelopmentofinternettechnologyandthewidespreaduseofintelligent

applicationshavemadepeoplenotonlyreceiversofinformation,butalsopublishersof

information.Peoplegeneratealargeamountofbehavioraldataduringtheironline

activities,includinguserbasicattributes,interests,preferences,andotherinformation,

layingthe

您可能关注的文档

文档评论(0)

拥有快乐的你 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档