基于分层聚类-XGBoost 对用户特征的研究.pdf

基于分层聚类-XGBoost 对用户特征的研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于分层聚类-XGBoost对用户特征的研究

6.1基于分层聚类法的用户打分高低层次划分

依据上述优化后的采样数据,在考虑对用户打分高低的划分存在诸多不确定性因素,

于是而划分的阈值存在灵敏性,因此本文采用一种基于离差平方和法的聚类算法(系统聚

类),弱化了距离有哪些信誉好的足球投注网站半径的灵敏性,更适用于用户打分高低的划分聚类,提高模型的准

确度。之后,对划分的用户打分高低数据采用因子分析的方法探究其特征属性,分析模型

的合理性和稳健性。

6.1.1模型的建立

[7]

分层聚类的合并算法通过计算两类数据点间的距离,对最为接近的两类数据点进行

错误未找到引用源。

组合,并反复迭代这一过程,直到将所有数据点合成一类,并生成聚类谱系图!。

则有如下步骤:

距离的定义:

(1)样品与样品之间的聚类距离(欧氏距离)为:

p

2

d(x,x)=(x−x)(1)

ijikjk

k=1

xj

其中,为第组样本距离向量;为第组样本距离向量。

xi

ij

(2)指标与指标之间的距离(相关系数)为:

p

(xki−xi)(xkj−xj)

X,X=k=1

(ij)pp(2)

22

(xki−xi)(xkj−xj)

k=1k=1

xj

其中,为第组指标均距离向量;为第组样本指标均距离向量。

ix

ij

错误未找到引用源。

(3)类与类之间的常用距离,采用组内平均连接法连接!

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档