Weblog会话动态聚类分析.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 1O卷 第32期 2010年 11月 科 学 技 术 与 工 程 VoL10 No.32 NOV.2010 1671— 1815(2010)32—8077—04 ScienceTechnologyandEn~neefing @ 2010 Sci.Tech.Engng. Weblog会话动态聚类分析 谢维奇 , 吴四光 (驻马店职业技术学院信息工程系 ,驻马店 463000;山东大学数学与系统科学学院 ,济南 250100) 摘 要 Web使用挖掘分析访问者 日志,可以发现很多潜在的规律。利用会话之间的依赖关系,给出会话的依赖特征和数值 度量,利用会话的动态特性给出会话动态聚类分析的算法和应用,并和模糊聚类算法方法进行比较研究。 关键词 Web使用挖掘 web日志 会话 依赖度 聚类分析 应用 中图法分类号 TP391; 文献标志码 A Web使用挖掘中,日志记录了访 问者的所有 记S={sli=1,…,n}是会话 .s构成的集合。 信息,通过对 日志的分析,可以发现很多内在的规 定义3 称S×S是 s生成的笛卡尔积,而且 律,比如 :访 问者偏好,聚类,访 问规则等 [1I2]。这 S×S= {(S,sj)J,J=1,2,…,凡} (1) 些规律可以帮助我们改善网络的结构。如果把一 定义4 若 SxS,称 是 s生成的会话 位访问者在一定时间段 内的访 问称为一次会话 关系。 (session),不同人在不同时刻,甚至同一个人在不 定义 5 称P是会话 .s对 sj的依赖度 ,而且 同时刻的会话是不相 同的,会话具有动态特征 。 P =card(SnSt)/card(S) (2) 另外,由于网站不断更新 ,页面集合不断变化和更 这里 :card=Cardinalnumber,0≤p ≤1,P = 新,传统 的研究方法在动态数据面前显的力不 1,Pq不一定等于 。 从心。 定义6 称会话s依赖 s,如果 研究会话之间的依赖关系,给出会话依赖关系 P =A (3) 的度量特征,给出基于会话依赖关系的动态聚类算 这里 :0≤A≤1。 法和应用,经检验动态聚类算法比模糊聚类算法更 特别是: 加便捷和准确。已有的文献中未发现对动态聚类 如果P=0,称会话 不依赖 st。 算法进行过讨论。 如果P=1,称会话S半完全依赖 f。 如果p= =l,称会话Js完全依赖st。 1 会话依赖关系 定义7 若S,s(i,j=1,2,…,n)是会话,R是 Js生成的会话关系,称矩阵R是会话的依赖矩阵, 定义1 若P是网站的一个页面,称集合 P= 而且 {P,P,…,P}是网站页面的集合。 … 定义2 访 问者在一定时间内访 问的页面集

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档