使用DFA的Web会话构造方法.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用DFA的Web会话构造方法.pdf

1 引言 随着 Internet 技术的迅猛发展, Web 给人们提供了大量信 息,这些信息为数据挖掘提供了丰富的数据来源,因而 Web 挖 掘也日益成为数据挖掘中一个热点研究方向。 Web 挖掘分为三类: Web 内容挖掘、 Web 结构挖掘、 Web 使用挖掘。其中Web 使用挖掘主要是针对用户的访问日志,使 用关联规则挖掘算法,挖掘用户的访问模式,可以为用户提 供个性化服务[1] ,也可以为网站结构的优化和重构提供依据[2] 。 Web 使用挖掘首要的工作就是对 Web 日志进行预处理,预处 理过程包括数据清洗、 用户识别、 会话识别、 事务识别[3] 。对日 志预处理工作做得好坏,将直接影响到关联规则进行模式发 现的效果,因而,近年来, Web 使用挖掘中数据预处理得到了 广泛的关注。本文主要是将自动机理论运用于预处理中的会 话识别,对于一段日志,通过自动机各个状态的转换,完成会 话识别。 2 相关研究工作 目前,会话识别主要有两种启发式方式:基于时间的启发 方式(Time-oriented heuristics)和基于引用的启发方式(Navi- gation-oriented heuristic) [4] 。 2.1 基于时间的启发方式 有两种类型的时间启发方式: (1)一次会话的总时间不超过一个时间阈值 δ[5-6] (通常 δ= 30 min) 。 对于一系列属于同一用户的页面请求P1, P2, …, Pk, Pk+1, 令 ti 为每个页面 Pi 的请求时间,如果 P1, P2, …, Pk 已经构成一 个会话,那么Pk+1 能加入该会话必须满足的条件是 tk+1-t1≤δ,否 则 Pk+1 作为新会话的起始页面。 (2)在一个会话中每个页面的驻留时间不超过一个时间阈 值δ[5-6]

文档评论(0)

sunny + 关注
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档