- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web日志挖掘预处理中的用户识别技术
29N9.4 计算机科学2002V01 Web日志挖掘预处理中的用户识别技术 UserIdentificationinthe ofWeb PreprocessmgLogMining 吴.强.梁继民杨万海TP研 A (西安电子科技大学电子工程学院 西安710071) 1 AbstractThetasksoftheWeb are andafunctionalmodelofittSpresented-A LogMiningpreprocessinganalyzed useridentificationmethodbased011 and Web attributesis Themethodcan cookie technologyextendingLog proposed causedthe the users thesaF/leone serverandovertakethedffficuhies distinguisheffectivelymultipleusing proxy by erasionolcookiesstoredontheuser’sfile system Web identilication.Cookie KeywordsLogMining.Preprocessing,User 本文对Web日志挖掘预处理所要完成的任哥进行丁分 1引言 析,提出r一个Web日志预处理功能模型;分析了现有Web 互联网技术和应用的迅速发展使得可以从因特嗍获取的 口志预处理方法中的用户识别技术.提出厂一种基于cc,okie 信息量口益剧增,因此迫切需要一种新的技术从这些信息中 技术和扩充日志属性的用户识别方法,这种方法不仅可以有 快速、及时地发现有用的知识.提高信息的利用率。作为数掘 效地识别通过同一代理服务器访问的不同用户.而且较好地 挖掘技术。11研究的一个重要领域.Web日志挖掘(WebLog 解决了由用户删除本机cookit而产生的同一用户多次被标示 Mining)是从服务器日志文件内大量的用户访问记录中抽取的问题。 有用信息的过程.通过对Weh日志的分析.可以构造出用户 2 Web日志挖掘预处理 的行为模式.对于分析改进网络性能、优化网站的设计和拓扑 结构以及改善企业的市场营销决策等会有极大的帮助o。”。 一般的Web日志文件中记录的是每个访问用户的信息. 当前web日志挖掘领域的研究已取得了很大的进展.但 不同服务器的Web日志记录是不同的.但其中都包含有访问 是目前的研究重点大都集中于挖掘算法的设计、分析和改进. 用户的基本信息. 对日志文件预处理方法的研究相对较少,然而正确有效地对 Web日志文件进行预处理.不仅有利于随后的挖掘算法分 录.其中包括:访问日期、时问、用户lP地址、片j户名、服寻器 析.而且对于最终形成准确可靠的用户行为模式也是极为重 IP地址、方法、所请求URL资源、服务器响应状态、用户代 要的. 理、发送字节数等。
文档评论(0)