基于遗传算法Web使用挖掘研究.docVIP

下载本文档

0
0
约5.08千字
约 11页
2018-05-28 发布于福建
举报
版权申诉

基于遗传算法Web使用挖掘研究.doc

1、本文档共11页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于遗传算法Web使用挖掘研究

基于遗传算法Web使用挖掘研究　　摘要：针对Web使用挖掘中的信息，提出一种基于遗传算法的关联规则挖掘模型，同时结合实例对有关信息特征进行量化，然后利用实数数组的方法进行编码以及构造适应度函数，挖掘出隐含在用户注册登记信息库中的有关用户规则。为个性化服务系统提供准确和可行的关联规则，并对用户的行为进行了预测和分析。　　关键词：遗传算法；Web使用挖掘；关联规则　　中图分类号：TP311文献标识码：A文章编号：1009-3044(2007)18-31628-03 　　Research on Web Usage Mining Based on Genetic Algorithm 　　GAO Huai-jin,LI Guo-hui 　　(School of Mathematics and Information Science,Weifang University,Shandong 261061,China) 　　Abstract:This paper gives a mining model of association rules based on genetic algorithm in order to mining the information of web usage log, and also quantify relevant information character by an example, code using an array of real numbers, structure a fitness function. Finallycan mining user rules that hide in the user registration information. It provide accurate and viable association rules for personalized service systems, forecast and analyse the users behavior. 　　Key words: GA(genetic algorithm);web usage mining;association rules 　　　　1 引言　　　　Web挖掘的目的就是要从大量的Web网站上的信息中提取对用户有用的信息与知识。为了达到这一目的，可以把Web挖掘看成是有哪些信誉好的足球投注网站问题，将整个Web信息数据库看作一个大有哪些信誉好的足球投注网站空间，而把挖掘算法看成一种有哪些信誉好的足球投注网站策略。显然，当Web信息数据库容量极其巨大时，进行穷举有哪些信誉好的足球投注网站是不可行的，必须采取一种有效的有哪些信誉好的足球投注网站策略。应用遗传算法在Web数据库中进行有哪些信誉好的足球投注网站，对随机产生的一组规则进行进化，直到该Web信息数据库能够被该组规则覆盖，从而挖掘出隐含在Web数据库中的规则，找到用户所需要的信息与知识，为用户提供个性化服务。　　　　2 Web使用挖掘　　　　Web挖掘是数据挖掘在Web上的应用，可以分为Web内容挖掘、Web结构挖掘和Web使用挖掘[1][2]。其中Web使用挖掘的主要目的在于分析用户的行为模式（或称访问习惯），发现用户访问Web页面的模式规律，为智能Web服务提供知识依据，因此需要分析描述Web用户访问行为特征的关联规则。关联规则是描述Web??户行为特征的重要依据，是用户行为特征的知识表示，Web关联规则是通过分析用户访问的Web页面(URL)之间的关联关系得来的，具体应用在Web使用挖掘中有其特殊的表现形式，事实上，Web关联规则(Web Association Rules，下简称WAR)是一种知识的表现形式。与一阶逻辑的产生式大体相同，而WAR是考察用户的客观访问规律所获取的知识，用户对Web站点的访问过程是与URL访问序列、访问时间有关系，如果在挖掘WAR时忽略这种关系，那么挖掘出的关联规则就仅仅是URL之间的一种关联关系，而割裂用户的实际访问规律，因此，将通常意义上的关联规则挖掘与序列模式挖掘相结合，考察关联规则的条件与结论及其内部项的时序关系，挖掘有效的WAR，将为基于Web使用挖掘的个性化服务系统提供准确、可行的关联规则。　　　　3 基于遗传算法的Web使用挖掘模型　　　　Web使用挖掘中的信息除了服务器的日志记录外，还包括代理服务器日志、浏览器端日志、注册信息、用户会话信息、交易信息、Cookie中的信息、用户查询、鼠标点击流等一切用户与站点之间可能的交互记录。可见Web使用挖掘的数据量是非常巨大的，而且数据类型也相当丰富。通过处理服务器日志文件等这些数据，结合站点的拓扑结构信息，可以发现用户的浏览模式，如用户聚类、关联规则、序列模式等，理解用户的行为，进而实现预测用户